分享

向部首制度发出挑战!在他之前,没人提出过这样“新鲜”的方法

 豆豆samuel 2023-11-22 发布于湖北

汉字作为非字母语系在近现代以来的发展遭遇了字母文字中心主义的重重阻碍,因为在技术语言现代化的发展过程中,中文很难适应西式打字机。一些人认识到,必须找到办法让汉语得以进入现代技术环境。

然而,如果他们想保留过去的传统不予丢弃,就必须想办法重新组织汉语以供系统性使用。要使汉字和字母一样好用,等于把两个距离遥远的世界聚到一个书架上。

尝试改变的人中有几个早早地认识到,中国与世界和平共处的关键也许就在于小小的笔画。为汉语创立成功的归档系统,一位年轻的英文教师无意间成了领头人。

文丨[美]石静远 哈佛大学东亚语言与文明系博士 耶鲁大学东亚语言与文学系教授
译丨林华 联合国高级翻译
编辑丨崔赫翾 瞭望智库

本文为瞭望智库书摘,摘编自《汉字王国:让中国走向现代的语言革命》(中信出版集团2023年8月出版),原标题为《林语堂与中文检索的创新》,原文有删减,不代表瞭望智库观点。

1

向数千年的部首制度

发出挑战




1917年,23岁的林语堂在《新青年》杂志上发表了自己的第一篇作品。与各种激烈批评传统文化的文章相比,林语堂的文章没有那么慷慨激昂。他选择了一个看似无害无趣,更适于图书馆工作者思考的题目——《汉字索引制说明》。这篇7页长的文章没有提出什么振聋发聩、令反叛青年趋之若鹜的主张,但它后来做到了杂志中任何其他文章都做不到的事:它不可逆转地改变了新旧知识的景观。

林语堂的提议乍看似乎简单,但其实可以算是一份组织汉字的完整指南。他把汉字分解成笔画,确定了5类笔画:横、直、撇、点、钩。这里隐约可见传统上教授书法时使用的永字八法的痕迹。可是林语堂给他的5类笔画界定的范围要宽得多,他注意的是笔画的方向,不是笔画的样式。例如,一横不仅包括明显的一道横线,如汉字的“一”,而且包括任何从左到右以类似的动作写出的笔画,不一定是平的。

图片

林语堂的5个基本笔画。

数千年的书法练习使得笔画和笔顺根深蒂固,发展出了一套先写哪笔,后写哪笔,直至完成全字的固定规则。在英文书写中,可以想象写字母“A”时先写中间的小横,但常规写法是先写左边的斜线,后写右边的斜线,最后写连接这两条斜线的小横线。同样,写字母“X”的时候先写哪一笔都可以,结果毫无差别。

图片“殷墟甲骨”专题展上的“甲骨2174”,左上为甲骨文“兔”。

但是,手写汉字时,笔画和笔顺严格得多。林语堂用一个字的首笔画作为第一分类依据,却发现分得不够细。于是他在那5个基本笔画的基础上加以扩大,确定了19个首笔画,囊括了所有汉字书写的第一笔。

接下来林语堂把第一笔和第二笔放在一起,找出了28个头两笔的格式,几乎适用于所有汉字。这如同先分出所有以一条竖线开始的字母:“B”“D”“F”“H”“K”“L”“M”“N”“P”“R”。

然后加上第二条规定:第一笔竖线后必须是曲线,这样前述那些字母就剩下了“B”“D”“P”“R”。用确定的一套头两笔组合来辨识汉字,如此产生的组织格式与字母的逻辑不相上下。

林语堂这个简单明了的办法向数千年来研究、学习和规范汉字的传统提出了挑战。他显示了汉字如何可以按照其自身组织来分类,而不必依赖其他外在的原理,无论是西方字母还是代码。在字典中分类查找汉字从来都是靠部首。在林语堂之前,没有一个中国人提出过他这样完整的替代部首制度的方法。

图片林语堂在5个基本笔画的基础上确定的19个“首笔画”。

2

汉字的进步

无需任何外援




传统上,分类所依靠的原理因多年的习惯和文化实践积淀而成,而非来自抽象的语言理论。语文学和词典学是中国经典学问的核心,文字本身也是研究的对象。许多个世纪以来,学者们努力通过证实某个字的意思来保存古人的智慧,这是训诂学这门备受尊敬的学问的关键。印刷术发明之前,此事的难度超乎想象。即使手抄本的字体依照规范,仍旧有许多笔画差那么一点。一横写成一撇能引得以后好几代学者对这到底是什么字争吵不休。

图片2020年12月4日,参观者在辽宁省博物馆观看唐宋八大家主题有关的书画、碑帖拓片、古籍等展品。

管理汉字的全部词汇枯燥无味,吃力不讨好。把字词整理记录成词汇表是对汉语知识基础的重要支撑。这项工作是对汉语词汇的必要维护保养,需要怀着负责任的精神耐心地、不厌其烦地反复比较对照,细致入微地分门别类。所有这些一丝不苟的工作都遵循着一条基本规则。两千年来,作为汉字一部分的部首一直是分类的唯一标准。最早的汉语书写出现后大约1100年到1500年,部首得到了确定,当时用于管理内务。那时汉字的数量已经相当可观。

第一个汇编部首的人名叫许慎,是东汉时期的大儒和经学家。因为之前无人对汉字做过总结或研究过汉字的用法,所以许慎确定了540个部首来厘清混乱无序的9353个汉字。他深信,必也正名乃天下至道。这个信念深刻影响了他的组织准则。据说540这个神奇的数字来自代表“阴”“阳”的6和9相乘之积,再乘以10,它留出了足够的类别数目。他的制度从部首“一”开始,象征着万物之源,到代表时光循环的12个部首结束,形成了制度在概念上的完整性。

简而言之,部首是神圣的,上千年来一直得到尊重和遵守。不过,时常有人发问:为何要有如此多的部首?到底多少部首最为合适?对此众说纷纭。10世纪,一位僧人把部首数目从540减到了242,近500年后,一对父子选择了444这个数字。最后的214个部首是明朝时确定的,由太学生梅膺祚整理编入了自己编纂的《字汇》之中。到18世纪,爱书如痴的康熙皇帝采纳了214个部首的制度,命人编纂一部以他命名的权威性字典,由此确立了214个部首的权威地位。

到20世纪早期,部首制度开始现出裂痕。几个世纪以来,人们一直在修改、补充、调整部首制度,以维持它的可行性,但这个制度学习和使用起来仍然费时费力。没有易于掌握、有章可循的规则来储字检字,也没有合理的办法来管理浩如烟海的字轴和书籍中用汉字记载的大量故事、歌谣和王朝历史。

在1917年刊登在《新青年》上的文章中,林语堂把汉字和汉语信息管理视为同一个问题。若能轻易地在字典里找到一个字,同样可以很快找到一本书书名中的第一个字。所以,解决前一个问题的办法一定能够解决后一个问题,而办法从来就摆在那里,那就是汉字的结构。林语堂表示,汉字完全可以应付现代的挑战。

它的进步无需任何外援,不用罗马字母,不用数字,也不用代码。汉语不需要其他表现方法,它自己特有的笔画和笔顺就足够了。

3

西式教育视角下

看待汉字




林语堂的主张立即引起了共鸣。在中国深陷疑惑与焦虑之时,他的主张给人们带来了希望、慰藉,甚至信心。新文化运动的一位领袖钱玄同看到,林语堂的思想远超同时代的人,对这位年轻的索引编制者赞不绝口。一时间称誉四起。德高望重的教育改革家蔡元培指出,林语堂不仅重新构想了笔画的功能,而且他的办法详细展示了笔画如何引领并构成一个字的全部轮廓。林语堂发现的汉语表意文字的逻辑足以媲美西方字母的组织能力,却一个拉丁字母都不用,这是何等的巧思啊。

从康奈尔大学留学归来的庚款留学生胡适的看法最深刻。他看到,林语堂研究的是使中国的往昔得以延续到未来的基础结构。林语堂的成就是认识到汉字有自我组织的能力,能够用来在中国浩大而丰富的知识基础内存储、搜寻、分类、选择并查找想要的信息。这个能力可以扩展到各种排序系统,甚至是其他语言的排序系统。也可以借此能力恢复中华知识宝库的文化力量。胡适说,林语堂的索引制是打开其他门的那扇门,是被批评传统的人忽略了的奠基工作:

“整理”是要从乱七八糟里面找出一个条理头绪来;从昏乱糊涂里面查出一个明确意义来……最没有趣味,却又是一切趣味的钥匙;最粗陋讨人厌,却又是一切高深学问的门径阶级……这样的努力中最困难又最不可缺少的是汉字的重组……即汉字的分类与组织。

现代压力逼迫中国与传统决裂,全中国如履薄冰。值此危难之际,众多革命者奋起行动,为事业抛头颅洒热血。林语堂与他们不同。他对重建中国的贡献是帮助拯救中国的传统与遗产,使之不致湮没。不过,林语堂不认为自己当得起如此赞誉。

林语堂出生于中国南方福建省一个山村的基督徒家庭,从小到大学的是赞美诗、英语和晚祷词,杂以儒家经典节选和汉语课。他父亲是当地的一位牧师。林语堂十几岁时就在父亲那座与一所佛寺隔街相望的教堂里负责敲钟。他没有上过传统的中国学堂,也不像那时的其他孩子一样苦读过四书五经。

20世纪第二个十年中期,林语堂上大学时,同学们开始热衷于西式新文化运动,但林语堂是在西方文化里泡大的,所以他不像其他同学那样怀着反叛的激情拥抱西方文化。他思维活跃、好奇心强,秉性天马行空、随心所欲,对意识形态标签或热情洋溢的口号敬而远之。林语堂非常享受阅读和英语学习,到哪里都随身带着一本小小的英语词典。

1916年,林语堂从上海圣约翰大学毕业,接受了清华大学的聘书,成为英文教师。为了维持生活,他还兼职担任商务印书馆的研究员,来到文化古都北京生活后,他意识到自己缺了点东西:他对中国文化和传统一知半解。林语堂清楚地看到,可以用汉字来检索各种知识储存,但是他觉得自己对那些知识了解不足。与大学同事们交谈时,他听不懂他们的引经据典,也不像他们能对中国传统民间故事信手拈来。林语堂对耶利哥的城墙在约书亚的军队吹喇叭吹了六天后轰然倒塌的圣经故事熟稔于心,但对传说中因丈夫死于为皇帝修长城的苦役而哭倒了长城的孟姜女的故事茫然不知。林语堂因对本国文化的无知而羞愧。后来他说,就连洗衣工对中国传统的英雄和传说都比他知道得多。

林语堂开始如饥似渴地读书补课,不仅读孟姜女的故事,也读《红楼梦》这样的古典小说。他学会了小说中使用的北京白话,勤奋地记住地方俗语。他经常光顾古玩市场去寻找旧书。他的同事们深受1915年开始的新文化运动的影响,把任何古典的东西都视为毒药,想把传统一扫而空,林语堂却刚刚发现中国五千年文字传统的宝藏。他对自己的基督教信仰生出了怀疑。

正因为林语堂受西式教育长大,对中国文化接触较晚,所以他能够以一种新鲜的角度看待汉字。几个世纪以来,外国人一直试图根据自己印欧语言的规则破解汉语之谜。林语堂从他们的挫败中吸取对自己有用的东西。他仔细研究西方人为学习汉语而编纂的词典,借以重构西方人对汉语的认识。他也研究了西方人是如何按照他们的字母分类法来组织汉语的。经过这样的比较,林语堂逐渐发展出了自己的想法。汉字为什么不能有字母那样的功能?林语堂的汉字索引并未完全解开这个谜题,那只是他的初次尝试。

4

打字机发明初尝试




1915年前后,中国大学里兴起了关于现代文化复兴向何处去的辩论。林语堂的同侪鼓吹振兴白话文,采用现代印刷排版法,把古典文言文束之高阁、埋进档案深处。辩论持续了4年,愈演愈烈,直到在“五四运动”的洪流中与学生运动的事业合为一体。然而,对于用白话文,甚至可能是罗马化文字来取代精英古典文言文的争论,林语堂的心情是矛盾的。他对当时许多人发出的放弃汉字、实现汉语罗马化的呼声不以为然,对他们砸烂传统的激进要求无法苟同。

1919年8月,他登上了开往美国的轮船去哈佛大学读书,后来又到德国继续深造,在莱比锡大学获得了比较语文学博士学位。约30年的时间里,林语堂写了《生活的艺术》《吾国与吾民》《京华烟云》和《风声鹤唳》等畅销书,作为中国的声音吸引着美国读者的兴趣。林语堂也在继续为汉字索引出力,不过走了另一条路。

林语堂想做成更大的事。文名鹊起的他找到了自己真正倾心的事业——他想造打字机。

1947年,林语堂在《新青年》初试啼声的30年后,夏初一个雨声潺潺的下午,匆匆走出他在曼哈顿东河边格雷西广场7号楼的公寓。他手臂下夹着一个木头盒子,用厚蜡纸包得严严实实。那是他刚做好的打字机的原型机。林语堂给打字机取名“明快”,是既清楚又快速的意思。如他在写给一位朋友的信中所说,他刚刚把他的宝贝接回家。

这部14英寸×18英寸的机器是第一部中国人和西方人都能用的中文打字机,因为林语堂为它设计了一个特别的键盘,哪怕目不识丁之人都能使用。找字所需的所有信息都包括在键盘的72个键里,那些键标的不是字母,而是汉字偏旁。键盘不比标准的“QWERTY”键盘更大,除了键上的中文标志,它看起来与普通的西方打字机没有分别。

林语堂兴奋得像个孩子。他花了几十年的心血,就是为了发明一个能够用最简单、最直接的方法打出9万个汉字的中文键盘。至于如何界定偏旁,以及在键盘的有限空间内放入哪些偏旁,林语堂在《新青年》杂志上发表的第一篇关于汉字索引制的文章中阐述的原则提供了解答。

在林语堂看来,笔画是汉字的骨架,包含着汉字构成逻辑的秘密。他利用中国书法长期形成的笔画和笔顺的习惯,根据笔画和笔顺重新设计了一套完整的检索系统。原来的首笔画到次笔画现在被定为一个字的“上偏旁”,因为任何字起笔总是在左上角。另外28种不同的笔画组合被定为“下偏旁”,即一个字右下角的最后几个笔画。

从20世纪20年代到40年代,许多试图编制汉字索引的人都努力寻找更加客观、普遍的汉字偏旁,但只有林语堂找到了逻辑上必要的一致性。他提出的方法简洁明了、易懂易用。并非所有人都同意一个字的四角是什么,但谁都能看到什么在上方,什么在下方。林语堂不纠缠线、点、面,或一个字的四个角,也没有单纯依靠对汉字形位的统计学分析,而是把这三者结合为一套清楚明确的检索系统。林语堂的机器不需要在机器顶上另贴一张查字单,也不需要好几个单独的字盘来按照使用频率或次序装字模。一切选择和检取的机制都纳入了键盘的设计。

5

“赠给中国人民的礼物”

一波三折




1946年4月,林语堂向美国专利局递交了专利申请,并开始寻找愿意开发他的机器用于销售的美国公司。这是他一生的梦想,甚于成为全世界最著名的中国作家。林语堂用英文写作了几十本书,不止一次获得诺贝尔奖提名,是中国著名的知识分子和讽刺文学作者。但是,对他来说,什么都比不上那天他臂下夹的那个包裹珍贵。雷明顿打字机公司想看原型机,林语堂要在女儿林太乙的帮助下做一场演示。

他们走进一个会议室,一小群雷明顿公司的高级主管正等在那里。林语堂先泛泛地介绍了一下汉语,他指出,尽管世界上三分之一的人口在各种不同背景下使用汉字,但易于操作的中文打字机却仍付阙如。他的机器能够解决这个问题。

键盘的上面三排标志着36个上部笔画,下面两排包括28个下部笔画。操作机器时,打字者扫视键盘,找到组成想要的那个字的上部和下部笔画的键,将两个键同时按下。此刻,机器内部的打字滚筒按照按下的两个键的指示找到与选择的笔画相配的5到8个可能的笔画组合,也就是汉字。这些字显示在机器顶部一个叫作“魔眼”的显示窗中,打字者可以从显示的字中选正确的那个。选好之后,按下键盘最下面的一排(就是英文打字机空格键的位置)8个键中的一个。那8个键每一个都对应显示窗里显示的一个字。打字者按下标着正确数字的键,就可以释放字槌,在纸上打印出想要的字。

然而,接下来发生的事令林语堂大为尴尬:女儿按下打字机的键时,机器却因故障没有反应。故障很容易就排除了,但林语堂失去了与雷明顿打字机公司合作的机会。

他发现,发明机器容易,将其商业化却很难。为出售他的原型机以投入大批量生产,林语堂四处奔走,那天下午的演示是第一次。他动用了自己作为作家积累的全部关系网。各家报纸争相把他的发明作为头条新闻报道。林语堂那些有影响力的朋友发来祝贺,贺电和鲜花堆满了他的房子。中国学生、商人和居住在纽约市内及周边的华人蜂拥而至,来瞻仰这位大名鼎鼎的作家和发明家。革命性的中文打字机终于问世,供世人参观和使用。

雷明顿打字机公司谢绝后,默根特勒莱诺铸排机公司(Mergenthaler Linotype)考虑过这部原型机。由于中国正陷于战争,所以默根特勒和其他大公司一样,担心生产和销售的条件都过于不确定。谁也不想冒亏损的风险,因为制造林语堂的机器需要大笔投资。各个零件,尤其是键盘和字模,必须专门制造。

与此同时,人们不知道林语堂其实已接近破产边缘。这项发明用尽了他写的几部畅销书的全部版税。因为借贷不成,林语堂和他的出版商理查德·沃尔什(Richard Walsh)及作家赛珍珠(Pearl Buck)的友谊几乎被葬送。林语堂其实不必花费那么多时间和金钱来制造整架机器,因为真正重要的只有键盘。可是,他想看到自己心中这个长久的念头变成一个独立的实物。他称之为“赠给中国人民的礼物”。

6

林语堂的键盘和汉语计算机化




林语堂的打字机变得非常重要,事态发展却并非如他预想。1948年,默根特勒莱诺铸排机公司表示愿意与他订立合同,由公司就制造打字机之事开展初步研究,合同为期两年,每月付给他5000美元。林语堂接受了,从此不再与他的机器有任何关系。然而,当时冷战已经开始,美国和苏联正争相在密码学和机器翻译方面取得进展,而机器自动翻译人类语言是人工智能研究的最初领域之一。两个超级大国都清楚地看到,谁控制了计算机,谁就能控制信息的未来。

默根特勒莱诺铸排机公司从林语堂手中买下专利权后,美国空军为了研究机器翻译和便于迅速获得大量信息的存储软盘,拿到了打字机的键盘,汉语被定为优先研究的语言之一。美国空军把林语堂的键盘交给了一位名叫吉尔伯特·W.金(Gilbert W. King)的工程师。后来,金跳槽到了马萨诸塞州一家防务承包公司“Itek”,在那里和别人合写了一篇关于机器翻译的重要论文。金还推出了他们通过研究林语堂的键盘建成的一部机器“Sinowriter”,这部机器可以把汉字写成的东西转变为能输入机器的代码,然后把中文处理成英文。

林语堂的键盘提供了关键的证据,证明汉语可以使用一种原貌式系统来进行存储和视觉检索。他把字母的逻辑用于汉字,借以对汉字进行重组,使之为即将到来的数字时代做好准备,而那时离中国获得第一台计算机还有近40年的时间。利用汉语特征实现汉字计算机化是汉字索引竞争的永久遗产。当时没人知道,汉字的现代化程度已经远超他们的希望。

自林语堂提出专利申请到1952年专利得到批准的几年间,中国经历了它在20世纪的最后一次巨大政治变革。新中国领导人在革命胜利的鼓舞下,宣布要继续推进未竟全功的汉语改革。此后,中国语言学的发展被置于国家强大力量的指导下。中央人民政府以人民的名义誓言履行扫盲承诺。在毛泽东的领导下,语言改革创造了重要的遗产,给现代汉字留下了不可磨灭的印记。

库叔福利

库叔的赠书活动一直都在!中信出版集团为库叔提供2本《汉字王国:让中国走向现代的语言革命》赠予热心读者。一场全球化技术变革险些让汉语被世界抛弃,是那些冒着死刑风险重新发明汉语的流亡者,倡导将普通话作为国语的大胆革新者,还有在牢房的茶杯盖上设计汉字输入码的电脑工程师,让汉语为全球贸易和数字技术的现代世界所使用,让今天的中国成为世界的主导力量之一。请大家在文章下评论,点赞最高的前2名(数量超过30)将得到赠书。

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多