分享

能在屏幕上看到汉字,我们都得感谢林语堂 | 格外有用

 诺南 2018-04-05


专栏:格外有用(beyond weird)


这是理想国编辑室“知新馆”的专栏。我们不断遇到一些知识、信息,迫切想和你分享。它们很有用,能帮你开阔你思路,更加自如地应对现代生活,甚至方便你养生致富;它们似乎又有些超出常理,听起来有点怪(举一个例子:躺平健身的可行性),但绝对不是瞎掰,背后都有科学依据。希望这个专栏既让给你惊喜,又让你满意。


by LOBBY


90年代末刚开始学计算机的时候,老师每次课上都会叫我和其他小伙伴花很多时间练习在键盘上敲出拉丁字母,并一再强调只有掌握这些字母在键盘上的位置,我们才能学好输入汉字。那时感到绝望之余,我有另一个想法:要是键盘上那些字母都是汉字、按下一个键直接能打出我要的字来,打字速度达到每分钟600字应该不是梦。


放出这个大话不多久,喜欢挑刺的同学找过来提醒我这个想法有多naive:把几千个汉字都摆到一个键盘上,先不说排不排得下,随便叫你找出一个字都得费半天劲,1分钟能打出60个字算你赢。


提到“中文打字机”,20世纪的西方人想到的大概也是这样一种景象,数量庞大的汉字构成了一个迷宫,它会让“站”在打字设备上的打字员晕头转向,这样的打字机不具备它应有的便捷和效率,“中文打字机”根本是一个自相矛盾的词汇。




1901年 《圣路易斯环球-民主党报》上一幅讽刺中文打字机的漫画


后来的事实证明这种想法只是偏见,即使我们没能有幸接触过真正的中文打字机,因为计算机上的中文输入法和打字机面临的关键问题是一致的:检字,也就是在成千上万个汉字中找到我们想要打出来的那个汉字。


检字问题如果在中文打字机上无法解决,同样会导致我们无法在计算机里输入中文。


凭借后来者的智慧,现在我们知道中文输入法给每个汉字匹配了各自的“检索符号”——笔画或者拼音(早些时候手机上的中文输入法还将笔画数作为一个筛选器)。当我们输入相应的笔画或拼音,检字范围瞬间就从上万个汉字缩小到了几十个甚至几个汉字。



这剩下的几个或几十个备选汉字的排列顺序也暗含深意。


输入法内置的词频统计会记录同样情况下大部分用户选择的字,再结合输入者本人使用习惯给这些备选汉字排序,越常用的越靠前,方便大多数时候你能很快找到要的字。


这就是所谓的输入法编辑器(input method editor,IME)。有了IME我们就不需要在键盘上摆上所有的汉字,从左到右、从上到下一个个确认:这是不是我想要的汉字?不是。好,下一个。这是不是我想要的汉字?不是。好,下一个……


使用拉丁字母的人习惯了键盘上字母的“所键即所得”,这样一套系统对于他们来说是不必要的。20世纪英文打字机进入中国后,尝试将英文打字机改造成中文打字机的中国人也感到绝望,他们也受困于“所键即所得”的输入设计思路,甚至产生“汉字和它所承载的中华文明将在新的技术时代遭到淘汰”的挫败感。


回到2016年7月4日,在美国著名的众筹网站Kickstarter上,一位西方人发起了一次名为“救救中文打字机”(save the chinese typewriter)的众筹,他希望能把自己搜集的一批中文打字机安全送到全球各地(欧美的几个城市为主,亦包括中国香港)的博物馆,以开办专门的中文打字机展览,以供普通人和研究者学习这些设备背后倾注的设计思路和非凡工艺。


发起众筹时墨磊宁计划展出藏品的10个城市


这位馆长、收藏家和众筹发起人墨磊宁(Thomas S. Mullaney)是斯坦福大学历史系的教授,专攻东亚史和科技史。他的这次计划不仅出于个人对打字机和东亚文字、文化的热爱,更是因为他意识到使用拉丁字母的欧美人对既有技术的熟悉限制了他们的想象,以至于认为中文打字机只能沿着拉丁字母打字机的路子,在键盘上摆上所有的汉字。


与之配套的是他的一项研究成果,为中文打字机专门撰写的历史,《中文打字机:一部历史》(The Chinese Typewriter: A History,The MIT Press, 2017)。这本书涵盖了丰富的史料细节和感人的故事,我不打算全部剧透,但有一些内容值得在这里略微提及。


由林语堂设计的“明快打字机”最接近如今我们使用的中文输入法。


林语堂的明快打字机


这台打字机于1940年代发布,它完全刷新了当时人们对打字机的认知,因为当你在明快打字机键盘最上排区域(“首钮”)敲下一个键,并没有字会出现在纸上。


你需要再于中间区域(“末钮”)敲下第二个键,内部的齿轮会在两次按下键的同时带动滚筒帮你筛选出8个汉字,你得通过取景器(“魔眼”)观察这8个汉字,确定你要的汉字,再于最下方一排数字按键区键入对应的序号,字模才会在纸上敲击出汉字——与现今的中文输入法如出一辙。


墨磊宁认为,正是这台打字机启发了后来计算机采用的IME。


明快打字机采用的键盘方案,从图中我们可以看到,它更接近于我们今天的五笔/笔画输入法。


更加流行的“舒式中文打字机”要早于林语堂的设备,它抛弃了键盘的想法,直接将字模放在检字盘上(这也是林语堂之前中文打字机普遍采取的办法)。


这些字模是“可拆卸”的,可以根据使用者的习惯调整字模的位置,也可以调整具体把哪些字放进字盘(也就是“字库”)里,这样可以减轻检字的负担。


舒式华文打字机的外型


因为当时采用打字机的多是银行、政府机关和学校等,舒式打字机的字库呈现出较高的“定制化”或“个性化”,我们可以根据字盘上摆的常用字来推知使用者的职业。另外值得一提的是,这种打字机的制造商是我们如今最熟知的出版社,商务印书馆。


要在汉字里找到和字母等价的要素以重新组成汉字,很多人想到的就是笔画。将笔画依次打印在纸上,我们得到了一种新的汉字美学:





在普通的“滚筒检字”(字模固定在一个滚筒上)之外,这套输入方案的设计者,祁暄,将这种“笔画打字”作为一个“扩展包”,来打出字库(含有4200个常用汉字)中没有包含的、相对不常用的汉字。


图中的“宙”、“宫”尽管笔画简单,但已无法避免“走形”的命运了,可想而知复杂的汉字会得到怎样的对待。


如果说张大春在《认得几个字》里对汉字的解读融入了美学和文化教养,墨磊宁在追溯不同打字机的历史时则提供了一种完全不同的角度,它产生于汉字和信息技术结合过程中会遇到的一些更加外部的、实际问题:汉字是否真的在处理信息效率上不如拉丁字母?表意文字在字库中最有效的组织方式是什么?一种信息处理技术要做到何种本地化程度才算真的普适?


它有点像我们今天谈论的微博140字之于推特的140字的优劣,以及思考这种不同给两种产品带来的不同命运。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多