分享

老友记| 中国第一位'程序员':我在东汉玩'编码'

 漫步月球路 2016-10-06

我在东汉
玩“编码”
为了热爱的文明,穷尽一生编一部“程序”,亦足矣。

这个  程序员 
来自中文系。


  今天,我们讲一位“程序员”许先生的故事。

  许先生,名慎,字叔重,性别男,爱好不详。生于东汉,汝南郡召陵县人。没学过Java也不懂C ,精通古文经学和今文经学,做过太尉南阁祭酒,参加过国家图书整理工作。由于做学问厉害到没朋友,学界人称“五经无双”。

  计算机系的于是不服了:你一个中文系的,和程序员扯的是哪辈子亲戚关系?

  故事还得慢慢讲。

  许先生的名字里,既有“慎”又有“重”,不过他对传统文化却有一颗相当火热躁动的心。他觉得自己那个时代,学术风气不正,群众对古文字有误解和偏见。一些砖家学者,凭着主观臆断争抢着“说字解经”,曲解文字的历史和意义。许先生实在不能忍,喷这些“俗儒鄙夫”“未尝睹字例之条”——不懂汉字造字之初的原理和方法,就敢穿凿附会、乱讲一气。

  许先生于是想,老夫要自己搞一套东西,把汉字都收进来,归归类、排排序,剖析剖析每个字的正确含义,纠正时下人们对汉字的错误用法。

  讲真,不就是编一部字典么?

  对,编字典。不过这个字典前头得加一个牛气哄哄的定语:中国第一部。

  说干就干,然而我们的古人立即遇到了一个现在看来根本不是问题,但在1900年前是个大问题的问题:

  密密麻麻上万个方块字啊,该怎么分类排序?

  按照字音?字义?笔画数?不行,都不够perfect。

  我们许先生“五经无双”这个头衔可不是盖的,他在酝酿一个大招。

  他要创制一种方法——通过识别每个汉字的身高体重血型星座DNA,对它们进行分类、排序、标签。

  或者说,就是给汉字写一套编码程序。


都是 套路 


  大约在公元100年,这是中国乃至世界文字学史需要铭记的一年。这一年,许先生大功告成,中国第一部字典《说文解字》初稿诞生,前后用了10多年。之后增补修订,直到公元121年,终于慎重定稿。


  全书收录9353个小篆字,异体字1163个,说解共用133441字。多少个字不是重点,重点是许先生创制了一个伟大概念:部首。

  没错,就是中国人都知道的汉字部首。其实,秦代在搞“书同文”的时候,已经基本确定了汉字的偏旁;许先生的创新,是把这些偏旁根据意义划分成540个部首,再根据每个字的形状和意义,把它们归入这540部。

  为什么说部首这个概念伟大?不只因为从此开创了按部首编撰字典的排序、检索体例,一直沿用至今;更因为,这背后还有一个更伟大的概念:“六书”。


  就跟“六个核桃”不是真的六个核桃一样,“六书”也不是六本书,而是一套理论,汉字造字法的理论。一枚小小的受精卵,发育成数万亿个人体细胞,靠的是啥?细胞的有丝分裂;我们老祖宗画的一个图画、一枚符号,最后繁殖成包含数万个单字、能够完整记录语言的文字系统,靠的是啥?这里头,肯定也有套路。

半坡陶符

  套路被许先生给摸出来了。他认为老祖宗造字,无非六大套路:

第一是指事,用象征性的符号来表示意义,比如“一”“上”“下”;


第二是象形,直接把物体的外形勾画出来,比如“日”“月”;

第三是会意,两个表意的字合体表示新的意义,比如人在囗中,就是“囚”;

第四是形声,一个表意的字和一个标音的字合成一个新字,比如“江”“河”,这是最能产的一种造字法;


第五是转注,意义上相同或相近的字互引解释,比如“豕”是个象形字,各地由于方言不同,又根据“豕”造出了“猪”“彘”等同义的方言字;


第六是假借,本来没有这个字,借一个发音相近的字来表示,比如甲骨文的“北”像两个人背靠背,本义是“背”,后来被借去表示北方的北……

  这六种造字法,就是许先生定义的“六书”。一枚汉字造出来的过程,基本逃不脱这六种套路。《说文解字》通篇9353个眼花缭乱的小篆字,被许先生用这一套理论,给理得顺顺溜溜、清清楚楚。

  现在就可以看出许先生的厉害之处了:先秦以来分析汉字的书并不少,但从汉字的造字起源全面系统地分析汉字的结构和字义,许先生是第一个这么玩儿的。

  这一玩,玩出了新意,玩出了高度,关键是,玩出了中国文献语言学的千年根基。日后火遍古代中国的文字学、音韵学、训诂学,大体不出 《说文解字》涉及的范围。今人整理厚重的古籍文献,手头也离不开这一本薄薄的册子。

  多么狂拽酷炫。


穷尽一生
编一部 程序 
亦足矣。

  最狂拽酷炫的,还是《说文解字》里那套前无古人、后启来者的编码思想。

  《淮南子》里说,很久很久以前,仓颉造出文字的那一刻,天雨粟、鬼夜哭。

  文字如一道光,劈开蒙昧的迷雾,播洒文明的甘泽。中华民族的智慧洪流从此一泻千里势不可挡,吓得老天爷瓜子都掉了。


  但在“程序员”许先生冷静睿智的眼里,汉字无非就是一套庞大的符号系统,要想对它们进行规范科学的管理使用,并防止它们在时空光缆的传输过程中失真,编个码是很必要的。

  清代人王筠说,《说文解字》通过五百四十个部首对汉字进行排序检索,此为“经”;以六书理论说解汉字的结构和本义,此为“纬”。

  经纬相交,形成了一套“编码网络”。每个汉字符号进入这个网络里,都会获得一个代码。这个代码就像一张不朽的名片,记载着每个汉字的前世今生,往前带着我们靠近更古老的甲骨文和金文,往后则蕴藏着汉字演变发展的无限可能。


  对啊,汉字从来不是一成不变的。从栩栩如生的殷墟甲骨文,到规旋矩折的籀文小篆,从横平竖直的隶书楷体,再到今天的简化字,几千年来汉字更新迭代了N.0版本,以适应不同时代“用户”的需求,但传承的脉络没有断过,最核心的数据也从未丢失。

  为什么?因为背后有中华文明这强大的CPU作支撑,也因为千百年来有无数像许先生这样的“程序员”,前仆后继,用最狂热的激情守护祖先传下的文明数据,又用最冷静的科学态度对这些数据进行整理和维护。

  他们的情怀,也许可以用许先生在《说文解字·叙》里一句慷慨激昂的话来抒发:“盖文字者,经艺之本,王政之始,前人所以垂后,后人所以识古!”

  他们看得通透,文字是沟通古今文明的桥梁。但他们也许没有想到,“六书”这把为汉字量身开发的密钥,还激活了人类古文字的普遍规律——今天人们发现,世界上很多原始文字、古文字的构形造字法,居然都可以拿“六书”来分析分析。“六书”的兼容性,已经超出了汉字的范围,对于人类其他古文字也是普遍适用的。比如纳西族的东巴文,甚至古埃及文、玛雅文,都可以放进许先生的编码程序里跑一跑。

  受时代的局限,许先生的“编码程序”有很多漏洞和不足,但经过后世不断地打补丁和更新,加上甲骨文这一“逆天”的发现,汉文字学如今在世界上已是傲视群雄。今天,汉字又有了Unicode计算机编码,古老符号加入信息时代的轰趴,照样可以轻松“hold”住场。

中日韩汉字Unicode编码表

  这就是汉字的生命力。穿越千年,历久弥坚。在汉字传承这条漫漫长路上,有许多人不能被忘却。譬如“程序员”许慎许先生,为了热爱的文明,穷尽一生编一部“程序”,亦足矣。



'蝇贪'嗡嗡叫,反腐败怎么向基层延伸?先看这几招

到纪委挖消息、打招呼?后果很严重…

那些年令人望而却步的景区高档会所,如今什么模样?

▲收取出嫁管理费、向低保户索要'辛苦费'...8月通报101起侵害群众利益问

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多