分享

汉字

 冰涣颜 2017-09-02

汉字是世界上最古老的文字之一,对周边的影响也是非常巨大的,是其它文字的母字。它是记录事件的书写符号。在形体上逐渐由图形变为由笔画构成的方块形符号,所以汉字一般也叫“方块字”。它由象形文字(表形文字)演变成兼表音义的 意音文字,但总的体系仍属表意文字。所以,汉字具有集形象、声音和辞义三者于一体的特性。这一特性在世界文字中是独一无二的,因此它具有独特的魅力。汉字是汉民族几千年文化的瑰宝,也是我们终生的良师益友,

汉字
每个人的精神家园。汉字往往可以引起我们美妙而大胆的联想,给人美的享受。

汉字更是民族灵魂的纽带,在异国他乡谋生,汉字便是一种寄托,哪怕是一块牌匾、一纸小条,上面的方块字会像磁铁般地吸引着你,让你感受到来自祖国的亲切。因为那中国人的情思已经浓缩为那最简单的横竖撇捺。每一笔,都是饱蘸着华夏碧血写就的。在海外,无论你功成名就还是漂泊沦丧,只要有方块字的伴随,你就会有几多慰藉几多寄托,因为无论是象形还是指事,无论是会意还是形声,每一个字都有深远的来历,每一个中国人就是那一撇一捺,已经成为方块字的魂魄。

相较拼音文字的优点

世界各国使用的文字分为两大类,即非拼音文字(汉字和水书)及拼音文字(其他文字)。当今世界上使用的文字中,汉字和 水书属于非拼音文字。

现今文字中,汉字是从商朝开始使用并演变至今。传说梵文字母是创造宇宙之神大梵天所创造并授予人类(《大唐西域记》)其他文字很多都是借用四大字母系统的文字。婆罗米系列字母、拉丁字母、斯拉夫字母、阿拉伯字母被称为世界四大字母体系。 印度、 尼泊尔、 孟加拉国、 缅甸、 老挝、 泰国、 柬埔寨、 中国西藏地区用婆罗米系列字母。英文、法文、意大利文等使用拉丁字母;俄文、保加利亚文、塞尔维亚文等使用基里尔字母(或斯拉夫字母),是 希腊字母改造而成的;拉丁字母也是希腊字母改造而形成的。阿拉伯字母的祖先——阿拉马字母(Aramaic)及希腊字母的祖先—— 迦南(Canaanite)字母也不是他们祖先直接创造的,而是借用了小方闪米特人(Semites)的文字(小方闪米特字母)改造而成的。这种字母借用了 苏美尔人(Sume)的 楔形文字,并经过改造而成的。楔形文字是苏美尔人创造的,圣书文字是埃及人创造的,汉字是中国人创造的, 中国水族创造的水书,它们都不是拼音文字。四者之中只剩下汉字和水书,其他两者都已经消亡了。

汉语的另一个奇特之处是它的超方言特性及超语言特性。语言学家把中国各地的方言分为八大 方言区。有人说,如果没有汉字,中国早就分裂成几十个国家了。欧洲的意大利语、法语、西班牙语、葡萄牙语和罗马尼亚语之间的差别比中国方言的差距小得多,但是他们绝不愿意承认各自的语言是“ 罗曼语”的不同方言,因为它们都是独立的国家。

汉字在世界历史上,作为其它后发明的文字的母字,如越南、朝鲜和日本都曾经用汉字来记录着它们的语言。日本人至今还使用汉字和 假名的混合文字,使用汉字,还有另一项重大发明,就是写中国字,读日本词。只要其他国家愿意,他们也可以这样做。如果真是这样做了,汉字就成为国际通用的语言符号了,就像数学符号一样,只表意,不表音。

汉字是世界上使用人数最多的文字。据统计,使用汉字和汉语的人数达到16亿以上。

20世纪初叶,随着 西方文化的传入,有人认为,中国之所以落后,汉字是罪魁祸首,主张将汉字废掉。到了20世纪后半叶,计算机科学急剧发展,又有些人认为汉字阻碍了科学的发展,方块字无法输入电脑,又有一阵要废除汉字的鼓躁。后来,这方面的问题解决了,质疑声也随之消散。

汉字是现在仍在使用的历史最悠久的文字。现在能看到而又能认读的最早的汉字是3000多年前的甲骨文。这已是相当成熟、相当系统的汉字了。世界上没有一种文字像汉字那样历尽沧桑,青春永驻。古埃及5000年前的圣书字是人类最早的文字之一。但它后来消亡了,有记载的古埃及文化也被深深地埋藏起来了。苏美尔人的 楔形文字也有5000年的历史。但在公元330年后,它也消亡了。历史上衰亡的著名文字还有 玛雅文、婆罗米文等等。而汉字不但久盛不衰,独矗世界文字之林,还不断地得以发展,影响也越来越大。

优美

它已成为一种艺术——书法艺术。汉字的书法艺术是任何其它文字所无法相比的。 下列的古代书法作品已经成为无价之宝。著名的有 兰亭序、神策军纪圣功德碑、 玄秘塔碑、 祭侄稿等无数作品。

辨识度高

人类的眼睛视野总是一个面,而不是一条线,所以线性排列不易辨认;排成方块一目了然。拼音文字= 线形文字;汉字=方块文字。汉字比拼音文字有更高的 阅读效率。

易懂,具有关联性

例如,“被”是一个形声字兼会意字。如果从形声字的角度来看,“被”字左边的“衣”字旁表示意义,说明被子是属于衣物一类,右边的“皮”字在造字的时代和“被”的读音相似,表示这个字的读音,但是随着时间的推移,“皮”和“被”的读音变得不一样了,逐渐失去了它表读音的 功能。如果从会意字的角度来看,用皮做的衣物就是“被”。被的最初意义指的是一种小被子,到了后代,在被的本义基础上又引申出“蒙受”等意义。

请比较下面一组中英文的词:

汉字词

英文词

cattle

calf

公牛

bull

母牛

cow

牛奶

milk

牛肉

beef

牛角

horn

更多

4.形象,直观达意

汉字是 象形文字,其显著的特点是字形和 字义的联系非常密切,具有明显的直观性和表意性。汉字的表意性使汉字成为世界上单位字符信息量最大的文字,因此容易辨识, 利于联想,这也为加快阅读速度带来极大的便利。

汉字有着区别于世界其他各种语言的根本特点,这就是汉语语法自身的特殊性即意合。无论是 词组合成 句子,还是 单句组合成 复句,首先考虑的因素往往是语意的配合,而不是 语法形式的使用,只要几个负载着重要信息的关键词语在意义上大致搭配得拢,就能言简意赅地达到交际目的,这几个词就可以组合在一起,这就是所谓的“意合”。汉语语法的这一特点,使它结构独特,灵活多变,颇多隐含,着重意念,其意合性、灵活性和简约性是其它语言所不能比拟的。汉语语法的上述特点,有利于我们在阅读中运用意会的方式来进行感知和理解,这对于加快阅读速度就有极大的便利。

5.信息量大

研究表明:汉字作为一个复杂的文字符号系统,其 信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值(平均信息量)是9.65 比特。通过数理语言学中著名的齐普夫定律(ZIPF’SLAW)核算,这是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:

法文:3.98比特

西班牙文:4.01比特

英文:4.03比特

俄文:4.35比特

中文:9.65比特

可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。

汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆0-9,10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9表,二进制只需要学会与、或、非的简单逻辑。但是,人类在日常生活中为什么不使用二进制数字系统呢?因为那样很浪费,一个数字“7”表示成二进制就成了“111”,记个大数不把人累死?反过来,人类为什么不用十六进制,或更高的进制呢?一方面是人脑智力的限制,另一方面,十六进制也未必能大幅度提高信息熵。这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。这就是汉字字符集信息熵高的优势。

汉字的以上五个方面的特点,无疑会使其在阅读心理方面较拼音文字具有相当大的优势,使汉字的书面语在感知、理解的各个方面都有较高的速度和效率,能够实现阅读速度、理解速度、记忆速度的协调发展,快速阅读,也是中国为何能崛起的天然因素,汉语不失,华夏永存。

计算机输入

中文信息处理由于打字机键盘在设计时本身没有考虑汉字输入的问题,输入汉字往往比输入拼音文字困难。由于英文是由26个字母 排列组合而成的文字,因此可以简化输入步骤;相比较之下汉字则不能如此,从字形上虽然可以拆解成不同的部分,但是被分成的部首或偏旁数量多,这样不但不能达到简化输入的目的,反而显得更为繁琐,于是从汉字字音上去考虑汉字输入被分成少量的语音元素组合排列,这样可以达到简化输入的步骤。由于是语音输入对汉字的读音必须清楚,某些生僻字或不知道汉字发音的则会很困难,这在一定程度上限制了汉字的输入。汉字没有经过中文打字机的普及,直接进入了电脑中文信息处理阶段。在电脑发明初期曾引起汉字能否适应电脑时代的问题,支持 汉字拉丁化的学者甚至以此为理据。

随着各种 中文输入法的出现,汉字的计算机输入、存储、输出技术得到了基本解决,大大提高了中文写作、出版、信息检索等的效率。中文输入法有上千种之多,主要包括表音输入和表形输入两类(即五笔和拼音),也有两者兼之的。汉字的 语音输入、 手写识别和光学字符识别(OCR)技术也已得到广泛应用。

如收录数千字的 GB 2312(中国大陆),Big5及CNS 11643(台湾),HKSCS(香港),JIS(日本),以及收录两万多字的 GBK(中国大陆), 国外标准Unicode, ISO 10646等等。在这个过程中,因为技术及其他种种因素,在收录字数,及收录字体等方面或做不同层次的调整。

中国政府为了解决邮政,户籍整理等领域用字的迫切需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB 18030-2000,共收汉字27484个。并强制所有在中国大陆地区售卖的计算机产品必须使用这个新官方标准。

汉字编码系统为进行信息交换,各汉字使用地区都制订了一系列汉字 字符集标准。

国标码(“国标”是中华人民共和国国家标准的简称)在中国大陆使用。GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。

BIG5码。收录13053个汉字。在台湾和香港使用的一 字节或两字节编码。

Unicode并不被大陆很好地接受。政府要求在大陆出售的软件必须支持GB18030编码。

在国际通信化和软件设计领域,CJK编码除了收集了中文,还有日本汉字、韩国汉字的汉字集。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多