分享

汉语和英语那个更先进?谁将成为未来世界的通用语言

 昵称58786195 2018-11-17

       现在世界上存在7000多种语言,使用人数最多范围最广的却只有10多种。到本世纪将有一半以上的语言消失, 80~90%将在未来200年内灭绝。 世界80%的人讲83种主要语言,主流语言在吞噬着更多的弱势语言,语言似乎正在经历一场统一的战争!那么,那种语言能最终统一世界各种语言呢?


 
移除
点击此处添加图片说明文字


一 、先让我们看下世界各主要语言的分布及使用情况。



1、英语



      一开始,英语只不过是不列颠岛上一个外来的丑小鸭。原先居住在北欧沿海地区的日耳曼人对不列颠岛入侵,他们将岛内原有的克尔特居民驱赶到了岛的西部和北部山区。入侵不列颠的日耳曼人三个分支朱特人,盎格鲁人,撒克逊人的语言汇聚成了最初的英语。三者之中盎格鲁人最多,不列颠岛就是以盎格鲁人的部落来命名:England(英格兰),English即“盎格鲁人的语言”。

15世纪以来,在欧洲蛮族屠杀掠夺别人家园的浪潮中,来自英国的日耳曼人强盗抢占了今美国,澳大利亚地区,并且殖民了印度,非洲等国,从而使英语成为目前世界上使用范围最广的语言。这跟日耳曼蛮族的侵略掠夺密不可分。英语是一个彻彻底底的殖民语言。伴随着日耳曼侵略别人的土地扩张。

目前说英语的地区主要是英国及英国的前殖民地: 美国、加拿大,澳大利亚,印度,等等,还有非洲的几个国家 ,从使用地域面积来讲,英语是世界上使用最广泛的语言。

上两个世纪英国和美国在文化,经济,军事,政治和科学上的领先地位使得英语成为一种国际语言。

世界上把英国作为第一语言的人口约有3亿,作为第二语言的人口约2.5亿。由于中国对英语的推崇,使得英语在亚洲有很大潜在的用户,奠定了英语目前成为世界使用最广泛语言的地位。




 
移除
点击此处添加图片说明文字



2、汉语


五千年至两千年前华夏族的活动范围,奠定了今日汉语的使用面积,公元后汉语在朝贡体系内成为通用语。

主要分布国家和地区:中国,新加坡,蒙古,马来西亚,印度尼西亚,越南,缅甸,老挝,朝鲜,韩国,日本,美国西部州和夏威夷等国家地区。据联合国教科文组织统计全球会说汉语的人大约有16亿,居世界人口数量使用语言第一(占世界人口的五分之一)。使用广泛度居世界第二。汉语是联合国的六种官方语言之一,亦为当今世界上作为母语使用人数最多的语言。很多国家都开始将汉语列为第二语言,加入授课内容。



 
移除
点击此处添加图片说明文字



3、法语



法语使用者约有3.4亿。与英语一样,是一个殖民语言,主要在原法国殖民地范围内使用,在一些讲英语的国家,比如加拿大,法语是第二大语言,在欧洲来说,法国的经济政治地位都强过西班牙,这是法语排在西班牙语之前的一大重要原因。



图-法语范围


 
移除
点击此处添加图片说明文字


4、西班牙语



西班牙语使用者约有4.2亿。使用范围主要为西班牙早期殖民地,除了西班牙本土,在中美州的墨西哥,南美洲的阿根廷,都是将西班牙语作为官方语言的。另外,世界上其他国家,会说西班牙语的人也很多,美国的第一语言是英语,第二语言就是西班牙语。西班牙语,从各个程度上,都是葡萄牙语的升级版。

图-西班牙语范围




 
移除
点击此处添加图片说明文字


5、葡萄牙语



全球超过2亿人口将葡萄牙语定位官方语言,大多是葡萄牙以前的殖民地。这其中包括巴西这个新兴的大国,也包括非洲的安哥拉、几内亚等国,其国际影响力大于后面这几种语言,后面这几种只能说是地方性语言,尚未波及世界。有些读者可能不知道,中国澳门现在仍然将葡萄牙语定位官方语言之一。葡萄牙语今天的地位,与现在葡萄牙这个国家关系不大,只是几百年前那个海盗国家征服地球的缩影。


图-葡萄牙语范围


 
移除
点击此处添加图片说明文字



6、俄罗斯语



斯拉夫人从15世纪后一路烧杀抢掠,侵占西伯利亚及东欧众多土地,从而使俄罗斯语成为一种使用比较广泛的语言。前苏联有15个国家使用,人口约3亿。俄罗斯语最大特点是占地广,前苏联2000多万平方公里,中国加美国再加日本都没这么大。如果前苏联国家经济再强一点,俄罗斯语还可获得更高排名。


 
移除
点击此处添加图片说明文字



7、阿拉伯语


阿拉伯语相对德语和日语来说,第一大优势是人口多,有约3.6亿人。第二大优势是地域大,在西亚和北非,包括沙特阿拉伯、伊拉克、埃及、摩纳哥等20多个国家。另外,从财富的角度看,阿拉伯地区石油多,经济总量也大。阿拉伯地区的不足是,制造业和科技水平不如德国和日本,不过这不影响阿拉伯语的地位,因为排名更靠前的语言中,科技水平也有并不高的。


在古代阿拉伯人通过侵略北非从而使这些地区成为阿语区。在中国西域,大约12世纪,穆斯林圣战势力驱逐了当地其他宗教势力,从而稳居西域,甚至今天当地的文字也与阿拉伯文字可以互读为同一文字体系。



 
移除
点击此处添加图片说明文字


8、德语



将德语作为母语的国家,有欧洲的德国、奥地利,人口约有1亿。其他如瑞士、比利时等国也有相当部分德语人口,英国法国等也有少量讲德语的人。德语跟日语最大不同,是德国是陆地国家,德语在德国和奥地利之外的其他西欧国家,也有一定市场。德国在欧盟,是绝对的领袖地位。放眼西欧,如果德国的经济政治排第二,那谁也不敢称第一。德文亏就亏在德国是二战的战败国,德国在海外的许多权益被无限压缩,以至现在欧洲之外说德文的人很少。


图-德语范围


 
移除
点击此处添加图片说明文字


9、日语

最近20年,日语的影响力一直在下降,原因是日本的经济一直不好。但是作为一个面积并不大的岛国,能排到这个位置已经实属不易。日本有1.3亿人口,但是日本之外,除了日本侨民,几乎没有人讲日语,这是日语的悲哀,也是岛国的先天不足。日本历史上侵略过许多国家,特别是朝鲜和韩国,是被日本侵略的重灾区,由于时间较短,除了琉球王国外,日本没能从语言上同化任何一个国家。


 
移除
点击此处添加图片说明文字


10、印地语



印度的官方语言是英语和印地语,但是印度南方人并不讲印地语,北印度5亿多人讲印地语。可以说讲印地语的人口不少,但国际影响甚微,勉强可以挤入前10,若整个印度10几亿人口全都讲印地语,这种语言还能往前排一些。



 
移除
点击此处添加图片说明文字



二 、那么哪种语言在未来能最终成为世界语呢?



 
移除
点击此处添加图片说明文字


答案是没有任何一种语言能做到这一点。


在未来,尽管学习某一种语言的人数会变多变少,但对那种语言能最终统一所有语言成为世界语只能起次要作用,起主要作用的还是使用这种语言的人是否能扩张。


英语要想成为世界语除非英语国家能统治中国俄罗斯阿拉伯语区。汉语要想成为世界语除非日耳曼人与斯拉夫人被打回原形。这些在可预见的未来都是小概率事件。因此未来一定时间内没有任何一种语言能取代其他语言成为唯一的世界语。



在未来,会有优势语言。但无统一语言。目前英语在使用范围上具有优势 (殖民地的缘故) ,汉语在使用人数上具有优势。


 
移除
点击此处添加图片说明文字



三 、汉语和英语那种语言更先进?



答案是汉语。汉语是人类有史以来最先进的语言,没有之一。


 
移除
点击此处添加图片说明文字



记得的本人上中学的时候,语文课本上堂而晃之地写着:“走拼音化道路是汉语的必然趋势。”其中最主要的一条理由便是,英文可以打字,而汉语不能。现在回想起来真是可笑。历史会产生惊人的对比,随着时代的发展,人们越来越意识到汉语汉字体系的先进性。



一,汉语的高效组合性



    汉语是高效组合语,任何其他语言都没有这个优势。

语言的一个特性就是,你必须掌握它的基础量才能运用自如。


    比如汉语体系的字,英语体系的词。随着新事物的增多,语言的基础量也在快速增加。人类有限的时间和需要掌握的基础词量形成强烈的矛盾。而汉语是被冲击最小的一种语言。原因就是汉语是一种高效组合语。



    在现代社会一个说汉语的人只需要掌握2000个字,就可以读书、看报、搞科研。可在英文世界里,没有2万个词别想读报,没有3万个词别想把周刊读顺,大学毕业10年后的职业人士一般都得懂8万词。 普通使用汉语的人用2000个字就可以描绘世界,而使用英语的人至少需要8万单词。而据美国联邦教育委员会调查,美国中学毕业生七成看不懂纽约时报。而中国中学生读完四大名著完全不在话下,更别说普通的报纸了。



   为什么会这样呢?原因就是汉语体系高效组合的先进性。一定数量的汉字会组合成无数的词语,不同的词语又会组合成不同的词组。神奇就神奇在你只需要了解最基本的汉字就可以懂得组合出的词的意思。而英语却不是这个样子,每形容一个事物英语都需要创造出一个新单词。这就造成了英语单词无限量的创造,切不相关。 目前的英语单词已经超过了数百万个。而所有这些单词在汉语中都可以用四千个汉字来表达。



  比如pork这个词,在英语中代表猪肉,它和猪pig、肉meat没有任何关系而仅仅代表它们的一个联合体而已,如果把猪肉pork、羊肉mutton、牛肉beef、猪油lard、羊油suet和牛油talon放在一起进行比较的话就发现,英语中所有的联体词都是一个与其中任何一个分解词毫无关联的新符号,而它们却构成了英语词汇的主体,英语中几百万的单词就是这样来的。

新事物的涌现,总伴随者新词,例如英语中 ROCKET(火箭),COMPUTER(计算机),需要不停地创造。而汉语却不需要这样 ,不就是用“火”驱动的“箭”么,会“计算”的“机”么!可英文就不能这么干,由于字母文字的局限性,不能靠组词,原因是“太长”了。如 火箭将成为“ FIRE-DRIVEN-ARROW”,计算机将成为“COMPUTAIONAL-MACHINE”等 。人的视角有限,太长的字会降低文章的可读性与读者的理解能力。

有了新事物,英语又要增加一个新词,那么又要记忆。这样就形成了一个恶性循环。到最后,一个使用英语的人他的一辈子的时间,也就只够记忆这些单词,还谈什么发展!



那么人的一生中到底需要记住多少单词或符号呢?中国人所使用的汉字通常在三到四千就足够了,莎士比亚时代的英语有三万个单词,到了丘吉尔时代,英语已经拥有近百万个单词了。现代已经达到数百万。语言学家对一个受过教育的英语使用者的要求是应该掌握5万到25万个单词。未来,随着信息大爆炸,对英语使用者所需记忆单词量的要求还将进一步增加。而汉语使用者,无论未来信息如何爆炸,就算到了宇宙时代,掌握五六千汉字也完全足够了。 



语言的好坏其实取决于两个方面。


第一、是不是能够用很少的记忆来掌握。


第二、是不是能够在有生之年掌握到比其他人更多的知识?用一句极限的话来讲应该是:最好的语言是不学而知,但是所掌握的知识又最多的。而汉语是最符合这样的要求的。汉语是全世界唯一一种学少而知多的语言。 


 
移除
点击此处添加图片说明文字



汉语的高效组合现象最先是德国的莱布尼茨体会到的,他认为汉语是自亚里士多得以来,西方世界梦寐以求的组义语言。如果他看到今天知识爆炸的世界,他一定会要求世界上所有的国家废除拼音文字而采用汉字。 



二 、汉语思维比其他语言快




 
移除
点击此处添加图片说明文字



     汉语的一个明显的优势是,思维面广阔,在数学上由于单音节发音,对数字的 反应速度也更快。从人类文明发展的趋势看,作为表意文字的汉语,由于可以自由组合新名词新概念以至新思想,可以容纳信息和知识爆炸的冲击,用这种语言来交流思想更加方便,更加丰富多彩。


  汉语的思维速度比英语快 。为什么声音种类越多,思维速度就越快。 。日常生活中也可以看到,凡是常用的语言元素,包括声母、韵母、汉字和单词等到,越是经常使用的越容易掌握。英语与普通话相比则不同,国际音标中,英语有20个元音和20个辅音,所以英语的声音种类不会超过20×20=400个;反过来说,不在这四百个声音之内的任何声音都不被英语所承认,或者被认为是不正确的发音。比较一下就会看出,汉语的发音种类是英语的3倍。



  假设有一个仅会发两种声音的人,具体地讲,他就会发a和b两个音。根据电脑的理论,我们知道,他用这两个符号依然可以表达整个世界。再假设,世界上仅有400种事物需要表达,那么,一个英国人可以用每一个发音来表达400种事物中的一件,而仅会发两个声音的人,有时就不得不用九个发音来表达400种事物中的一件,因为二的九次方才大于400。比如,英国人用‘i’代表‘我’而仅会两个声音的人可能要用abbababba代表‘我’这个概念。一般人每发一个声音大约需要消耗四分之一秒的时间。比较两者就会看出,仅会两个声音的人,不但表达得慢,而且还费力气。在表达‘我’这个概念的时候,英国人使用四分之一秒的时间,而仅会两个声音的人使用了二又四分之一秒。如果两个人总以这样的比例生活一辈子,他们一生中所享受到的所有信息将是它的反比9:1。实际的情况中,最明显的是日语与汉语的对照,我们知道,日语使用了100种不同的声音,而汉语使用了1200种声音,因此很多汉字让日本人一念就必须用两个或者三个声音来表达。我们假设日语中所有的字都用两个声音来表达,那么岂不是说,日本人一生所能够享受到的信息仅仅是中国人的一半吗?我曾经思考过,这是不是与日本历史上从来没有出现过伟大的思想家有关。



     我们知道,思维实际上是一种心里说的过程,如果在说话时表达得快,那么,思维的速度也应该跟着快。具体的例子是赵元任曾经比较用英语和汉语背诵乘法口诀的速度,汉语使用了30秒,而英语使用了45秒。因此,如果两个人同时用英语和汉语来背诵的话,到了30秒的时候,汉语使用者一定想到了九九八十一,而英语使用者则一定到不了这里,说不定,他想到的仅仅是七七四十九。这就证明了使用发音种类多的语言比使用发音种类少的语言思维速度快。这一点曾经被国、内外许多学者所证实。至于思维速度快是否就代表聪明这个问题是被很多学者所承认的。



  我的证据是解释一个历史上的‘谜’古希腊人为什么比其他人更聪明?因为希腊的文化来自古菲尼基人,我们知道菲尼基人发明了人类的拼音字母,就声音的分解来说,这是一大进步,就思维速度来说,它是一大倒退。因为,为了筛选容易区分的声音元素,菲尼基人仅仅使用了22个辅音,这样,它的表达速度当然比现在任何语言都慢,而希腊人则采用了元音,我们知道元音与辅音结合以后,声音种类等于增加了好几倍。事实上,菲尼基人的声音中也有元音,否则他们是发不出来的。所谓的22个辅音是说他们仅承认这22个辅音为信息栽体,也就是,ma、me、mu、mai、muo在他们的耳朵里与一个m没有任何区别就像me的四种声调对于英国人来讲没有任何区别一样。由于声音种类的突然增加使得希腊人的思维突飞猛进,造成了后来的现象。论坛上曾经有人问汉语的声音种类依然多于英语,为什么没有英国先进。我的回答是,当声音种类突然增加的时候就有新思想出现,反之,当声音种类减少时,思想就趋于保守,而元朝以后,中国的声音中失掉了一个‘入’声,中国的衰弱正巧从那时开始。最后,在讨论尼安德特人的时候,人们也发现,使用声音种类少的人种会被历史淘汰。




   谁都知道,世界语实际上是将英语改头换面设计的语言,当然不懂得使用‘声调’。我的问题是,英语的单词已经远远超过了常人的记忆极限,世界语有什么办法弥补这个缺陷吗?当时有人回答我说,世界语中使用派生的结构比英语更加明显。可是,当我将汉语中的声音种类,以及‘声调’的利用方法向他们解释以后,再也没有人发言了。




  还有就是美国有一个‘只说英语运动’english only曾经向全世界争求意见。可想而知,我的意见是什么了。我告诉他们,你们一意推行英语实际上是将美国文化推向深渊,是在摧毁美国文化。拯救你们的方法只有重新选择一门带有‘声调’的语言。对于这些没学过汉语的人来说,他们一般不懂得什么是‘声调’,所以,只好用唱歌时候的音阶来向他们解释;任何一个英语‘音节’都可以跟随音阶变化出至少八种不同的声音,这和‘声调’的作用差不多。



三 、汉语在学科研究方面优势渐显。



 
移除
点击此处添加图片说明文字



         有人曾问一所大学的几个教授 “长方体”如何用英文编程 讲,可这几位母语是英文的工科教授竟说不知道,接下来连问几个本地的研究生,结果他们也不知道 。着实令人大吃一惊!当然在字典里是可以杳到这个词的,可转眼间又忘了,原因是 它太生辟。感叹,词汇如“光幻觉”、“四环素”、“变阻器”、“碳酸钙”、“高血 压”、“肾结石”、“七边形” 、“五面体”都只有专业人士才会。



         英文试图给天下每一事物起一个名字。宇宙无穷,英文词汇无穷!根本不可能象汉语那样触类旁通。不信?去亲自问问母语是英文的人好了。英文是发散的。搞的一些基本概念如“长方体”也只有专家才会讲!怪不得英文世界里专家那么多,而且都那么自信;是啊,一般人连他们的基本术语如“酒精绵球”“血压计”都不会讲。



        英文是一维的,是密码语言。写英文是编码,读英文是解码。细想想 :如把英文的 a、b、c、d、e换成1、2、3、4、5,并没有什么原则上 的区别。按上边的对应,如一开始就把cab写成312 ,用一样的读音, 又有什么不可以?汉语就不同了,是二维的(纸面上的最大维数),最大限度地利用了纸面的几何空间。每个汉字就是一幅画。试问从一幅画上得到的信息快,还是从一行密码中得到的信息快?



    中国的物理学专家可以凭借他在中学时代的化学基础知识通读化学专家的论文,而英美的不同行业的专家要交流他们的学术成果,则是对牛弹琴。 



呼吁那些糟蹋汉语的人注意以下事实:

(1)联合国5种文字的官方文件中最薄一本一定是汉语;

(2)汉语的精确性已为蓬勃发展的中国科技事业所证实;

(3)计算机语音输入最具有希望的是汉语;

(4)汉语是稳定的是收敛的,英文是不稳定的是发散的;

(5)汉语是二维信息是生动的是高效的,英文是一维信息是密码型的是枯燥低效的。

(6)在英文世界里能读文学名著是一件了不起的事,不是所有受过大学教育的人都能干的。如阅读《荆棘鸟》中用英文描述的非州的一些植物真是艰涩无比,一般英美人也只能囫囵吞枣而已;可在中文世界里,又有谁会对仅有中学学历的人读完四大名著而感到惊奇呢?

(7)当今虽是英语文明的蓬勃期。但在历史的长河中,英文世界的文明史远比汉语世界的文明史短的多。说英文是先进语言的人是不尊重基本事实。




四,对一些观点和问题的回答




1,汉语是世界上最难学的语言。


这个观点是错的。


 
移除
点击此处添加图片说明文字


     其实中国人学英语一点都不比外国人学汉语容易。一个母语既不是东方语系也不是拉丁语系的人学汉语要比学英语容易的多。


汉语是先难后易的语言,拉丁语是先易后难的语言。



    就掌握自己母语的书写系统来讲,我们确实要比学英语的人付出更多的劳动,需要更多的练习,更多的记忆。中国人大概掌握2000左右常用汉字的时候,就可以阅读理解90%以上的报刊文献资料,这大概是在小学三、四年级。而且汉字也不像表面上看起来那么难,它们的组织也是有规律的,掌握了一定基本汉字和偏旁之后,就可以通过组合排列这些汉字或者偏旁,很快掌握新的汉字。所以对学汉语的人,汉字的学习是一个加速度的过程。



     跟英文字母非常不一样,汉字是汉语的意义单位,一个汉字往往有意思,要么代表一个概念,要么代表一种特征。所以说,学习汉字的过程,也就是在学习语言单位的过程,当掌握一定汉字的时候,也就意味着他们掌握了这种语言的词汇,可以直接用来交际。更重要的是,无论是汉语的词汇还是语法,都是靠这种意义单位(汉字)排列组合而体现的。


    然而,英语的二十六个字母,只是书写符号而已,跟词汇和语法没有关系,一个学生要一个一个词汇去学,一个一个语法点去掌握,所以学英语的人后期学习语言的记忆负担远远大于学汉语人。下面我们用一两组词为例来说明这一点。
羊羔 lamb             山羊 goat
绵羊 sheep           羚羊 antelope
公羊 ram               母羊 ewe
岩羊 burhel           黄羊 Mongolian gazelle 
奶羊 milk goat      头羊bellwether

     汉族的小孩,只要掌握了一个“羊”字,几乎就掌握了各种羊的名称。当遇到“公羊”、“母羊”这些词的时候,根本不用去查字典,就可以准确知道它们的意思,看到“岩羊”、“黄羊”也能猜个八九不离十,起码可以知道它们是羊中的一个类属,因为字面已经透露了这种信息。然而说英语的小孩,学了sheep、goat,还是不知道ewe、ram、antelope、lamb等是什么东西,遇到它们就得查字典,分别记忆,负担大多了。从记忆负担的角度来讲,汉族的小孩一旦掌握了一定数量的汉字,词汇量就会迅速膨胀,很多可以无师自通,远远比学英语小孩的记忆负担轻。这就是汉族小孩学习语言的巨大优势。不光是学习名词如此,在掌握动词系统上也是一样的。拿汉语的“吃”为例,它可以表示丰富而复杂的概念。相对的,英语则用不同的概念来表示。

 
吃利息 live on interest        吃不得 be not edible
吃不开 be unpopular          吃素     be a vegetarian
吃不来 not be fond of         吃得消 can endure or stand
吃苦头 suffer                       吃水     draught
吃得上 be available on the market  吃零嘴 take snacks between meals
吃回扣 accept a commission 吃红牌 get a red card
  



    汉族小孩一旦掌握了“吃”,就可以推知上述汉语词语的大致意思。而英语的相关表达,谁跟谁都不一样,没有什么规律可循,一个人要长期泡在这种语言里,长期观摩,反复练习,才能掌握。




    只要掌握一个关键字,就可以通过与其他词的搭配,表达各种各样的意思。比如一旦掌握了“吃”,下面这些词就是小菜一碟儿:吃饱、吃撑、吃胖、吃瘦(吃减肥药)、吃饼、吃圆(肚子)、吃病、吃死、吃穷、吃光、吃掉等等,不用人教就知道他们的意思。



    相信大多数的中国人都有这种感觉,小学学习汉字的时候确实还要费点儿劲儿,然而一旦掌握一定的汉字,没有人觉得掌握汉语词汇是个负担,很多可以无师自通,甚至可以创造性的排列组合,造出非常具有表现力的句子。

    汉字确实比字母难学一些,然而每个汉字的含金量非常高,一旦掌握了一定数量的汉字,就可以迅速地掌握庞大的词汇量。这也是我们的母语为每个人提供的学习便利。 



     我在背英语单词的时候,发现最好的记忆方法是把意思和读音结合起来,然后通过读音记忆拼写。(完美的表音文字,应该是读音与拼写的直接对应。英语由于受到其他语言影响太多所以这方面相对较差,不过这种规律还是相通的。)


相对与文字,人对读音的记忆速度更快。而表音文字,一旦掌握了拼写和读音之间的规律,就很容易记住文字。



    而汉语在这方面是很差的。字和字之间缺乏联系,字和读音之间很少有联系,而且由于几千年语音的变化,经常看着是个形声字,读音却与想象的相差甚远。这是我们文字的劣势。但是这是中文读取速度快所带来的代价。



   我们可以看到,几千年来文字的发展历程。它总是首先于两个因素:表意的需要,学习和书写的难度。



    一开始我们的老祖宗试图用一个字代表一个特定含义。这是很自然的思路。但是后来随着需要表达的意思成几何级数增长。汉字逐渐就不够用了。或者说,这样的话,同音字实在太多,不利于传播了。于是多个字组成的词才出现。在此之后,一大批原来造出来的字都被抛弃了。


    比方说骓、骊、骒这种专门为表示特定种类的马的字。还有璇、玑等等一大堆带王字旁(斜玉旁)表示特定种类的玉器的字。后者毕竟意思还不错,还在名字里用一用。



关于歧义。分析语本身就要求有上下文提供必要的信息,因为分析语借助逻辑关系省略了大量的信息才实现了更高效率的信息传递。这点小小的歧义在现实生活中是不会造成什么影响。你要问为什么,这很简单,因为汉字简化都不是几十年前那些人坐在那里拍脑袋写出来的,而是之前至少上百年就有人大规模使用的。如果频繁造成歧义,早就没有人那样用了。



     当语法发展完全,使用充分之后,维持庞大而复杂的常用文字库只能不利于学习。适当的简化是必要的。汉字本身的优越性并不高,但是它为汉语的优越性提供了必要的基础支持。没有汉字就没有汉语,但是汉字本身也是需要时不时进行改革的。毕竟学习的难度在目前条件下还是显著高于其他语言。如果能在不伤害对汉语的支撑能力的情况下使得汉字更好学习,这无疑是一件好事。



2,近代以来韩国,越南放弃汉字,是不是意味着汉字不行?



     韩国,越南放弃汉字并不是汉字的问题,而是汉族衰落的原因,汉族近一千年的衰落对周边影响力下降的反映。


3,表音文字比表意文字先进,所以拉丁文字比汉字先进。


     这个是明显错误的观点。而且恰恰相反,表意的汉字要比表音的拉丁文字先进的多。



    这世界上,仍然在广泛使用的表意文字,恐怕就只有汉字了。而表音文字大行其道。有的人认为这意味着表音文字是更先进的文字,所以表音文字战胜了表意文字。


事实上,单从两者的发展历史,是得不到这个结论的。



       文字,从一开始就是记录信息用的。原生文明,无论中国、古埃及、古印度还是两河流域,甚至是玛雅,其文字都是象形文字。换句话说,一开始都是表意的。当文字发展到一定程度的时候,原有的字符无法满足表达的需要,就会衍生出新的文字。这些新的文字往往由表音的部分和表意的部分合并而成。无论是早期汉字还是古埃及的圣书体都有这样一个特点。这是文字扩展的必然过程。但表意文字仍然是表意文字从某种意义上来说,原生文明的语言都是基于表意文字的。



      而次生文明则基本都是表音语言。比如希腊、比如日本。有人推测,这是因为次生文明需要从原生文明中学习很多的东西,包括大量的词汇。运用这些词汇最简单的方法就是直接用原生文明的发音来指代。而次生文明因为严重依赖于原生文明的词语发音,自己语言里那种发音恐怕是表不出来什么意思的。所以最终不得不使用一套表音文字体系来使得自己原有语言与从原生文明进口的大量词汇兼容。这种被迫囫囵吞枣的做法,我们可以看到也是今天表音文字的本能行为。比如日文“计算机” 就是Computer的音译。



     那么为什么这世界上的表意文字这么少呢?很显然,这世界上的原生文明本来就那么几个,而次生文明却要多几个数量级。历史大潮中三十年河东三十年河西,原生文明也有可能被次生文明所征服。在征服之后,语言也就有可能会逐渐消亡了。如果我们回头去看看,消亡了的表音文字比表意文字可是要多得多。



     所以,表音文字广泛使用,这并不说明表音文字就优秀。只能说这世界上的原生文明实在太少。以及后来使用拉丁字母的欧洲蛮族侵略到美洲,澳洲, 西伯利亚的缘故。



      如果要正儿八经讨论一种语言的优劣,就必须从两个角度来讨论,第一是语音,第二是文字。


⑴语音


    之所以要先讲语音,是因为所有的语言都是从口语发展出来的,书面的文字,实际上是语言的一个记录工具,而口语的核心就是语音。语言水平高低的评判准则



      口语,放在今天来分析,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变成一串频率不同、波形不同的声波,然后有另一个个体的听觉器官和相关的脑部组织重新转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于传输的信号的规则。计算机上,通讯协议基本上有这么两个评判标准:传输效率和抗噪能力。所谓传输效率,是说,在单位时间里,按照该通讯协议能够传输多少信息。所谓抗噪能力,是说这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。



     传输效率又有两个方面,一个是编码效率,一个是传输速度。编码效率是说,这个通讯协议能够把一个信息用多短的一串信号来表达。传输速度是说一段信号,能够以多快的速度传输。

评价一种语言的口语是否先进,就要分析上面这几个问题。


传输的绝对优势:声调


     首先从编码效率上,我们可以说汉语就是世界上编码效率最高的语言,没有之一。汉语发音有三大要素:声母、韵母、声调。一般的语言只有两个要素:声母的韵母。从编码上说,汉语发音的表意能力就比一般语言高出一个维度。高出一个维度的价值就在于,使用单个音节,汉语能够表达的不同信息的种类,最高可以达到一般外语的4倍。



    由于有了声调这个优势,理论上汉语的传输效率最高就可以达到一般外语的4倍。一般外语,虽然已经开始有意识地使用声调,但是效率非常低,往往一个句子中最多只用一个到两个音调表达诸如疑问、强调等作用。这还只是处于声调应用的初级阶段。远远无法与汉语相比,汉语在几乎每个发音上都应用了声调。



信息论角度上的绝对优势



      汉语在传输效率方面带来的优势,在文化中就进一步带来了更大的优势。从信息论角度来考虑,编码是很有学问的。举个例子。我们知道计算机传输信息,实际上传输的都是0和1。那么,如果我们传输的各种信息出现的频率不一样高怎么办?答案是,出现越频繁的,编码越短。这样就能提高总体效率。



     比方说,我们只有四种信息要传递。按一般的想法,自然是把这四种信息分别用00、01、10、11来表示。每个信息都需要用两位二进制数来表示,也就是说传播100条信息需要发送200个二进制数。但是如果其中有一种信息出现的概率是91%,而另外三种分别是3%。那么就可以使用另一种编码方式:1,01,001,000。平均下来这种传播方式传播100条信息需要发91+2*3+3*3+3*3=115个二进制数。显然比前面那种效率要高。因此,你会发现各个语言中越常用的词,一般就越短。英语里,我、你、他、她、我们,都是单音节词。但是,单音节终归是有限的。绝大多数意思还是要用双音节或更多来表示。这时候汉语的优势就显现出来了。由于汉语所能承载的单音节词比其他语言多几倍,所以在构成多音节词的时候就可以很奢侈地使用逻辑结构。这种逻辑结构,使得中文的联系性、逻辑性要优于一般语言。而与语音脱离的文字体系,则进一步支撑了这种结构,方便了记忆。



       很多其他语言,由于缺少单音节词,所以一般常用词只能使用双音节词。而要形成逻辑结构就必须大规模使用四音节词。这是非常低效的。为了避免这种低效,很多常用的词就只能抛弃逻辑结构,用毫无关系的双音节或三音节词表示。


     比如我们可以很轻松地说“公鸡”、“母鸡”、“小鸡”、“鸡蛋”。而英语里就成了“Cock”、 “Hen”、 “Chick”、 “Egg”。类似的发音长度,中文能负担起逻辑结构,而英文就负担不起来。


    所以说,类似长度的词,中文一般都要比英文的逻辑要更清晰。这不简简单单是是效率的问题,而更是人民接受信息能力的问题。组词方式越短、越有逻辑性,学习就越简单。整个社会效率就越高。学习、记忆什么叫Laser,远不如“激光”那么简单。


     我们来举一个非常简单的例子。普通中国人的初等数学能力往往超过欧美。这并不简简单单是教育的问题。更关键地,这是中文对数字命名结果。



     中文由于汉语在单音节词上无可匹敌优势,可以极度奢侈地给予每一个数字一个单音节发音。没有音调的语言,是不可能做到这一点的,因为还有其他更常见的东西需要占用宝贵的单音节词的资源。人对数字的短期记忆,实际上是对数字发音的记忆。研究表明中国人一次能够记住的数字长度要高于英语母语国家。而在计算中,你需要短期记忆很多数字,这一点就天然地给予了中国人绝对优势。



       更进一步,中国的数字都是单音节,因此可以采用绝对逻辑的方式构建整个数字表。九十六,就是九个十加一个六。英语是“九十”(与九和十都不同的特殊词)加一个六。法语是四个二十加十六。汉语种最简洁而最富逻辑的结构,在世界各种主要语言中是独一无二的。九九乘法口诀表,就是构建在这个基础上的。其他国家的儿童如果想背下来这张表,可以说比中国儿童难了几倍。语言上具备了这种优势,中国人的初等数学怎么能不好?就初等数学上的优势,乘以初等数学在整个社会中的价值,这就是中国的根本竞争优势之一。



     当然,这里还是要提一下,在比较长的单词上表音文字当然也是有逻辑结构的,这是语言发展的必然结果。比如说英文nephritis,就来源于希腊语中一个读音类似的词,而希腊语中的那个词则来源于希腊语Nefros和itis,是“肾”和“炎”。不过很抱歉的是,由于表音能力差,这些很常见的意思必须要用这么多音节来表达。这就远不如中文简简单单的“肾炎”了。



     此外还需要提到,由于汉语具有远超其他语言的庞大单音节词库,因此在对特定名词进行缩写的时候,就更具有无可比拟的优势。表音语言在对名词缩写时,一般只能取首字母,这非常容易引起歧义。而中文可以直接取整个名词中比较具有代表意义的字,可以极大地消除歧义。比如美国人说“国安局”就是“NSA”,中文三个音节,英文四个音节,结果中文比英文清晰得多。


最强抗噪能力:完全抛弃轻音


    从发音种类上说,汉语的发音种类是比较多的。如果你注意日语的话,日语里面就没有r这个声母,发音种类就比汉语少。但是日语从汉语学到了一个巨大的优势,那就是基本抛弃轻音。


     刚才我说到汉语发音种类比较多,可能有人就开始皱眉头了。因为如果不考虑声调,英语里独立发音的种类其实比汉语里还多。因为英语声母可以单独成音。而汉语里是没有的。


       事实上,古汉语中轻音也是极度常见的。但是为什么我们都抛弃了呢?因为一个简单的原因:抗噪能力差。一个轻音,距离稍微远一点,或者噪音稍微大一点,就听不见了。而一个辅音和一个元音组成的音节,则由于元音的存在而有较强的信号强度,更容易正确传输。


     现代汉语普通话,发音一个萝卜一个坑,一个辅音配一个元音(当然也有少量单独元音),发音强度大,效率高。这就是现代汉语的优点之一。



提高传输速度:懒化



      那么再比较一下英语和汉语。从口语角度讲,汉语的核心优势在于语调。英语中一个发音,大致有三个要素:声母、韵母、长度。英语中的语调,是用整个词的调子或者整个句子的调子来表达单个言外之意,所以仅仅对口语起支撑作用。现今英语的发展潮流中,长度的要素逐渐消亡。长度要素,是通过发音的长短来改变发音的含义,理论上说长度的变化只能在一个基本单位音长和两个单位音长之间变化,长于两个单位音长,就失掉了经济性,从效率上讲,不如直接用两个音替代。事实上,英语中,长度变化,只有两种:短音和长音。而长音本身,从发音效率上讲是低效的。因此随着英语的广泛散布,长短音的差距越来越小。甚至很多英语母语国家的人讲英语都不管长短音的差异。比方说,sheep的那个i:的音已经见不到人专门拖长了,美国人发这个音基本都是短音i(有的人为了与ship区别,把那个sh发的有点像汉语拼音里的x)。再比如美国人日常对话里说I don''t know的时候,Don''t的那个t的发音常常是省略的。



      此外,英语中包含有一些发音效率很低的音,比如th清音(就是three的th)。有一次在收音机里听见广告提到了一个电话号码,这个号码是 833-3333。大家可以试一下严格按照th清音的时候,这个电话号码读出来有多费劲(Eight Three Three, Thirty Three Thirty Three)。th这个音我一般都发成s的音,几乎没有产生过误解。还有,比如L这个字母,理论上发音的时候舌尖要顶住上腭,实际上没发现有几个美国人是这么发音的。整个英语发音规则,随着广泛的传播,而迅速的“懒化”。换句话说就是发音规则向快速、高效发音方向发展。但是英语在发音上仍然是落后的。



      我们反过来看汉语。汉语经历了长期、大范围的传播。因此发音普遍比较简单。目前汉语里与标准发音规则不同的“懒化”是比较罕见的。但是依然存在。举个简单的例子。“谁”这个音,按照汉语标准发音规则,应发为“shui”,而实际上,大多数人发的音是“shei”。为什么呢?很多人可能都没有意识到,但是我一讲立刻就能明白:“shui”这个音要求嘴唇作大范围的运动,而“shei”这个音则不需要。这个区别的核心在于ui和粤语中的oi一样,都是两个不同的元音结合在一起,需要用两个唇舌动作来发,而ei实际上是一个特殊的元音,而不是两个元音(当然,你也可以把它发成两个元音的结合,只不过一般说话没人愿意那么费劲)。所以在大量的使用中,“shui”就逐渐懒化成为了“shei”。


      总的来说,汉语所有的发音,通常都能可以以极快的速度发出,绝不会有诸如小舌音那种效率极低的东西存在。所以汉语的传输速度也是首屈一指的。



侧面的证明:唇舌运动



       那么我们最后回过头来看,汉语由于抛弃了轻音而具备了较高的抗噪能力,并抛弃了大量不容易发的音。因此与其他语言相比,汉语具有极高的先进性。那么有人问,这些都是空的,有没有直观的东西能证明汉语的优越呢?



    有的。出了国,尤其是到了欧美的人,就会发现一个问题。那就是中国人说英语,相比于当地人来说,总有点含混不清。外语老师总是要求中国人说英语的时候嘴巴要张大,舌头要有力,甚至要求用说话时咬住一根铅笔的方式来训练。这是为什么呢?因为中国人已经习惯了唇舌微微运动的发音过程。汉语的高抗噪能力,使得发音不必费力,唇舌运动幅度比英语之类明显小。很多要求唇舌大幅度运动的音节构成,都已经在汉语里看不到了。



      所以,从一个通讯协议的角度看,汉语的语音显然对诸多其他语言更先进。传输效率高、抗噪能力强。



⑵文字



      我们的语音可以说是世界上最先进的,文字同样如此。语音可以说是一种通讯协议。那么文字就可说是一种数据存储格式。存储格式的要求与通讯协议不同。存储格式要求存空间小、读写速度快。


      不过,我们首先要说一个最基本的问题。正是因为汉字本身与读音没有必然联系,才给予了汉语语音不断成长的基础。才能衍生出汉语这一当今最先进的语音体系。表音文字,总是把语音禁锢住,也就因此很难成长了。当然,这也带来了学习困难的问题。但是相比于汉字带来的其他优势,这实在算不了什么。



语言的分类



       这个世界上的语言大致分为两种,一种叫做综合语,一种叫做分析语(或称孤立语)。


简单地说,综合语可以通过改变词的形态来表达不同的意思。而分析语则单纯通过词与词之间的关系来表达不同的意思。


我们举个简单的例子:

中文(分析语):我昨天告诉他了。

英文(综合语):I told him yesterday.



      英文你首先可以看到told和him两个变形。其中把tell变成told表示过去发生的动作,把he变成him表示客体。而中文用昨天来直接指明时间,如果不指明时间则需要用“已经”、“过”之类来表示过去,而并不改变词的形态。中文还通过各自的位置来体现谁是主体谁是客体。



       实际上,英语已经是综合语中非常接近分析语的了。比方说英语的未来时态用的词形和一般时态没有区别。而很多其他语言中不同的时态都是用不同的词形来表达的。在比方说英文对于各个词的位置有明确的规定。而很多其他综合语,诸如拉丁语中,词的位置可以不固定。换句话说就是可以说出这样的句子:Him yesterday told I。然后通过词形里的主格词形和宾格词形来判断究竟是谁告诉了谁。 这是非常糟糕的,因为在读取的时候,总是有先后的差别。我们希望的读取顺序是:先读取我们的大脑需要先处理的部分。分析语天然就有这种优势。很多综合语在逐步的发展中也确立了类似的规则,比如拉丁语的后裔之一——法语。




       总结一下。为什么大致上讲分析语优于综合语呢?因为分析语简单易懂。首先分析语不存在词形变换,因此一个词只有一个形态。学习者不需要记忆其他的变形。中文里我们从来就不需要记什么时态、宾格、阴阳词形。第二,分析语中,各个词的位置逻辑关系相对明确,在接受信息时更容易理解。更进一步讲,由于没有词形变化,分析语对于音节资源运用更加有效。英文里单音节词的资源本来就很有限,结果诸如See和Saw这样的不规则变形还要多占用一个。这就是雪上加霜了。所以英文的表达效率与逻辑性远不能和汉语相比。



      从世界范围内来看,语言都是从综合语开始,逐渐向分析语发展。



       比方说,现代法语的词形变化规则已经大大简化了。美国英语在英国英语的基础上进一步简化了词形变化。比方说Goose的复数是Geese,但是美国有很多人就用Gooses。词缀的含义逐渐单一化,特定含义针对的词形变化也逐渐单一化。各词在句子中的位置逐渐固化。我们学习英文的时候,一般都能发现,以英文现在的单词表,直接把它转化为综合语是完全可以做到的事情。那样它将更便于学习。这就是分析语对综合语的优势。



压缩存储:分析语的高超之处



      当年计算机发展到了新的时代,人们开始研究如何在计算机上存储视频文件。一开始的方案极其简单,就是把一帧一帧图像全部都存储下来。但是这无疑是低效的。因为这里面的冗余信息太多。举个简单的例子。一个夜晚的场景,画面上很多地方都是黑的。何必把每一个点的色彩反复记录呢?所以接下来的一个思路就是,不再存储每一帧图像的完整信息,而存储下一帧图像与上一帧图像之间的差异之处。两幅图像中颜色一样的部分全部跳过。



     分析语恰恰就具有这样的效果。举个简单的例子。一个人在用汉语谈论昨天发生的事情时,只需要一开始提及“下面这些事情都发生在昨天”,后面就再也不必提及时态了。而英文,则需要反复使用时态来表明这事情发生在过去。这无疑是巨大的冗余。毫无存在的必要。所以,学习汉语时,我们从来不会头疼什么“过去将来完成进行时”(Would have been doing)这么见鬼的东西。汉语直接用几个词和逻辑关系就说明了情况。



     这就是信息的压缩。这一特点使得汉语的存储更有效率。



      有的人认为分析语劣于综合语,他们是这样说的“综合语只用几个字母组成一个词缀就能表示一个特定含义,而汉语做不到”,这就比如说英语中名次尾部加s表复数。这种说法其实就是忽略了分析语的真正优势到底在哪里。



     分析语中各个词、乃至各个句子都是有机整体。如果前文说过,今天来的人有三个。那么后面还何必要提今天来的人是单数还是复数呢?分析语挤掉了语言中的冗余成分。而在单个词、单个句子中,没有多少东西会是冗余的。因此,拿出单个词、单个句子来说分析语表意效率低或者有歧义,这本身就是很可笑的。在现实生活中,孤立的词和句子永远是少数中的少数。放在更广阔的背景下,汉语作为一个分析语,其存储、传递效率要比综合语高,这是不言而喻的。


       汉语的这一优势在古代更显重要。因为古代最稀缺的是记录空间,最早人们用石碑、石板,然后用竹片、木片,最后用纸。记录空间总是很稀缺。所以就需要在狭小的空间里容纳更多的信息。表音文字在这方面就比较不利。要么就只能写较短的内容,要么,就要做书写上的妥协。比如最古老的希伯来圣经里,就不写任何元音。中国古代史学的发达,是建立在大量的文字记录的基础上的。而汉字的存储优势,对中国古代史学的发达也有相当重要的作用。



   更高的读取效率、更安全的阅读能力



       汉字由于割裂了文字与读音,实际上带来了一个新的优势。

      这是所有表音文字都不具备的。表音文字读取的时候,其本质是把看到的图像转化为声音,然后把声音转化为含义。当然读过太多的词也可以直接转化为含义,但是这是少数,不影响基本结论。而汉字读取时是直接把图像转化为含义。你会注意到你快速阅读中文文献的时候,是不会注意文字的读音的,而是直接领悟了文字的意思。表音文字就很少有这种情况。



       由于我们在读取中文的时候可以直接跳过大脑中的一个流程,这使得读取速度大为加快,而一个次要作用则是使得语言功能更加安全。也就是说,即便大脑中语音转换系统完全失灵,对我们的阅读能力影响也不大。因此,中国人得“失读症”的概率是较低的。



       所谓失读症是说一个人丧失了语言能力,面对文字,已经无法阅读。母语为表音文字的人患失读症的概率比中国人高得多。因为中国人患失读症的原因是大脑中的图像转换系统出现了问题。而表音文字使用者如果图像转换系统或者语音转换系统之中有一个出了问题,就会得失读症。


       美国人之中约有10%到20%(依标准不同)患有程度不等的失读症,而中国失读症患者则极为罕见。这也是中文阅读上的一个优势。很多国外患失读症的人医生都是建议他们学习汉语治愈。


       另外,汉字实际上是一种二维编码体系,而表音文字是一种一维编码体系。这使因为声音本身是一维的,只能沿时间轴延伸。而汉字能够在平面上沿竖直和水平两个方 向延伸,所以一个汉字往往就能代表很复杂的意思。由于图像本身就是二维的,汉字在更加充分地利用了人类的视觉系统,因此读取也就更加快速。


     因此,作为一个存储规格而言,汉字是非常优秀的。更关键地,对于文字来说,读取效率比书写效率要重要得多。这个道理其实很简单,在网络里面也适用。大家注意到现在的很多网络中,下载的极限速度要高于上传极限速度,而且一般都是高好几倍。这是因为下载数据量总是比上传高得多。



      同样,现代社会里,一个文字记录,被读取的次数一般都比书写次数多得多。更不要提大规模印刷之后,绝大多数我们看到的文字都不需要有人实际去书写。所以对于一个现代语言来说,读取速度也就比书写速度重要得多。



汉字:伟大的基础



      汉字为汉语成为世界最先进的语言提供了必要的基础。

      汉语一开始也是一种综合语。大量使用词根、词缀。但是从文字角度,汉字为汉语成为分析语提供了非常关键的基础结构。汉字天然不利于词形变化。因此,词形变化往往只能采用,在词/字后面增加一个汉字来表示。而这个增加的汉字就变成了一个通用规则。这个规则确立之后就与修饰的特定词失去了必然关系。这个变化不再视为词形变化,而被视为词与词之间的逻辑关系。比方说,中文规则里,“了”表完成。有学者认为,这是一个古老的词形变化演变出的规则。“吃/吃了”、“睡 /睡了”,“打/打了”,规则十分简单,我们学到的不是“了”变化了“吃/睡/打”,而是“了”单独表示的一个逻辑关系。这就不像 “Eat/Ate”、 “Sleep/Slept”、 “Fight/Fought”那么复杂。



      而正是由于汉字将读音与书写割裂,汉语的以不断变化,抛弃了轻音,加入了声调,抛弃了效率低下的声调,合并了相近的声调,最终形成今天的现代汉语。我们可以想象,未来汉语还会继续发展。而汉字与读音的割裂,使得在汉语语音在几千年中变化了如此之大,而我们的文化却没有多少割裂。


       更进一步地,由于汉字并不受限于读音,因此可以创造出同音异形字,进一步 扩展了汉语在发音数量多的优势。使得汉语能够更完全的利用单音节和双音节词的资源。比方说,因为读音与文字的割裂,我们可以同时拥有“攻击”和“公鸡”,两个发音完全一样但是含义毫无关系的常用双音节词。大量使用同音异形词,这在表音语言里是难以实现的。(当然英文里也有诸如See和Sea,但这实在是很少。)



      而之所以我们可以在口语中流畅运用大量的同音异形词,是因为我们的语言是一种分析语。分析语使得一个词的意思不仅仅基于词的组成部分,而同时基于这个词与其他词的逻辑关系。有时候甚至是基于与其他句子的逻辑关系。


      如果常做翻译,就会发现,我们一般可以用较短的篇幅表达英文较长篇幅才能表达的意思。这就是效率高的体现。如果读出来,那效率就更高了。


      所以我们的文字、我们的语音以及我们整个语言整体,都是有机结合在一起的。推崇汉字的拼音化或拉丁语话,都是没有看清这种密切联系。因此盲目把文字拼音化的韩国就会出那种把防水材料搞成吸水材料的笑话(韩语里“防水”和“放水”读音一致,结果建筑公司错误理解了图纸)。



汉语不够严谨?错



     有人说汉语的劣势就是不够严谨。


     这其实可以说是分析语和综合语的差异。分析语对于词的具体含义需要通过上下文确定。如果上下文给予信息不足,就有可能出现歧义。而很多时候,上下文只能表明这个词更可能是什么意思,而不能完全否定其他理解。 这虽然在交流中不会有什么问题,但是在那些防止别人钻空子的文件里就可能造成问题。


     我们举个例子:“中国绝不会首先使用核武器。”

这句话中,中国的态度,用大白话讲,就是中国与某国的战争中,中国不会在对方没有对中国使用核武器的情况下对该国使用核武器。但是上文同样可以理解为“中国与某国的战争中,中国不会在还没有对该国使用常规武器的情况下就对该国使用核武器”。谁都知道那句话其实是第一种理解,但读者并无法用那些文字来否认第二种理解。


因此,很多人认为汉语的这种不严谨性会妨碍法律条文和合同。



但是,我们可以看出,汉语要想说的严谨,也是没有问题,只不过要比一般多一些口舌而已。分析语本身的表意效率就很高。多花一些笔墨,达到严谨的效果,也是完全可以做到的。只不过要多花一些心思罢了。



汉语的熵比拉丁语系高出数倍说明汉语没有拉丁语优秀。



      说这样话的人实际上是没有明白语言熵的概念。

     ⑴熵在物理学上指热能除以温度所得的商,标志热量转化为功的程度。 

     1850年,德国物理学家鲁道夫·克劳修斯首次提出熵的概念。熵用来表示任何一种能量在空间中分布的均匀程度,能量分布得越均匀,熵就越大。一个体系的能量完全均匀分布时,这个系统的熵就达到最大值。 在一个系统中,如果听任它自然发展,那么,能量差总是倾向于消除的。让一个热物体同一个冷物体相接触,热就会以下面所说的方式流动:热物体将冷却,冷物体将变热,直到两个物体达到相同的温度为止。克劳修斯在研究卡诺热机时,根据卡诺定理得出了对任意可逆循环过程都适用的一个公式 :dS=dQ/T



     热力学第二定律的数学表述,即在隔离或绝热条件下,系统进行自发过程的方向总是熵值增大的方向,直到熵值达到最大值,此时系统达到平衡状态。 系统总是力图自发地从熵值较小的状态向熵值较大(即从有序走向无序)的状态转变,这就是隔离系统“熵值增大原理”的微观物理意义。 


⑵信息熵



     1948年,香农将统计物理中熵的概念,引申到信道通信的过程中,从而开创了”信息论“这门学科。香农定义的“熵”又被称为“香农熵” 或 “信息熵”, 即


 
移除
点击此处添加图片说明文字



     他在其著作《通信的数学理论》中提出了建立在概率统计模型上的信息度量。他把信息定义为“用来消除不确定性的东西”。

熵在信息论中的定义如下:

如果有一个系统S内存在多个事件S = {E1,...,En}, 每个事件的机率分布 P = {p1, ..., pn},则每个事件本身的讯息为

Ie = − log2pi (对数以2为底,单位是位元(bit))

Ie = − lnpi    (对数以e为底,单位是纳特/nats)


 
移除
点击此处添加图片说明文字


    世界上其他民族的语言熵都是在3-4以下。唯独汉语的熵在10以上。是其他语言的3倍之多。



     如英语有26个字母,假如每个字母在文章中出现次数平均的话,每个字母的讯息量为

I_e = -\log_2 {1\over 26} = 4.7

而汉字常用的有2500个,假如每个汉字在文章中出现次数平均的话,每个汉字的信息量为

I_e = -\log_2 {1\over 2500} = 11.3

整个系统的平均消息量为

H_s = \sum_{i=1}^n p_i I_e = -\sum_{i=1}^n p_i \log_2 p_i

这个平均消息量就是消息熵。因为和热力学中描述热力学熵的玻耳兹曼公式形式一样,所以也称为“熵”。


     如果两个系统具有同样大的消息量,如一篇用不同文字写的同一文章,由于是所有元素消息量的加和,那么中文文章应用的汉字就比英文文章使用的字母要少。所以汉字印刷的文章要比其他应用总体数量少的字母印刷的文章要短。即使一个汉字占用两个字母的空间,汉字印刷的文章也要比英文字母印刷的用纸少。



⑶.  熵的理论出发点是『能量可用于做功的程度』,『混乱度』只是熵的一种引申意义。



      本来说完1和2这个问题就应该说解释清楚了,但是针对现在对熵的普遍的认识误区还要多说两句。『熵描述系统的混乱度』是蒸汽时代对熵的物理意义的简便理解,把这个引申意义随意引申到社会领域,这是『从哲学思辨角度对物理概念随意发挥』的无良学者对相关领域的公众认知造成的最大的(负)贡献。




    在蒸汽时代,熵描述的是(处于某个温度T的)一团气体分子的热运动分布接近最概然分布的程度、也就是一团气体的『混乱度』。但是,『混乱度』并不是研究热力学的工程师和学者真正关心的——他们关心的是『不混乱的程度、也就是这团热气包含的能量可用于做功的潜力大小。这才是熵这个概念被发明出来、被使用的原因。




掌握了这个原则,所以就可以吐槽市面上各种对熵的误用了。 

    


⑷ 那么信息熵和热力学熵有什么区别和联系呢?




         首先要说的是,信息熵和热力学熵是完全不同的两个概念。它们形成于不同的理论体系中,无论含义、量纲、研究对象、作用都不相同。据我所知,目前也没有成熟的理论揭示二者有实质上的联系。

          那么为什么许多人把这两者联系在一起呢?我想最重要的原因就是二者的数学表达式实在太像了,以至于它们在数学上的性质也很类似,甚至可以把统计力学中研究热力学熵的方法直接移植到信息论中研究信息熵。但认为信息熵是一种粗粒化的热力学熵是不对的!因为信息熵的定义压根不需要在相空间里面定义,只要有事件有概率就可以定义信息熵。而且从(2)中也可以看出,香农形式的熵是比波尔兹曼形式的熵更广阔的,因为它不止适用于等概率情形。因此,正确的观点是把热力学熵视作信息熵的特例。就是说,当你考虑相空间时,你想算一下相空间各个态的信息熵,你就得到了热力学熵。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多