分享

翡翠宝石文玩文化知识第72期:汉字的维基百科知识(中)

 RK588 2016-06-16

教你学习翡翠知识:醉石山房---丹妮寄售服务平台

 

个人微信号:wyggzs

 

汉字的维基百科知识(中)(第72期)


汉字的特点


汉字的特点有以下几项:

1.  字根组字:以本身即有意义的869个声母及265个形母的象形、指事字为最基本字根部件,称为「字源」,通常为独体字,例如「日」、「月」,可组成各种复合部件(如「明」,可再堆栈组合成汉字盟、萌、曌等字)、以及一般认知的字(「明」本身就是一个字)。《参考汉字的字形与编码第三页

2.  表意:承上,字根本身表义,多个字根合成新义,且空间的配置对字义有影响。(朱邦复先生的字易即是探讨此)

3.  相容并蓄:各语言、各领域应用可以六书基本规则,可贴近自身领域、地域所需组出所需要之字。

4.  书同文:汉字本身不完全表音,不同方言、语言之间,仍可书同文,以文意、字义来互相了解。

5.  独有的文化如对联书法艺术等。

6.  任意排列:因为汉字属表意文字,故汉字可由上而下、由右而左、由左而右排列,不像其他表音文字只能固定一个方向读。


汉字是「表意文字」的一点见解:

1.  任何口语均是以音节表达意义,文字是口语(语言)的书写符号,而最少的音义结合体就是语素,汉字可说是音节兼语素的纪录符号。早期的汉字(如甲骨文、金文、篆书等)是以各种特定的表意符号表现语义(语素),可说是一个文字符号纪录一个语素的意义,即因义而构形。阅读这些文字可从字的形态上掌握意义,以此而说汉字是「表意文字」是可成立的。然而,在早期汉字经隶定后,已再非如此,汉字已被线条化、简化了。早期汉字已渐成造新字的基本部件,即现占汉字约百分之九十以上的形声构形字,由于这些字有着早期汉字的基本作部件,可以此而猜测词义,可是这些字的形体并不能完整、直接地表达语素的意义,所以不宜就此把汉字定为是「表意文字」。

 

汉字的语文知识


摘录自1436年启蒙读物的汉字








进化的象形文字


「永」字八法


构造原理

六书是汉字组字的基本原理,在周礼中就有提到了六书,只是没有说明具体内容。到了东汉,许慎在《说文解字》中,详细阐述了「六书」这个汉字构造原理:象形指事会意形声转注假借


象形

这种造字法是依照物体的外貌特征来描绘出来,所谓「画成其物,随体诘诎」是也。如日、月、山、水等四个字,最早就是描绘日、月、山、水之图案,后来逐渐演化变成现在的造型。


指事

这是指表现抽象事情的方法,所谓「各指其事以为之」是也。如人在其上写作「上」,人在其下写作「下」,有人称为抽象的象形。


会意

这个造字法,是将两个字根组合起来,使衍生出新的含意。如「日」和「月」组起来,就是日光加月光变成「明」。「人」字和「言」字合成「信」字,意思就是人过去所言;有信,就是这个人都很遵守自己说过的话。


形声

此乃文字内以特定形状(字根)表特有的音。例如:胡,这个字也可为一个声符,结合不同的属性部件,表不同意义如蝴、湖、葫、瑚、醐等,而以同样的发音元素(也有的是完全同音),表达不同的事物。但形声字,也因古今语言音韵变迁,不少古代同类形声字在今天的官话已无共同音素了,如过、蜗。


转注

这是用于两个字互为注释,彼此同义而不同形,汉代许慎解释道:「建类一首,同意相受,考、老是也。」此二字,古时「考」可作「长寿」讲,「老」、「考」相通,意义一致,即所谓「老者考也,考者老也」。诗经的《大雅·棫朴》亦云:「周王寿考。」。苏轼的《屈原塔诗》也有「古人谁不死,何必较考折。」一语。其中的「「考」皆「老」意,特别注意的是,后代的文字学家针对许慎的前述的定义也作了大量的解释。其中包括「形转说、声转说、义转说」三类,只是这三种说法有人认为不够全面,当代古文字家林沄先生也有解释说「转注」就是一个形体(字根)记录两个读音和意义完全不同的两个词。例如「帚和妇」与甲骨文中的「母和女」等等。


假借

这法简言之,借用一字,去表达别的事物。一般来说,是有一个无法描述的新事物,就借用一个发音接近或是属性近似的字根,来表达这个新事物。例如:「又」,本来是指右手(最早可见于甲骨文),但后来被假借当作别的意思。闻,本意是用耳朵听东西的意思。例如《大学?第七章》中有「视而不见,听而不闻,食而不知其味」,但后来被假借成嗅觉的动词(不过也有人认为这是错用)。 (其中「转注」「假借」两项的意义,至今争讼不休,尚无令人满意的说法。)

总结以上古代六书,前两项,「造字法」也;中两项,「组字法」也;后两项,「用字法」也。这六个原理,是古代文字学学者归纳出来的字学理论。其所含汉字构成法则,是长期演化而成的,不是任何一个人独创的。


重新解构

汉字字源:当代新说文解字》中,否定了许慎指形声字占八成以上的理据,认为许慎只以小篆籀文作参考,而不了解甲骨文。而该书则以甲骨文作为汉字源头,重新解释汉字,认为会意字占汉字数量八成以上,也不存在「会意兼形声」的造字方法。以会意的角度分析「形声字」,结果所谓形声字的声旁完全具有表意作用,认为古人造字大有讲究。如「蜥」字指栖于树上又能断开的蛇,「蟋」指知悉并引申为有规律之爬虫,「蜥」与「蟋」却不可互换,可见未有加部首时,正是以会意造字。

认定造字方式为象形示意指事会意形声记号六种,其中出现两种新造字方法示意记号


示意

示意,即用示意图表示字义。用图形表示特征、抽象事物、事件过程等,例如「用」为打井的示意图,引申出使用之意,组成「甫」、「甬」、「周」等字。以此方法可解释更多汉字起源。


记号

记号则是由残缺不全的字符或没有具体意义的字组成。如「由」字由「胄」简化而来,「胄」又由「胤」简化而来,「胤」解作子孙传承,因此「由」有源由、来由等字义。


特点

1.  单一字内就有很高的讯息密度,在表达同样的事物时,可比表音文字用更短的篇幅表达同样的讯息,而且更为精密,鲜需依赖前后文的情境理解某字含意(此指传统字而言,不适当的简化字有跟表音文字一样的问题),所以汉字的阅读效率很高。

2.  所有汉字乃由1134个字母为基本字根,如金、木、水、火、土、爻、又、心、攵、乂、弋等,像积木一样组合而成。以意念的联结组合各种成各式各样的字,表达各种意涵。

3.  如不认识一字之意,可拆字,从组成字根以及空间的配置推断出其字义。当时代演进出现新事物,难以词的方式来表达或是缺乏效率时,也能以字根组合原则,合成出新字来用,例如:字,就是近代为了表达新发现的化学元素而新造的字。

4.  汉字组成的字根空间配置对字义有影响:如同样是「心跟亡」的合体,左右排是「忙」,上下排是「忘」,排列不同,导致不同涵义;文字右边有「乂」这个字的字根,这表示右手(手的左偏旁表示左手)持某物进行某事(金文、甲骨文考古的发现),如果右手拿斧头就变成「攵」,有这个字根的,字本义几乎都是有针对性武力的使用或强制维护一个秩序相关的事物,例如攻、败、收、散、政、牧、敕、赦、放等字,跟一个秩序的建立消灭、维持有关。

字形


「龟」字的笔画与笔顺


「人」字的笔画与笔顺


「王」字的笔画与笔顺


       汉字有各种不同的书写方式,即有不同的字体;不同的字体,汉字的字体形状不一样。就算是同样的字体,也会因使用地区或使用者的不同而有字形上的差异。由于各地对字形的使用并没有统一,加之大陆地区使用“新字形”、日本使用“新字体”,便产生了许多差异。例如“刃”及“角”,在各地写法都不尽相同。又如“口”字,台湾官方规定最后一横要写得超过上面的横折露出来一点,其他地区的写法却是不出头的(注意右图“启”字的口部)。

       规整的字体(如:楷书宋体隶书篆书等)书写下的汉字是一种方块字,每个字占据同样的空间。汉字包括独体字合体字独体字不能分割,如「文」、「中」等;合体字由基础部件组合构成,占了汉字的90%以上。合体字的常见组合方式有:上下结构,如:「笑」、「尖」;左右结构,如:「词」、「科」;半包围结构,如:「同」、「趋」;全包围结构,如:「团」、「回」;复合结构,如:「赢」、「斑」等。汉字的基末级部件(或称基础部件)包括独体字、偏旁部首和其他非字部件。

所谓的「文字」,古代是两个东西,东汉许慎《说文解字》叙:「仓颉之初作书,盖依类象形,故为之文,其后形声相益,即谓之字。」;宋郑樵《象类书》云:「独体为文,合体为字」。这个,现代的术语叫作字根部件,汉字是以意念的表达需要组合所需部件于一方块,合成千千万万的字。

郑樵的搜集,以形为主的文有三百三十个,称为形母,以声为主的文共有八百七十个,称为声母,合计一千二百文。

但郑樵的声母形母已经失传,近代周何教授依据中文信息交换码(CCCII)第二集的22394字的字集重新整理的结果,得出汉字有869个声母及265个形母,共计1134个。形母:郑樵的搜集,有三百三十个。现代的研究整理,是265个。声母:郑樵的搜集,有八百七十个。现代的研究整理,是869个。

末级部件,再行拆解,即为汉字的最小构成单位:笔画。汉字的笔画离不开「」、「」、「」、「」、「」、「」这六种基本笔画,另外还有「」。以书法为例,对各种笔画都有多种不同写法,尤其以折的变化最多。

书写汉字时,笔画的走向和出现的先后次序,即「笔顺」,是比较固定的。基本规则是,从上到下,从左到右,先横后竖,先撇后捺,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。


各地字差异


以下举出几个各地字差异:

中国大陆

台湾

日本

南北韩

香港



读音

汉字是多种语言的共同书写体系,每个字代表一个音节或数个音节(视语言而定)。此外念法上在日语以及各汉语中,读音有「音读」和「训读」之分。

·        汉语

       上古汉语,曾存在一个汉字多个音节的情况。从中古以降(以切韵及广韵音系为代表)开始减为一字一音节。现代标准汉语中,皆由一个声母、一个韵母声调确定,实际用到1300多个音节。由于汉字数目庞大,因而有明显的同音字现象;同时还有一字多音的情形,称为多音字或多音字。这一情况与各种汉语方言是普遍一致。而其他少数民族借汉字表音时,也有存在一字多音节的情况。

·        朝鲜语

       汉字大致为一字一种发音,存在训读,但现今已不常用。

·        日语

       在汉字的发音上,有着多音节,如こく)、にく),也有单音节如空気(空气)的気(き,Ki,此外有许多字因训读、音读,在不同状况,发不同音的情形。

除了日本以外,其他汉字使用地区仍有少数字使用多音节字,如「浬」(海里)、「嗧」(加仑)、「瓩」(千瓦)、吋(英寸)、哩(英里)等。台湾官方机构或民间均普遍使用,在大陆地区由于官方废除已不使用,但一般人也理解其意思。


注音

最早的注音方法是读若法直注法。读若法就是用音近的字来注音,许慎的说文解字就采用这种注音方法,如「埻,射臬也,读若准」。直注法就是用另一个汉字来表明这个汉字的读音,如「女为说己者容」中,使用「说者曰悦」来进行注音。

以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以发挥注音的作用,例如「袜音韈」等。

魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以透过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如「练,朗甸切」,即「练」的发音是「朗」的声母与「甸」的韵母及声调所拼成。

近代以来,又发展出了仿汉字形式的注音符号及众多拉丁化拼音方式。注音符号一直都是台湾官方教学的一部分,学生在学习汉字前先要求必需掌握。而目前中国大陆最为广泛使用的是汉语拼音

由于汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方世界一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度,必须进行专门的汉语音韵学才能推测它们在上古汉语中古汉语的发音。例如「庞」从「龙」而得声,但今日北京话前者读「páng」(ㄆㄤˊ),后者为「lóng」(ㄌㄨㄥˊ)。

潘悟云和法国学者沙加尔认为:汉朝之前,某些汉字可能代表着两个音节以上的发音,即这些字具有次要音节和主要音节。详见上古汉语

付鼓认为:一、丨、丿、丶四个方向的笔划是汉字的组件,每一划可表现为一元音,是为汉语基础四元音。


汉字与词语

汉字是汉文组成的最小单位,大半可作单字词独立表义。随着语言发展,也出现了不少两字或多字词语,近代白话尤多,大致可分为三类:

·        同义复词:「遭遇」、「学习」(两字同义)

·        反义复词:「胜败」乃兵家常事(两字反义,两个意思都保留)

·        偏义复词:毫无「动静」(两字反义,只保留「动」义)

不过,准确掌握其复杂的形式和用法也成为了学习汉语的一种负担。汉语中的常用词汇约几万条,总词汇量更有上百万条,数量的庞大可能使人却步。

在古文而言,使用单字比使用词语来得精确且有效率,例如朱邦复先生就提倡精确使用「字」的复古作为。


汉字的数量

汉字由于是开放集合,数量并没有准确数字,日常所使用的汉字约为几千字。汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。

近代编集的字典收字量更高,如清朝的《康熙字典》收字47035个;台湾的《中文大字典》收字49905个;大陆的《汉语大字典》收字54678个;最新的《中华字海》收字85568个,包含了《汉语大字典》、《中文大字典》、《康熙字典》和《说文解字》的所有收字;日本的《大汉和字典》收字48902个,另有附录1062个。21世纪已出版的字数最多的是日本《今昔文字镜》,收字17万个。

20世纪所新创的,还有第一批简化字后跟第二批的「二简字」,其中也包括社会上不少人造的文字,不过二简字已被大陆官方废除,只有少数字在社会上流行,但现时并没有于计算器编码中被收录。

在汉字计算器编码标准中,目前最大的汉字编码是台湾的国家标准CNS11643,目前(4.0)共收录可考证之正简、日、韩语汉字共76,067个,在户政系统等官方机构普遍使用。台湾及港澳地区民间通用的大五码收录正体汉字13053个。GB 18030是中华人民共和国现时最新的内码字集,总共收录70244个汉字;GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB2312收录简体汉字6763个。而Unicode中日韩统一表意文字基本字集则收录汉字20902个,另有四个扩展区,总数亦高达七万多字。

初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。过去在汉字组成基本因子(前述字根部件)研究与教学上落后,造成学习上必须逐字学习难以举一反三,汉字数量越多学习越困难,组建新字的风气日趋保守,也没有相应的信息处理技术,于是有许多单一的汉语意义是以词表示,例如常见的双字词,所以近代书写的发展多朝向造新词而非造新字。


汉字字位数量

汉字字位(或者叫“字素”、“字种”)是指将同一个字的不同写法(繁体字、简体字、二简字、正体字、异体字、新字形、旧字形、讹字、缺笔字等)计算为同一个字,而不是分别计算为不同的字。例如:“够」和“够」被视为同一个汉字的不同字位变体,而不是两个汉字。这一计算方法与英文类似,A与a写法不同,但只是一个字母,英语一共26个字母,而不是52个。

根据统计,汉字字位数量大致在26500左右。后来编纂的字典所收的字越来越多,实际上增加的绝大多数是字位变体而不是字位。收字42174个的《康熙字典》仅仅比收字85568个的《中华字海》少1000个左右的字位。


常用字

中国大陆

国家语言文字工作委员会于1988年颁布的《现代汉语常用字表》收录3,500字(2,500个常用字,1,000个次常用字),适用于中国大陆

2007年中国语言生活状况报告里,在10.07亿汉字的语料上,进行汉字使用情况数据调查,结果为:595字数的覆盖率达到80%,964字数的覆盖率达到90%,2394字数的覆盖率达到99%。[19]

山西大学计算器科学系受国家语言文字工作委员会委托,抽样统计200万字的材料,检测《现代汉语常用字表》收字的使用频率。结果是:2,500常用字覆盖率达97.97%,1,000次常用字覆盖率达98.49%,合计共3,500字覆盖率达99.48%。


香港

香港教育署于2000年颁布的《常用字字形表》收录4,759字,适用于香港


台湾

1979年,中华民国教育部颁布的《常用国字标准字体表》收录4,808字,适用于台湾


日本

日本内阁于1946年颁布《当用汉字》,收录1,850汉字;文部省国语审议会(今文部科学省文化审议会)于1981年颁布《常用汉字》,收录1,945汉字,取代《当用汉字》。依《常用汉字》,1006个汉字在小学教授,939个在中学中教授,共计1,945个。2010年11月30日追加196个新的常用汉字,并削除5个汉字,合计共2,136字。

自1975年,日本汉字能力检定协会推出日本汉字能力检定,测试日本人对汉字的掌握。直至2007年,共2,716,711人考核。成绩分为12级,由最高至最低排列分别为:1级、准1级、2级、准2级、3级、4级、5级、6级、7级、8级、9级、10级。


大韩民国

汉文教育用基础汉字是韩国教育中规定的标准汉字,皆为与繁体字大致相同的韩文汉字。于1972年8月16日公布,数量约1,800字,在中高等院校进行普及。


笔画最少与最多的汉字

最简单的汉字只有一笔画,但却不止一个字:除了「一」字以外,「乙」、「〇」、「丨」、「亅」、「丿」等都是汉字,而且都有各自的读音。


      
目前已知笔画最多的汉字,应当是日本汉字「见上图」,由3个「龙」字和3个「云」个组合而成,共有84划,这个字收录于日本的TRON计划内。在编码上曾提交到当时的扩展C区,编号为JMK66147,后因扩展C区的时间原因被安排到了扩展D区,之后因找不到合适证据被撤销。


中文汉字中,笔画最多的汉字可能是“见上图”,其不同写法的笔画数在54至71画之间不等。被传统辞典收录的笔画最多的汉字为《字汇补》、《汉语大字典》中由四个“龙”字组成的「??」字,共64画;同样属于64划的字由四个“兴”字组成的“??”字,收入自《中文大辞典》;之后的是由四个「雷」字组成的“?”字,有52划,收录于《说文解字》。


教你学习翡翠知识:醉石山房---丹妮寄售服务平台

 

个人微信号:wyggzs

感谢您的阅读

醉石山房

坚持分享传统玉文化故事

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多