1988年,国家语委和国家教委就发布了《现代汉语常用字表》,该字表包括常用字2500个,次常用字1000个,共计3500个。根据语料统计,对200万字语料分析统计后发现,2500个常用字覆盖率竟然达到97.97%,而次常用字覆盖率为1.51%。也就是说3500个汉字的使用覆盖率达到了99.48%,其占比相当惊人。因此,我们说掌握3500字就可以做个文化人了。 但是,我们却发现字典收字却达到了惊人的地步。清代的《康熙字典》收字达到47000多个。1915年欧阳博存编写的《中华大字典》达到48000多字。1959年日本人诸桥辙次编写的《大汉和辞典》,汉字多达49964个。1971年张其昀的《中文大辞典》也达到了49888字,直逼50000字大关。到上个世纪90年代徐中舒和冷玉龙分别编写的《汉语大字典》和《中华字海》收字就超过了五万,分别是54678字和85000字,看到数字就吓出一身汗。 这些字典收字已经达到了惊人的数量,恐怕找不到一个人能完全掌握这些字。这些字典收录的字多数已经不用了,不少字只是在历史上出现过,后来再也没有露面,最后就成了只是活在字典里的汉字,我们也称为“死字”。 如今我们的常用汉字定为3500字,比较巧合的是,古代人常用的汉字也大致为这个数字。有人做过统计,统计的材料为十三经,统计结果认为先秦用字总量大概为7000字,但是通用字约为3500字。其具体统计数据如下: 《诗经》共计29646字,不重复单字为2939字。 《尚书》共计24538字,不重复单字为1938字。 《易经》共计20991字,不重复单字为1595字。 《论语》共计15918字,不重复单字为1512字。 《孟子》共计35377字,不重复单字为1959字。 《礼记》共计99008字,不重复单字为2367字。 《春秋三传》共计245838字,不重复单字为3912字。 通过统计,我们发现十三经中的著作单字数量多数在1500到3000之间。那我们现在掌握3500个汉字能阅读大部分杂志和报刊,其实现代不少经典著作的单字数量也很少超过三千的。比如: 《毛泽东选集》(1-4卷)共计659928字,不重复汉字为2981个。 矛盾《子夜》不重复单字为3129个。 老舍《骆驼祥子》不重复单字为2413个。 曹禺《雷雨》、《日出》、《北京人》所用单字为2808个。 赵树理《三里湾》不重复单字为2069个。 *参阅文献《汉字五千年》。欢迎批评,如果感兴趣,请点击订阅关注本头条号,与您相识在字里行间! |
|