分享

关于98版五笔字根数量的精确统计

 莲花再生缘 2018-06-07

 一、98规范王码五笔字根的确定

9818030五笔字型键位图》是确定98版五笔字根最重要的依据,并在此基础上检查出可能遗漏的字根。

五笔字根按键位分布如下所示:

关于98版五笔字根数量的精确统计

图中有一行很小的文字,指明用深灰色表示的字根是繁体字根,可以在统计时忽略。这样,只要按照键位统计字根,就能得到准确的字根数量。

对于上图中各键位中能够用于简体字的五笔字根进行统计:

横区:G键位8个,F键位11个,D键位11个,S键位6个,A键位13个。

竖区:H键位10个,J键位10个,K键位4个,L键位10个,M键位8个。

撇区:T键位7个,R键位10个,E键位13个,W键位7个,Q键位14个。

捺区:Y键位9个,U键位14个,I键位12个,O键位8个,P键位7个。

折区:N键位15个,B键位13个,V键位9个,C键位7个,X键位10个。

说明:O键位上有一个字根,形似※,一般用于繁体字(如“鹵”),但没有绘制成深灰色,此处统计时忽略。

横区:

8+11+11+6+1349

竖区:

10+10+4+10+842

撇区:

7+10+13+7+1451

捺区:

9+14+12+8+750

折区:

15+13+9+7+1054

总计:

49+42+51+50+54246

而依据王永民提供的98版五笔字根数量为259个,比键位图中给出的246个字根还要多13个。而在实际打字中,打字者是根据从汉字中拆出的字形找字根的,若表中没有,打字就进行不下去。

我曾长期用86版五笔打字,在初用98版打字时,首先关心的是那些在86版打字时觉得难拆的汉字,到了98版,则重点看王永民如何作出改进。

比如打“年”字,86版刚开始打这个字时,就觉得拆法比较别扭,“年=气字头++十”,而98版“年=午字头+年字底”就好拆多了。

但在98版的键位图中却没有“年字底”这个字根。有人认为用“降下角”代替,但了解五笔的人都知道,五笔字根的确认并非依据“模糊相似”,而是要找出笔画依据,横、竖、撇、捺、折分别对应数字12345。“年字底”按笔画顺序的数码是1212(横竖横竖),“降下角”按笔画顺序的数码是152(横折竖),两者完全不同。

后来打“赢”字,86版的拆法又不行了,结果发现需要在Y键上增加一个“赢字头”字根。如果从字理上来分析“赢”这个字,应该将“亡、口、月、凡”组成一个大部件,变化的只是“赢”字下面中间那个部分。这可以从“赢”、“羸”、“嬴”、“蠃”、“臝”几个字看出来。而86版在拆字根时,一个“亡”字就要拆成两个字根,结果拆字根时那个部分就被忽略掉了。可见,98版的改进是一个很高明的做法。

本文的重点是统计98版五笔字根的数量,只是对与增加字根有关的汉字进行讨论。

下面再说“舆”字。86版的拆法是“舆=单立人+++八”,这个拆法也有些别扭,98版想了一个办法,就是只保留“舆”字上边两框(舆两框)部分,使成为一个字根。如此一来,“舆=舆两框+++八”,从感觉上就好多了。但是在字根键位图里,却忽略了这个字根。

我在制订《98规范王码五笔字根详细资料查询一栏表》时,一方面考虑这种必须增加字根的情况,同时也参考《现代常用字部件及部件名称规范(GF00142009)》对部件所作的规定。

比如,五笔字根中给出了字根“王”,但没有给出“斜玉”(王字旁),因在部件规范中有“斜玉”,故在表中加入。并在序号上以加“.1”的形式给出,以表示这是一个附在“王”字上的附加字根。如“王”字的序号是“1”,而“斜玉”的序号是“1.1”。

但实际情况是,有一些字根究竟应加“.1”还是按整数增加序号,并非能很容易地划清界限,于是以王永民所指定的259个字根为限,选择13个字根按整数序列增加序号,只有4个字根被指定为附加字根。

13个按整数排序的五笔字根是:

F键位:增加“年字底”;

D键位:增加“夏字头”;

H键位:增加“亅”;

J键位:增加“临字旁”;

E键位:增加“肯字底”、“舆两框”;

Q键位:增加“卬字旁”、“尔字头”

Y键位:增加“赢字头”;

U键位:增加“飞字边”、“爿”;

B键位:增加“节字底”、“及省”。

字根增加的理由如下:

1F键位有“降下角”而无“年字底”。两者在写法上不一致,不应混用。

2D键位有“丆”而无“夏字头”。两者字形差别较大,且“夏字头”是规范中的部件。

3H键位有“丨”而无“亅”。如果不单列一个“亅”字根,为何有“十”还要增加“才省”?如果不单列,有“丁”这个字根,是否打“丅”也可以用“丁”这个字根?

4J键位有“两竖”而无“临字旁”。增加“临字旁”同样出于直观的考虑。

5E键位有“月”而无“肯字底”。部件规范中有“月”也有“肯字底”(青字底),表明分开表达是合理的。

6E键位有“臼”,尽管与“舆两框”有点相似。但两者在写法上不一致,不应混用。

7Q键位有“氏字框”而无“卬字旁”。规范中“氏”视为成字部件,不再拆分;“卬字旁”不存在,而有“昂字底”作为一个独立部件。此处是否应列为整数序号,不再评述。

8Q键位有“负字头”而无“尔字头”。规范中两者皆为部件,此处列为整数序号,有其合理性。

9Y键位有“京字头”而无“赢字头”。两者在写法上不一致,不应混用。

10U键位有“两点”(冬字底)而无“飞字边”。两者在写法上不一致,不应混用。

11U键位有“将字旁”而无“爿”。有些汉字未简化,需要用到“爿”,如玄奘的“奘”字。

12B键位有“单耳”而无“节字底”。规范中两者皆为部件,此处列为整数序号,有其合理性。

13B键位有乃而无及省。两者不仅笔顺不同,折笔在笔形上也略有差异,不应混用。

 

附加字根“斜玉”已在前面说明,剩下的3个附加字根说明如下:

1S键位有“丁”而无“可字框”。规范中两者皆为部件,故按附加字根加入。“丁”的序号是“35”,“可字框”的序号是“35.1”。

2E键位有“乂”(艾字底)而无“刈字旁”。规范中并未细分,如将“区”字放到了“艾字底”的字例中。本表制订时,认为“刈”的读音刚好与“乂”相同,故按附加字根加入。“艾字底”的序号是“108”,“刈字旁”的序号是“108.1”。

3B键位有“双耳”但未分出“左双耳”与“右双耳”。规范中并未细分,如字例中有“队”也有“邦”。由于两者读音不同,且意义也不同,从学习汉字的角度上讲,有必要加以区分。本表中设置“左双耳”的序号是“224”,“右双耳”的序号是“224.1”。

说明:表中将“左双耳”标为“[]双耳”,“右双耳”标为“[]双耳”,是说明凡在表出现的有中括号( ])括出的部分,均来源于自定义的字根名。这样,一张表排下来,就能知道哪些字根名来源于汉字部件规范,哪些是自定义并可以修改的字根名。

二、造成五笔字根难以精确统计的原因

从上述分析可以看出,王永民在确定五笔字根的数量时,即考虑了字根笔画数码的一致性,也兼顾了字形上的相似性。而恰恰是字形上的相似性,难以确定一个固定的标准。

对于不熟悉五笔的初学者,也可以通过《98规范王码五笔字根详细资料查询一栏表》中的字例获知字根的应用情况。比如“办”字是独体字,98版中可以拆成“办=力+八”吗?为此,在字根“八”的字例中就给出了“办”字。

大多数的情况是,王永民在98版字根的确定上,采用了宁多勿少的策略。比如98版在字根“日”、“曰”的基础上,增加了“冒字头”,以说明“冒字头”在写法上不同于前者。而按笔画顺序,3者皆为“竖折横横”。站在打字者的角度看,“竖折横横”已能说明一切,不增加“冒字头”又如何?但若不给出,则可能误导学习者,让学习者在书写汉字时出现错误。

比如“厄”字的末笔画为竖弯钩,及至出现在“顾”字中时,竖弯钩变成了竖提。为此,王永民也特意增加了字根。再比如“己”与“改字旁”,“巳”与“民框”,“七”与“切字旁”,都是特意增加了字根。

还有一些字根,比如“丁”能否代表“可字框”?“丆”能否代表“夏字头”?“乂”能否代表“刈”字旁?“月”能否代表“肯字底”?“氏字框”能否代表“卬字旁”?“负字头”能否代表“尔字头”?“单耳”能否代表“节字底”?“队”字的双耳与“邦”字的双耳算不算一个字根?

如果太过于考虑这些因素,将这些已具备形似特征的字根也绘制到键位图上,也许会给学习者带来新的困扰。这大概是王永民在绘制键位图时的一种考量。

现通过网上资料可以查到,86版五笔字根数量为234个;98版为259个;新世纪版为226个。

我曾写过《九宫格五笔打字开讲了》的系列博文,而86版五笔字根表列出字根数只有200个左右。我根据字形上的相似性,在该讲座中给出的字根数是232个。

本次,同样是在先确定字根,再进行字根数量的统计,比王永民给出的字根数多了4个,这可能与同时参考汉字部件规范有一定的关系。

但无论如何,王永民给出的五笔字根数量,已具有相当高的可信度。

而王永民当年推出其86版五笔时,几乎所有公开资料都显示,86版五笔字根的字根数量为130个。这或许是出于一种宣传目的,也可能是只考虑字根笔画数码的一致性。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多