分享

五笔输入法拆分的基本规则

 追梦者fashion 2012-12-16
【IT168 新手入门】1)拆分的基本规则
a.按书写顺序
  例如:“新”字要拆分成:立、木、斤,而不能拆分成立、斤、木;“想”拆分成木、目、心,而不是木、心、目等,以保证字根序列的顺序性。
b.能散不连,能连不交
  例如:“于”字拆分为一、十,而不能拆分为二、丨。因为后者两个字根之间的关系为交而前者是“散”。拆分时遵守“散”比“连”优先“连”比“交”优先的原则。
c.取大优先
  保证在书写顺序下拆分成尽可能大的基本字根,使字根数目最少。所谓最大字根是指如果增加一个笔划,则不成其基本字根的字根。例如:“果”拆分为日、木;而不拆分为旦、小。
d.兼顾直观
  例如:“自”字拆分成:丿、目; 而不拆分为:白 、一等,后者欠直观。
  2)复合字编码规则
按上述原则拆分以后,按字根的多少分别处理:
a.刚好四字根,依次取该四个字根的码输入。
  例如:“到”字拆分成“一、厶、土、刂”,则其编码为GCFJ。
b.超过四个字根,则取一、二、三、末四个字根的编码输入。
  例如:“酸”字取“西、一 、厶 、文”编码为SGCT。
c.不足四个字根,加上一个末笔字型交叉识别码,若仍不足四码,则加一空格键。
3)末笔字型交叉识别码
对于不足四码的汉字,例如:“汉”字拆分成“氵、又”只有IC两个码,因此要增加一个所谓末笔字型交叉识别码Y 。
我们举个例子来说明它的必需性。例如:“汀”字拆分成“氵、丁”,编码也为IS,“沐”字拆分成“氵、木”,编码也为IS;“洒”字拆分成“氵、西”编码也为IS。这是因为“木、丁、西”三个字根都是在S键上。就这样输入,计算机无法区分它们。
为了进一步区分这些字,五笔字型编码输入法中引入一个末笔字型交叉识别码,它是由字的末笔笔划和字型信息共同构成的。
末笔笔划只有五种,字型信息只有三类,因此末笔字型交叉识别码只有15种如上表所示。
图1
从表中可见,“汉”字的交叉识别码为Y,“字”字的交叉识虽码为F,“沐、汀、洒”的交叉识虽码分别为Y、H、G。如果字根编码和末笔交叉识别码都一样,这些汉字称重码字。对重码字只有进行选择操作,才能获得需要的汉字。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多