五笔输入法拆分的基本规则

追梦者fashion 2012-12-16

展开全文

【IT168 新手入门】1)拆分的基本规则
a．按书写顺序
　　例如：“新”字要拆分成：立、木、斤，而不能拆分成立、斤、木；“想”拆分成木、目、心，而不是木、心、目等，以保证字根序列的顺序性。
b．能散不连，能连不交
　　例如：“于”字拆分为一、十，而不能拆分为二、丨。因为后者两个字根之间的关系为交而前者是“散”。拆分时遵守“散”比“连”优先“连”比“交”优先的原则。
c．取大优先
　　保证在书写顺序下拆分成尽可能大的基本字根，使字根数目最少。所谓最大字根是指如果增加一个笔划，则不成其基本字根的字根。例如：“果”拆分为日、木；而不拆分为旦、小。
d．兼顾直观
　　例如：“自”字拆分成：丿、目；而不拆分为：白、一等，后者欠直观。
　　2)复合字编码规则
按上述原则拆分以后，按字根的多少分别处理：
a．刚好四字根，依次取该四个字根的码输入。
　　例如：“到”字拆分成“一、厶、土、刂”，则其编码为GCFJ。
b．超过四个字根，则取一、二、三、末四个字根的编码输入。
　　例如：“酸”字取“西、一、厶、文”编码为SGCT。
c．不足四个字根，加上一个末笔字型交叉识别码，若仍不足四码，则加一空格键。
3)末笔字型交叉识别码
对于不足四码的汉字，例如：“汉”字拆分成“氵、又”只有IC两个码，因此要增加一个所谓末笔字型交叉识别码Y 。
我们举个例子来说明它的必需性。例如：“汀”字拆分成“氵、丁”，编码也为IS，“沐”字拆分成“氵、木”，编码也为IS；“洒”字拆分成“氵、西”编码也为IS。这是因为“木、丁、西”三个字根都是在S键上。就这样输入，计算机无法区分它们。
为了进一步区分这些字，五笔字型编码输入法中引入一个末笔字型交叉识别码，它是由字的末笔笔划和字型信息共同构成的。
末笔笔划只有五种，字型信息只有三类，因此末笔字型交叉识别码只有15种如上表所示。