【IT168 新手入门】1)拆分的基本规则 a.按书写顺序 例如:“新”字要拆分成:立、木、斤,而不能拆分成立、斤、木;“想”拆分成木、目、心,而不是木、心、目等,以保证字根序列的顺序性。 b.能散不连,能连不交 例如:“于”字拆分为一、十,而不能拆分为二、丨。因为后者两个字根之间的关系为交而前者是“散”。拆分时遵守“散”比“连”优先“连”比“交”优先的原则。 c.取大优先 保证在书写顺序下拆分成尽可能大的基本字根,使字根数目最少。所谓最大字根是指如果增加一个笔划,则不成其基本字根的字根。例如:“果”拆分为日、木;而不拆分为旦、小。 d.兼顾直观 例如:“自”字拆分成:丿、目; 而不拆分为:白 、一等,后者欠直观。 2)复合字编码规则 按上述原则拆分以后,按字根的多少分别处理: a.刚好四字根,依次取该四个字根的码输入。 例如:“到”字拆分成“一、厶、土、刂”,则其编码为GCFJ。 b.超过四个字根,则取一、二、三、末四个字根的编码输入。 例如:“酸”字取“西、一 、厶 、文”编码为SGCT。 c.不足四个字根,加上一个末笔字型交叉识别码,若仍不足四码,则加一空格键。 3)末笔字型交叉识别码 对于不足四码的汉字,例如:“汉”字拆分成“氵、又”只有IC两个码,因此要增加一个所谓末笔字型交叉识别码Y 。 我们举个例子来说明它的必需性。例如:“汀”字拆分成“氵、丁”,编码也为IS,“沐”字拆分成“氵、木”,编码也为IS;“洒”字拆分成“氵、西”编码也为IS。这是因为“木、丁、西”三个字根都是在S键上。就这样输入,计算机无法区分它们。 为了进一步区分这些字,五笔字型编码输入法中引入一个末笔字型交叉识别码,它是由字的末笔笔划和字型信息共同构成的。 末笔笔划只有五种,字型信息只有三类,因此末笔字型交叉识别码只有15种如上表所示。 ![]() 从表中可见,“汉”字的交叉识别码为Y,“字”字的交叉识虽码为F,“沐、汀、洒”的交叉识虽码分别为Y、H、G。如果字根编码和末笔交叉识别码都一样,这些汉字称重码字。对重码字只有进行选择操作,才能获得需要的汉字。 |
|
来自: 追梦者fashion > 《word》