配色: 字号:
汉字录入与编辑技术(第四版)PPT 第4章
2022-10-30 | 阅:  转:  |  分享 
  
《汉字录入与编辑技术》(第四版)王式杰 邢小茹 郝 健 编第四章 其它常用汉字输入法 9
8王码是在前面几个版本“五笔字型”的基础上改进的新版本。在新版本中有了不少的变化,它修正了过去的一些观点,增加了不少字根,并能在多
种汉字库支持下进行汉字输入,从而扩大了它的适用范围。由于它确有优势,因此在这一章里,对五笔字型的这一新的版本——98王码做一介绍。
除此以外,还将介绍两种目前较为流行的汉字输入方法,一种是“二笔输入法”另一种是“郑码输入法”。采取与五笔字型输入法对比的方法对这两
种输入法做个简单的介绍。第四章 其它常用汉字输入法 4.1 98王码4.1.1 98王码简介 98王码是一套系列软件,它
是根据“形码音码双轨并行、简体繁体兼容互换、多种平台自动适配”的原则开发的。 98王码系列软件中包括98王码国标版、98王码
简繁版、98王码UCDOS版、98王码试用版和98王码多媒体自学软件等软件。共同组合成为一个系列。 98王码系列软件可以处理
多种汉字字符集,其中WM9801与WM9805用于处理国标汉字库GB2312;WM9802可以处理台湾使用的大5码(Big 5);
WM9804可以处理GBK字库;而WM9803既可以用来处理国标字库又可以用来处理大5码;WM9806既可以用来处理国标字库又可以
用来处理GBK。因此一个输入软件可以同时满足各类用户的需要,98王码能处理的汉字也比86版的五笔字型多了。第四章 其它常用汉字输
入法 98王码系列软件还可适用于多种运行环境,比如Windows 3.x 中文Windows 95、中文Windo
ws 98、中文之星、四通利方、中文Windows NT等。 98王码系列还配备有多种汉字输入方法,包括新、老版本的五笔
字型、王码智能拼音、规范五笔画、拼音笔画等多种输入法,对于不同习惯的用户几乎都可以在这里找到一种合适的输入方法。下文中所谈到的“9
8王码”主要指98王码系列软件中的五笔字型输入法,而不包括98王码中的其它输入法。 “98王码”与旧版本的“五笔字型”相比,
除了兼容旧版本的方法以外(旧版本的用户基本上可以直接使用98王码)还新增加了一些功能,这里包括动态取字造词功能、重码动态调序功能、
码表编辑功能和汉字内码转换功能等。这一些新的功能都给用户带来了更多的便利。第四章 其它常用汉字输入法 4.1.2 98王码系列
软件的基本思想 98王码在五笔字型基础上,有了许多改进。首先是认识上的改变。对于汉字的五种笔划;笔划、字根、成字等汉字结构上
的三种层次;字根间的结构关系(散、连、交);汉字的三种字型等基本观点都没有变化。但研制者提出了一个新的概念――"码元"。 "
码元"的定义:把笔画结构特征相似、笔画形态及笔画多少大致相同的笔画结构做为编码的单元,即编码的元素,简称"码元"。 这是一个
编码学上的概念,主要指笔画结构的特征。在以前的五笔字型中使用过的"字根"或"部件"实际上是文字学上的概念,在文字学中偏旁部首是有固
定的笔画结构和形状的,不同的字典中对偏旁部首(或称字根)的数量有不同的规定,但大约在170个到250个之间,有些偏旁部首的结构特征
相似,但在字典中仍规定为是两个不同的偏旁部首。而码元则只考虑笔画的结构特征,对那些形似的"字根"往往规定为同一个"码元",码元只代
表笔画的特征,而不代表笔画的具体结构和细节,它是经过抽象的字根或部件,码元和字根两者还是有区别的。文字学上的字根或部件不一定是码元
,编码时用的码元也不一定是文字学上的字根或部件,两者既有联系又有区别。第四章 其它常用汉字输入法 文字学上的字根不能随意
改动和变形,它注重细节;而在计算机的编码中的码元却只注意结构的总体形状,对于不同字根中具体细微的粗细、长短曲直的差异则不去计较,只
要它们总体形似就把它们归为同一个码元。 在这个观点下,把特征最具代表性且使用次数较多的码元叫做“主码元”简称“主元”;其余使
用次数较少且形状与主元相似的码元被称为“次码元”或称“次元”、“副元”。 在98王码中规定的主元有150个,其中包括五个单笔
画,次元有90个。所以学习98王码在记忆量(首先是码元的记忆量)上要比五笔字型(比如字根的记忆量)多一些,相对来说难度也就大了一些
。对于已经熟练掌握五笔字型的同志来说,你就把这里的“码元”叫做“字根”也无伤大雅,其实字根也好,码元也好,都不过是做为编码的提示符
号而已。 在绝大多数情况下,对一个汉字拆分出的码元顺序与它的书写顺序是一致的,当然这里包括书写时的字根顺序。但有时也有例外。
在编码时不一定能让码元的顺序与正确的笔顺完全一致,为了照顾码元的完整性和直观性,有时不得不违反了笔顺。第四章 其它常用汉字输入法
比如在书写带有大口框的汉字时,我们一般先写口框的前两笔再填入口框中的部分,最后封掉口框的最后一笔横,这是正常的笔顺。而在
编码中只能把大口框当做一个整体使用,这就变成了先将大口框封了口,再向里面填内容了,与正常笔顺出现了矛盾。例如“囚”字就只能拆分成“
口、人”两个码元,而不能拆分成“冂、人、一”三个码元。 还有一种特殊情况是码元顺序与汉字部件结构顺序不一致。比如“戚”字的码
元顺序是“戊、上、小”,而该字的规范笔顺是“厂、上、小、 、丿、丶”。第四章 其它常用汉字输入法 4.1.3 王码键盘与码元布
局 在98王码中,仍然把所有的码元安排在前25个英文字母键上,仍然把这些键位分成五个区,每个区五个键,每个键有英文字母、两位
数字和汉字等三个键名,这一切与86版五笔字型中的安排完全相同。不过现在码元比那时多了,五笔字型时共有130个字根,现在有240多个
码元,因此每个键位上的码元都有了变化。有了第三章的基础,在这里我们可以不必详细介绍了。每个键的中文键名仍然在键子的左上角,主码元都
印得较大,次码元都印得较小。每个键的区位号与英文键名仍然印在键子的下方中央。除了每个键上的码元与五笔字型时有了变化之外,其余都还是
已经熟悉的样子。第四章 其它常用汉字输入法 4.1.4 98王码与86版五笔字型的异同  98王码是一个系列软件,对于它
的拼音输入法、五笔画输入法以及其它一些内容,本书不想涉及,这里仅就它的五笔字型输入法与以前的五笔字型输入法及其相关内容做一对比。9
8王码与86五笔字型的相同或相似之处 1.98王码中基本保留了86版中的大多数字根(这里我们没有把五种基本笔画单独列出而一并
归在字根中了),不过已经以码元的身份出现而已。个别字根换了键位,去掉了一些字根。对比两个版本的字根(码元)总表,不难发现这一点。
2.对于合体字的拆分原则,在86版中是“取大优先、兼顾直观能连不交、能散不连”,而在98王码中,汉字的拆分变成了汉字的取码,
取码规则是“书写顺序、取大优先、兼顾直观、能连不交、能散不连”。新的五笔字型中增加了一些码元,因此,在原来的五笔字型中需要拆分的许
多字根,现在不用拆分了,这样使得部件的选取更加规范了。第四章 其它常用汉字输入法 3.25个中文键名及其输入方法与86版
中完全相同。 4.在86版中的“成字字根”现在叫做“成字码元”,由于98王码中码元数量多于86版五笔字型,所以成字码元数当然
也比成字字根数多,但它们的输入方法没有变化。 5.末笔字型交叉识别码的概念没有变。 6.一级简码的25个字及其输入方法
没有变化。 7.二级简码字略有变化,这是由于98王码中的码元比86五笔字型中的字根多,而且有些86版中的字根虽然保留下来了但
其键位有了变化所引起的。 8.词语的输入方法没有变化。 9.学习键Z的使用方法没有变化。 10.增加了个“补码码
元”(或称“双码码元”)的称呼。共有三个码元,使用方法与86五笔字型中的用法相同。 第四章 其它常用汉字输入法 98王码与86五
笔字型的区别 98王码是在86五笔字型经过十来年应用之后改进的新版本,那么就有一些新的内容。观点的变化在前面的章节中已经讲到
,这里主要讲解下列一些方法和效果上的创新和改革。 1.98王码比以前的五笔字型增加了不少码元。除了新增加的主要码元之外,还有
一些原来的字根变换了键位或被取消,副元中也有不少变化,这里不再一一列举。 2.98王码能处理的汉字远远多于五笔字型。它使用“
小写输入简体、大写输入繁体”的新技术。所以它不仅能处理国标汉字库中的6763个汉字,还能处理BIG5的13053个繁体字和大字符集
中的21003个字符。适用范围远大于原来的五笔字型。 3.码元的选取更加规范。由于增加了一些码元,所以原来需要拆分的一些字根
现在都可以做为一个码元使用了。98王码的码元与笔顺更趋规范。第四章 其它常用汉字输入法 4.1.5 98王码的造词功能
在98王码中设置了15000条词语,除此之外,用户还可以根据需要自行造词,或从屏幕上取字造词,所有新造的词组,系统会自动按编码规则
编制该词的正确输入码,并将其归入原来的词库,以备使用。 从屏幕上取字造词叫做"屏幕动态造词",它有"即造即用"的效果。屏幕动
态造词的方法是:在编辑屏幕上已输入的文字中,选择想造成词的字符串,用鼠标将其拖黑,然后用鼠标左键单击屏幕左下方的输入法状态窗口的"
词"按钮。刚才选取的字符串就已被做为一条新词纳入词库了。第四章 其它常用汉字输入法 4.2 二笔输入法 以前曾经介绍过汉
字输入法的大体分类,并介绍了键盘输入法中的“区位法”、“智能ABC输入法”;第三章又重点介绍了“五笔字型”输入法。这一节中向大家介
绍一种目前较有市场的新的输入方法——“二笔输入法”。4.2.1 二笔输入法简介 二笔输入法是由陈劲松先生于1992年发明的
一种音形码,原来叫阴阳码输入法。经过推广,先后获得了六个中国的博览会金奖,并于1996年获得国家发明专利,1999年正式定名为“二
笔输入法” 二笔输入法吸纳了传统的音码和形码的特点。从教育学和心理学的观点看,在学习中如能调动较多的感官来共同参与学习的过程
,也就是说能同时建立多种条件反射,学习效果会优于单独一种条件反射的效果。因此,总体讲音形码一般应优于纯音码或形码。应该说二笔输入法
就具备了这样的特点和效果。第四章 其它常用汉字输入法 4.2.2 二笔输入法的特点 二笔输入法易学,它基本不用记字根,
只要使用者能按正确的笔顺书写汉字,就有了使用二笔输入法的可能。二笔输入法在取码时主要是以拼音的首字母及汉字的初始笔画为准,对于笔画
它只考虑汉字的笔顺而不要求记住任何字根,这就为学习者提供了一种较简易的方法。一般形码还要将汉字进行逐级拆分,而二笔输入法对任何字体
都仅只一次性地将合体字拆分成两块,这种拆字方法显然也较简单。 输入速度较快是二笔输入法的第二个特点。由于它码长较短,重码率较
低,所以在同等熟练程度下,其汉字输入速度与其它方法相比显得略快。 二笔输入法的第三个特点是规范。它根据汉字的书写规律来输入汉
字,这与国内中、小学语文教学的习惯一致,易于得到认可和普及。 由于二笔输入法的方法是先输入汉字拼音的首字母,再输入汉字的某些
笔画。因此要求使用者要了解汉语拼音,这是不言而喻的第四章 其它常用汉字输入法4.2.3 二笔输入法的键盘布局 二笔输入法将
汉字分为字音和字形两部分,认为字音为“阴”字形为“阳”。又把合体字拆分为两部分,先写的一半为“阴”;后写出的一半为“阳”。因此它的
前身叫做“阴阳码”。对于汉字的发音,它把键盘上的英文字母做为汉语拼音字母对待,这点比较简单;对于汉字的书写,它把键盘上的三十个键安
排成笔画键,与拼音字母相比就稍显复杂,下面我们主要介绍笔画键。 二笔输入法认为汉字由五种基本笔画构成的。这五种笔画是:横、竖
、撇、点、折。这里也分别包括可以归入上述五种笔画之中的“提、竖勾、捺”,与五笔字型类似,二笔输入法的键盘分为六个区,前五个区分别为
横区、竖区、撇区、点区和折区,第六个区叫单笔画区。第四章 其它常用汉字输入法 与五笔字型相似,二笔输入法的每个区也安排了五
个键位,不过每个区的键位都是从左向右排列的,共使用了三十个键。这六个区的键位是这样的: 横区五个键顺序为:H(一一)、J(一
丨)、K(一丿) 、L(一丶)、:(一┐)。 竖区五个键顺序为:A(丨一)、S(丨丨)、D(丨丿)、F(丨丶)、G(丨)
。 撇区五个键顺序为:Q(丿一)、W(丿丨)、E(丿丿)、R(丿丶)、T(丿)。 点区五个键顺序为:Y(丶一)、U(
丶丨)、I(丶丿)、O(丶丶)、P(丶)。 折区五个键顺序为:N(一)、M(丨)、,(丿)、。(丶)、/()。
单笔画区五个键顺序为:Z(一)、X(丨)、C(丿)、V(丶)、B()。第四章 其它常用汉字输入法 上述前五个区中
每个键位中都安排了两个笔画(放在了上述英文键名后面的括号中),这两个笔画中左面的第一个笔画表示书写时的第一笔,右边的第二个笔画表示
书写时的第二个笔画,些笔画的摆放顺序就是实际书写的顺序。 在二笔输入法中还规定了十个字母键,分别代表十个常用汉字部首,这些汉
字部首有些也是独立的汉字。规定部首键可以保持汉字结构的完整性,输入这些部首时不必将它们再拆成单笔画,这样有利于提高输入速度,它有些
象五笔字型中每个区的第一个键。这些字母键是: Z(钅)、X(木)、C(氵)、V(土)、B(艹)、 S(日)、D
(月)、F(人)、L(口)、U(扌)。 其中第一排的五个键就是前面讲过的第六区的单笔画键,它们同时还代表着五种单笔画(横、竖
、撇、点、折)。第四章 其它常用汉字输入法 4.2.4 二笔输入法 二笔输入法将汉字分为独体字与合体字两大类,独体字指那
些不能分清上下、左右、内外结构的汉字,其余汉字称为合体字。1. 二笔输入法独体字取码规则及输入方法 先取该汉字拼音的第一个字
母为其编码的第一个码。再依该汉字的书写顺序取其第一、二两笔为该字编码的第二个码;取书写的第三、四两笔为其编码的第三个码;取书写的第
五笔为其编码的第四个码。这样每个独体字的编码为四个码,顺序为:拼音首音;第一、二笔画;第三、四笔画;第五笔画。 对于多于五个
笔画的汉字来说,因为我们的取码规则规定只取前五个笔画,所以多余的笔画自然不必再取;对于少于五个笔画的汉字,只能有多少笔画就取多少笔
画为止。也就是说有时可能不用输入四键。第四章 其它常用汉字输入法 如果在输入汉字时,不会正确地发音,将会出现第一键就无法
输入的问题;对于能够知道首音的汉字,有时也会发生对其笔顺不了解的情况。在二笔输入法中安排了一个“帮助键”——“~”键(即键盘中TA
B键上方的那个键)。无论上述哪种情况,均可用这个键来代替未知的码,键入一次该键后,屏幕提示行上将会显示一个“?”来代替30个键位中
的某个键,与其它已知的输入码组合成若干个汉字显示在提示行中供用户选择。这个键的用法相似于五笔字型中的“Z”键。如同其它汉字输入方法
一样,选择时也会用到翻页的功能,二笔输入法规定用“,”、“。”或“-”、“=”为翻页键选字或翻页的方法与其它输入法中一样。第四章
其它常用汉字输入法 2.合体字的取码与输入 二笔输入法中规定,凡能明显看出上下(含上中下)、左右(含左中右)、内外(含全包
围半包围)结构的汉字都称为合体字。我们把合体字中先书写的部分叫做“第一半”,其余部分叫做“第二半”。在区分这两半时要尽可能按照汉字
的自然结构来考虑。这两“半”在上下型或左右型汉字中十分明显,只要分别拆成上、下两半或左、右两半就对了,而对于内外型(无论是全包围还
是半包围)汉字来说,我们所说的一半指被包围的内部,另一半指外框。至于哪一半是第一半,哪一半为第二半,只按书写顺序来决定,先写的为第
一半。 合体字取码时应以该字的拼音首音为第一个码;第二码按书写顺序取该字第一半的第一、二笔;第三码取该字第二半的第一、二笔;
第四码取该字第二半的第三、四笔。第四章 其它常用汉字输入法 值得注意的是有些汉字在书写时往往先写了第一半的第一笔,在没有
写第一半的第二笔时又开始写第二半,最后才把第一半写完较多的情况发生在内外型汉字中,比如“区”字(笔顺为“一丿丶”)、“式”字(笔
顺为“一一丨一丶”)等。对于这样的字在取第二码(第一半)时不再按两个笔画取码,而只取第一半的第一笔(单笔画),第三、四码取法不变
。 无论是独体字还是合体字,取码时一定要按照正确的笔顺进行否则会产生不能正确输入预想的汉字的情况。有些同志平时书写时不太注意
,已经习惯于不正确的笔顺,要注意纠正。第四章 其它常用汉字输入法 3.词组的输入 只要学习过汉字输入的同志都知道,在输入时
尽量使用词组,会大大提高输入速度,减少击键次数。在二笔输入法中同样安排了词组的输入功能。与其它输入法相同,在二笔输入法中按词组输入
与按单字输入的最长码长相等,都是四码。两字词的取码规则与输入 输入两字词时顺序取每个字应有的前两键为输入码。 如输
入“北京”,“北”字的第一键为首音码“B”,第二键为第一半(左半边)的第一、二笔“丨一(A)”键;“京”字的第一键为首音码“J”,
第二键为第一半(上半边)的第一、二笔“丶一(Y)”键,所以输入词组“北京”时应输入“BAJY”。第四章 其它常用汉字输入法 三字
词的取码规则与输入 输入三字词时顺序取第一个字的前两键和第二、第三字的第一键为输入码。 如输入“计算机”,“计”字的第
一键为首音码“J”,第一、二笔画键为“丶(P)”键,再取第二字“算”的首音码“S”,继续取第三字“机”的首音码“J”。所以词组“
计算机”应输入“JPSJ”。 如“现代化”,应先输入“现”字的首音码“X”,再输入它的第一、二笔笔画键“一一(H)”
,接着输入“代”字的首音码“D”,最后输入“化”字的首音码“H”,即输入“XHDH”就可得到“现代化”一词。第四章 其它常用汉字
输入法 多字词的取码规则与输入 在二笔输入法中把四字以及多于四字组成的词组称为多字词。 输入多字词时应顺序取第一、二、
三字的第一键和最后一字的第一键为输入码。这个方法类似于五笔字型中多于四字的词组的输入方法。对于确实多于四个汉字组成的词组来说,输入
时要略过若干个汉字。 如输入词组“中华人民共和国”时应先输入“中”字的首音码“Z”,再输入“华”字的首音码“H”,接着输入“
人”字的首音码“R”,最后输入“国”字的首音码“G”,即顺序输入四个首音码“ZHRG”即可得到词组“中华人民共和国”。掌握汉语拼音
的同志会觉得这样的词组很好输入,实际上一直在输入音码。 又如输入词组“社会主义”时应顺序输入“SHZY”。 第四章 其它常
用汉字输入法 4.简码 如同其它输入法一样,在二笔输入法中也规定了简码的输入方法,同样也是为了提高输入速度。在二笔输入法中共
有26个一级简码字和601个二级简码字。 一级简码字 在二笔输入法中要输入一级简码字也是只需按一个英文字母键再加打一个
空格键。若按英文字母顺序则是: 安:A 不:B 产:C 的:D 而:E 分:F 个:G 和:H 有:I
就:J 可:K 了:L 们:M 你:N 偶:O 平:P 起:Q 人:R 是:S 他:T 大:U 这:
V 为:W 学:X 一:Y 在:Z 从按英文字母排序来看,这些一级简码基本上是按汉语拼音的第一个字母安排的(除“有、大
、这”三个字外),记忆起来还是有规律可循的。如果不去背下它们,那么大量使用后也会记住的。第四章 其它常用汉字输入法 二级
简码字 在二笔输入法中安排了601个二级简码字,他们是用汉字的前两码为代码,即汉字的首音码加上代表该汉字第一、第二两笔的代码
构成的。键入两键之后同样要加打空格键。 在我们输入过程中也难免会在屏幕提示行中出现多个字或词组的现象,这时就需要选字及翻页,
其方法与其它输入方法中类似,选字仍然只需按该字前面的数字键。 在二笔输入法中还安排了一些对于普通使用者来说不太常用的方法,比
如供专业人员使用的“非常规一级简码”、供完全不懂汉语拼音的同志使用的“二笔输入法的全形版”以及二笔输入法的安装等知识我们在这里不再
介绍。有兴趣的用户可以寻找专门的关于“二笔输入法”的书籍去学习。第四章 其它常用汉字输入法 4.3 郑码输入法 现在较流行
的汉字输入法中还有一种叫做“郑码”的输入法。微软的WINDOWS95中文版中就装有“郑码”输入法。它是一种形码,与常见的形码有许多
相似之处:比如它也是从汉字的结构入手;也要将汉字分解成若干部件;也要按某种规律安排键位;也要建立某种汉字的拆分规则等等。4.3.1
郑码输入法简介 郑码的思想最早来自《英华大词典》的主编郑易里教授。 他在编写英文词典的同时,对汉字的结构也做过大量的研究,
在上一世纪六十年代就曾论述过汉字由单元构成的理论,到八十年代,郑老的女儿郑珑接续了他的工作,完成了“郑码”输入法的研究。1993年
该方法通过了中国科协主持的评审会的评审,并先后获得了北京国际发明金奖和日内瓦国际发明金奖、先后获得了中国、美国和英国的专利。第四章
其它常用汉字输入法 专家评审后认为:郑码在汉字编码字符集范围、词库容量、字词平均码长、动态字重码率及符合语言文字规范等
方面都取得了突出的成绩。 发明者认为“郑码”把汉字字典检索与计算机汉字输入统一了起来,使它们具有统一的编码和统一的排序,这与
郑易里教授多年对字典的研究有关,也比较符合汉字的教学规律;郑码的编码方法对各种字符集有较强的适应性,它不但可以用来处理国标汉字字符
集,也能用于处理港、台目前通用的字符集,还可以用于中、日、韩的汉字编码,94年初郑码完成了电脑大汉字库6万个汉字输入技术的编码。
随着郑码的普及,它也拥有较多的用户,尤其在处理大字符集方面它具有较强的适用性,它的输入速度也比较快。也是一种较好的形码输入方
法。第四章 其它常用汉字输入法 4.3.2 郑码输入法的特点 郑码输入法中有许多思想与五笔字型的思想非常相似,很难说谁借鉴
了谁,总之都是发明者对中国文字做了大量研究的结果。不过因为我们在前面已经花费了较多笔墨来讲解五笔字型输入法,因此这里尽量采用对比的
方式来讲解郑码,相信读者能够用较少的时间对郑码有所理解。在郑码中对于汉字的笔画也规定为“按一定走向连续完成的一笔”,也分为五种,分
别是:横、竖、撇、点、折(也分别包括横提、向左的竖钩、捺等形近的变体);对于汉字的形成认为是分为笔画、独体字与合体字三个层次;也认
为字根是汉字形体的基础单元;郑码中的字根也分为成字字根和非成字字根两大类;也认为汉字合体字的字型可以分为左右型、上下型和包围包孕型
(这与五笔字型中的分类略有区别,实际上五笔字型中的杂合型字大部分是这里的包围包孕型);也按笔画分类分区排列键位;一个汉字(或词组)
最多也是键入四键;也有象五笔字型中的一级简码那样的高频字;也有二级简码。第四章 其它常用汉字输入法 郑码也有许多与五笔字
型不同的地方,比如它对汉字书写的笔顺要求得更细致;字根的个数更多(郑码中把组字能力强、使用次数多的字根叫做基本字根,共170个);
字型的划分更细致准确因此对不同类型汉字的拆分也更精细等等。 为了适应不同用户的需求,郑码输入法又分为《普及型》和《标准型》两
种。这两种方法所用的基本字根的分类排列规律是一致的,编码规则也没有多大的差别。《普及型》的编码规则较简单,较易学,适合于一般办公人
员或年龄偏大的用户使用,但重码略多《标准型》的编码在基本字根的代码方面略有不同,除第一主根外每个基本字根都被扩充了一个位码,减小了
重码字,并适用于超过2万字的中、日、韩国际标准汉字大字符集。第四章 其它常用汉字输入法 4.3.3 郑码输入法的键盘布局
郑码是按英文字母的顺序安排这170个基本字根的,将英文字母键盘分成了26个根区。研制者将26个英文字母按顺序分成了横起笔类、竖起笔
类、撇起笔类、点起笔类和折起笔类等五个区。每个区中所含字母(根区)个数不等,所以郑码的键盘图不象五笔字型的键盘那样具有明显的分区键
位。横起笔类中含A到H共八个字母键位竖起笔类中含I到L共四个字母键位;撇起笔类中含M到R共六个字母键位;点起笔类中含S到W共五个字
母键位;折起笔类中含X、Y、Z三个字母。分类分区的依据就是起笔的“笔形”,然后再按第二笔和第三笔的笔形排列每个区内的基本字根与英文
字母的对应顺序。具体做法是:先按使用功能将基本字根分为主根和副根,再按起笔笔形将主根和副根分为上述的五个大类(横起笔、竖起笔等)。
主根的键位确定之后,副根按自身的笔形从属于相应的主根。第四章 其它常用汉字输入法 而主根又被分为第一主根和第二主根两类,
第一主根是组字能力最强的基根,也就是下表中列在“主根”栏靠左侧的那个字根,共26个,如基根(第一主根)“一、土、王”的代码就是A、
B、C等等,他们的代码就是以代表根区的英文字母做为代码;而把排列在“主根”栏靠右侧的那个主根叫做第二主根,并非每个根区都有第二主根
。在郑码的标准型方法中,为每个第二主根又规定了一个位码D,这样第二主根就有了两个字母的代码,(叫做2码根,而相对来说第一主根就叫做
1码根)。避免了诸多基根共用一个根区代码而造成重码率高的现象。如基根(第二主根);“二”的代码就是BD;基根“三”的代码就是CD等
等。第一主根和第二主根共同提供了本区字根的笔形特征。 副根中大多数都是大家较熟悉的规范的部首。在标准型中也为每个副根规定了一
个位码,这样副根也是2码根。如副根“丁”的代码就是AI;“气”的代码就MY;“穴”的代码就是WO等等;第四章 其它常用汉字输入法
副根的第一个代码是区码,第二个代码(位码)的确定共有四种情况,分别按如下规则执行。 第一种:按副根构形中含有的主根
成分确定,如前述的“穴”中含有O区主根“八”的成分,因此它的位码安排为O。这是副根位码确定的主要方式; 第二种:按副根中含有
的笔画成分确定,如前述的“丁”中含有一笔竖钩,因此位码定为代表一笔竖的区码I; 第三种:按副根构形中含有的其它副根成分确定,
如“示”的构形中含有K区副根“小”的成分,因此位码定为K,整个代码为BK 第四种:几个特殊副根的位码需要强行记忆,如“山LL
”、“匕RR”和“已YY”。 基根采用了双符代码后可以极大地减少重码,而且基根代码的排序非常有规律,使郑码具备了字典的查字码
功能,为识字教学与计算机输入的结合创造了条件。第四章 其它常用汉字输入法 4.3.4 郑码输入法 这里主要讲解郑码的编码规
则。在郑码输入法中一个汉字或词语最多只需取四个英文字母就可输入。郑码输入某汉字的编码在不足四码时要敲空格键以表示输入编码结束。1.
单字的取码 对于单字,又可分为一基根字、二基根字和三基根字、四基根字与多基根字等几个类型来分别取码。下面分别介绍这几种情况。
一基根字 这里的一基根字当然应该是指能够独立成字的一个基根。而一基根字中又有1码根和2码根之分,如第一主根就是1码根
,第二主根就是2码根。取码时,处于起笔位置的首根代码要按实际码数取,亦即首根是几码根就取几码。首根之后的其余基根代码一般先舍去位码
,只取用区码。在《郑码标准型》中,对于这样的基根,字的编码就是基根本身的代码。但第一主根作为单字要在代码后面加打A;第二主根和副根
的代码就是单字的编码。第四章 其它常用汉字输入法   二基根字与三基根字 由两个基根构成的汉字叫二基根字,由三个基根构成的
汉字叫三基根字。对于二基根字或三基根字,只需要按书写顺序依次取各个基根的代码,即可组成该汉字的编码。因为编码不足四个,因此在输入时
要敲空格键以示结束,有时还可能要敲数字键来对重码字进行选择。在《郑码标准型》中,二基根字又可分为首根和末根是1码根字和2码根字。对
于1码根就取1码,但当两个1码根组合时要在单字的编码后要加打VV,避免与基根代码或二级简码重码。如:拓(扌D石G+VV=DGVV)
、杜(木F土B+VV=FBVV)、扒(DOVV)等对于2码根字就取2码。如:拉(扌D立SU=DSU)、波(氵V皮XI=VXI)、粟
(西FJ米UF=FJUF)、宋(WDF)。 对于三基根字,首码是1码取1码;次根只取区码1码;末根是1码取1码,是2码取2
码。如:体(亻N木F一A=NFA)、恒(忄U二BD日K=UBDK)等;如果首根是2码就取2码,此时次根和末根只取区码1码,位码舍去
。如:彩(爫PV木F彡PD=PVFP)、酚(酉FD八O刀YD=FDOY)等。第四章 其它常用汉字输入法   四基根字与多基根字
对于这种结构的汉字要依次取前三个基根的代码做为他的编码然后敲空键结束或敲数字键选择重码字。在《郑码标准型》中若首根是1码时就
取1码;再分别取其它三根的区码,舍去他们的位码。如:检(木F人OD二BDVD=FOBV)、擞(扌D米UF女ZM攵MO=DUZM)
、塌(土B日K习YT习YT=BKYY)。若首根是2码,就取2码,再分别取最末两根的区码,其余舍去。如:袱(衤WT亻 大GD丶S=W
TGS)、彰(立SU日K十ED彡PD=SUEP)等。 对于多基根字,若其首码是1码就取1码,再取第二根和最末两根的区码各一个
,其余舍去。如:榆(木F人OD一A月Q刂KD=FOQK)援(扌D爫PV一AGD又XS=DPGX)、整(木F口J夂MO一A止II=
FJAI)。若多基根字中首码是2码就取2码再取最末两根的区码各一个,其余舍去,如:赢(亡SH口J月Q贝LO凡QDA=SHLQ)、愈
(人OD一A月Q刂KD心WZ=ODKW)、辙(车HE亠S厶ZS月Q夂MO=HEQM)。第四章 其它常用汉字输入法 2.词语的取码
词语的输入或编码也要分为单音节词、二字词、三字词、四字词和多字词等几种情况进行。 单音节词 这是郑码中规定的一
个概念,其实单音节词的编码就是单字的编码,这里不再介绍。 二字词 由两个单字组成的词叫二字词。依次取词中每个单字的第一
个和第二个基根的代码做为该二字词的编码。如果组词的单字本身是个1码根,就取该基根的代码并加打A;若为2码根,就直接使用其代码,若组
词的单字本身是个高频字(一级简码)就取该高频字的代码(需要取两码时,要在其代码后加打V)。如:数量(米U女Z日K一A=UZKA)、解决(RLTX)、完整(WBFJ)、生计(MCSE)堤坝(BKBL)、集团(NFJD)、奇怪(GAUX)、技术(DEFS)等。第四章 其它常用汉字输入法 三字词 由三个单字组成的词叫三字词。顺序取第一个字的第一个基根的区码、第二个字的第一个和第二个基根的区码、第三个字的第一个基根的区码为该词的编码。若第二个字是个一基根字或高频字,只需取其第一个基根做代码,这时要敲空格键以补足四码。例如:科技馆(MDEO)、计算机(SMLF)、显示器(KBKJ)、流行病(VOIT)、微型机(OAEF)等。 四字词和多字词 由四个汉字或多于四个汉字组成的词叫做四字词或多字词。取码时只要顺序取前四个单字的第一个基根的区码为该词组的代码。如:综合利用(ZOML)、社会主义(WOSS)、电子技术(KYDF)、改革开放(YEAS)、经济工作(ZVBN)。对于多于四字的词组来说它的编码规则与四字词组编码规则完全相同。如:经济建设为中心(ZZVY)、正反两方面(APAS)、天安门广场(AWTT)、中共中央办公厅(JEJL)、关系正常化(UMAK)等。 第四章 其它常用汉字输入法 3.高频字(一级简码) 在郑码中也象其它输入法一样,安排了高频字的输入,这样做可以对常用字减少输入量,提高输入速度。在26个英文字母键上每个键位都有一个高频字。按英文字母顺序,他们是:一:A、地:B、现:C、的:D、世:E、要:F、在:G、成:H、上:I、中:J、是:K、用:L、我:M、他:N、个:O、所:P、月:Q、多:R、说:S、度:T、为:U、没:V、这:W、对:X、了:Y、发:Z。高频字的输入方法象其它输入法一样,也是敲一个英文字母键后再加打一个空格键即可。4.二级简码 象其它输入法一样,在郑码中也安排了400多个二级简码汉字。这里大多是常用字、单音节词或二字词。输入时要加打空格。5.三级简码 郑码中也安排了三级简码,覆盖了国标一级字库的80%汉字。
献花(0)
+1
(本文系籽油荃面原创)