1 字根 五笔字根是五笔输入法的基本单元,86版使用234个字根,98版使用259个字根,新世纪版使用了226个字根。 2 取码原理 之所以叫作五笔,是将汉字笔划分为横、竖、撇、捺、折五种。把字根或码元按一定规律分布在25个字母键上(即标准的QWER键盘,不包括Z)。取码时最长四码,最短一码。 2006年12月,王永民又在此基础上,研究出用于手机输入的基于6个码元和“右手法则——前四末一”取码法的数字王码。 3 键名字 键名是指各键位左上角的黑体字根,它们是组字频度较高,而形体上又有一定代表性的字根,它们中绝大多数本身就是汉字,只要把它们所在键连击四次就可以了。如:王:11 11 11 11(GGGG) 4 成字字根 在每个键位上,除了一个键名字根外,还有数量不等的几种其它字根,它们中间的一部分其本身也是一个汉字,我们称之为成字字根。 输入方法:键名代码+首笔代码+次笔代码+末笔代码(如果该字根只有两笔画,则补空格键结束) 4.1 86版五笔字根 五笔字型输入法 - 1区横起笔 11G 王旁青头戋(兼)五一 12F 土士二干十寸雨 13D 大犬三(羊)古石厂 14S 木丁西 15A 工戈草头右框七
- 2区竖起笔 21H 目具上止卜虎皮 22J 日早两竖与虫依 23K 口与川,字根稀 24L 田甲方框四车力 25M 山由贝,下框几
- 3区撇起笔 31T 禾竹一撇双人立,反文条头共三一 32R 白手看头三二斤 33E 月彡(衫)乃用家衣底 34W 人和八,三四里 35Q 金勺缺点无尾鱼,犬旁留儿一点夕,氏无七(妻)
- 4区点起笔 41Y 言文方广在四一,高头一捺谁人去 42U 立辛两点六门疒 43I 水旁兴头小倒立 44O 火业头,四点米 45P 之字军盖道建底,摘礻(示)衤(衣)
- 5区折起笔 51N 已半巳满不出己,左框折尸心和羽 52B 子耳了也框向上 53V 女刀九臼山朝西 54C 又巴马,丢矢矣 55X 慈母无心弓和匕,幼无力
4.2 98版五笔字根 - 1区横起笔 11 G 王旁青头五夫一 12 F 土干十寸未甘雨 13 D 大犬戊其古石厂 14 S 木丁西甫一四里 15 A 工戈草头右框七
- 2区竖起笔 21 H 目上卜止虎头具 22 J 日早两竖与虫依 23 K 口中两川三个竖 24 L 田甲方框四车里 25 M 山由贝骨下框集
- 3区撇起笔 31 T 禾竹反文双人立 32 R 白斤气丘叉手提 33 E 月用力豸毛衣臼 34 W 人八登头单人几 35 Q 金夕鸟儿犭边鱼
- 4区点起笔 41 Y 言文方点谁人去 42 U 立辛六羊病门里 43 I 水族三点鳖头小 44 O 火业广鹿四点米 45 P 之字宝盖补礻衤
- 5区折起笔 51 N 已类左框心尸羽 52 B 子耳了也乃框皮 53 V 女刀九艮山西倒 54 C 又巴牛厶马失蹄 55 X 幺母贯头弓和匕
4.3 新世纪版五笔字根 - 1区横起笔 11 G 王旁青头五一提 12 F 土士二干十寸雨 13 D 大三肆头古石厂 14 S 木丁西边要无女 15 A 工戈草头右框七
- 2区竖起笔 21 H 目止具头卜虎皮 22 J 日曰两竖与虫依 23 K 口中两川三个竖 24 L 田框四车甲单底 25 M 山由贝骨下框里
- 3区撇起笔 31 T 禾竹牛旁卧人立 32 R 白斤气头叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭风头几 35 Q 金夕犭儿包头鱼
- 4区点起笔 41 Y 言文方点在四一 42 U 立带两点病门里 43 I 水边一族三点小 44 O 火变三态广二米 45 P 之字宝盖补示衣
- 5区折起笔 51 N 已类左框心尸羽 52 B 子耳了也乃齿底 53 V 女刀九巡录无水 54 C 又巴甬矣马失蹄 55 X 幺母绞丝弓三匕
5 规则 5.1 单字输入 除键名字和成字字根汉字之外的汉字,如果一个字可以取够四个字根,就全部用字根键入,只有在不足四个字根的情况下,才有必要追加识别码。 5.2 末笔字型识别码 当一个字拆不够4个码元时,它的输入编码是:先打完码元,再追加一个“末笔字型识别码”,简称“识别码”。末笔字型识别码由汉字的末笔画代码和字型代码组成。 5.3 拆分原则 5.4 词组的录入 取第一字的前两位编码和第二字的前两位编码 取第一字的第一位编码,第二位的第一位编码,第三字的前两位编码 取每一个字的第一位编码 取一、二、三、末字的第一位编码 5.5 简码字 指一些较常用字可以用一、二或三字母编码打出,分别称为一、二、三级简码 一级简码包含汉语(尤其是官方语体)最常用字中的25个,为了尽可能全面地安排最常用的汉字,部分一级简码并非是该字全码的首位。 但所有的二级或三级简码均为该字全码的前二或三位 一级简码如下,86版、98版和新世纪版通用 编码 | A
| B
| C
| D
| E | F | G | H | I | J | K | L | M | 文字
| 工 | 了 | 以 | 在
| 有
| 地
| 一
| 上
| 不
| 是
| 中
| 国
| 同
|
编码
| N
| O
| P
| Q
| R
| S
| T
| U
| V
| X
| W
| Y
| 文字 | 民
| 为
| 这
| 我
| 的
| 要
| 和
| 产
| 发
| 经 | 人 | 主
| 6 特殊键 6.1 “Z”键 由于五笔字型中,采用了五种笔划,每个字根或码元只取前两划定位它们在键盘上的位置,所以五笔字型汉字编码只用到了5×5=25个字母键。每个字的编码中都没有“Z”。后来大部分五笔输入软件都附与Z键查询功能,又叫作“万能键”或“万能学习键”。初学者可以在对某个字不确定其拆分时,使用“Z”键代替不确定的字根或码元。也有一些五笔输入法使用“Z”键来实现拼音反查五笔或符号输入功能。 6.2 “L”键 与“Z”键的用途为大多数熟知不同,“L”键在五笔编码中也有许多人不太了解的特殊用途: 6.3 单笔画字 编码方案对单笔画字的编码规定为两个单笔画字母+两个L:即一(GGLL)、丨(HHLL)、丿(TTLL)、丶(YYLL)、乙(NNLL),由于竖、撇、捺构成的字不为大多数人认识,而“一”字有一级简码(G),乙字又不常用(偶尔用到时,一般不记得正确编码的输入者常会用别的输入法代替输入),所以这一编码方案细节常被人忽略。 6.4 罕用字与常见词组的冲突 词组“劳动”与“蔻”字,如果按编码方案,其编码均为(APFC),按照一般的规定,重码时,应是单字优先,可是相比之下,“劳动”是常用词,而“蔻”字几乎不会单独出现,通常总是以词组“豆蔻”的形式出现,所以,为了方便输入、减少重码,在最终方案中蔻字的编码被强制设为(APFL) 7 版本 王永民自1983年发明五笔字型以来,共推出了三种编码方案,即86版、98版和新世纪版: - 86版也就是老式的五笔,又称4.5版。使用130个字根,可处理GB 2312汉字集中的6763个汉字。由于习惯问题,它至今仍然是拥有用户群最为巨大的编码方案。
- 98版是一种改进型的方案,其编码的科学性更强、更易于学习和使用。使用259个码元,可处理中、日、韩大字集中21003个汉字。但二者在编码原则上大同小异。
- 新世纪版于2008年1月28日推出,采用新设计的字根体系更加符合分区划位规律,更加科学易记而实用,按规范笔顺写汉字的人,取码输入更容易,可以处理27533个简繁汉字。
7.1 版本的使用情况 设计者认为,86版的字根设置不如98版和新世纪版科学。但是由于86版较先发布,且98版和新世纪版五笔字型编码的专利权尚掌握在王码公司手中,而王码公司反对其他公司在未授权的情况下开发和发行五笔字型输入法[4],因此86版五笔字型编码及相关软件的用户和输入法程序都比98版和新世纪版多。 - 从学习的角度看,有的人包括设计者在内的认为三个版本五笔相比较,86版较难学习,很多笔画多的字没有字根,导致很难拆分;也有的人认为由于86版较先发布,很多人已经掌握了86版的字根排布,很难再接受98版或新世纪版的五笔字根排布。
- 重码问题一直是困扰汉字输入法的一道难题,五笔字型一样会有重码。三个版本的重码相差不大,而新世纪版五笔在重码实用频度得到降低。
- 从字形上看,86版很多字都没有以简化字的字形出发,而以旧字形编码,造成很多字不按规则输入,形成特例字。98版已经较为改进这一类情况,使得输入此类字的时候能正确区分其左右,上下,外内等因素,但并没有根本解决此问题。
- 折的部分由于向右偏移,造成不顺手、不习惯。
- 86版过分在乎重码字,以规则去区分两个形近字,如(日与曰,未与末),但加入词组后,重码仍无法避免(尤、万、尢)。98版在修改字根排布之后较少出现这类情况。
- 86版设计的时候只适用于简化字,目前只有少数输入法支持五笔输入繁体字,而且繁体字输入在极少字根下十分困难。98版和新世纪版的更新中把一些拆分过量的字根和码元进行了集成,使之更容易支持繁体字。
8 输入软件 8.1 王码五笔输入软件 - 王码五笔型18030推出,是由于部分用户不适应98版,而又有输入更多汉字的需要而出现的。它基本延用86版的编码,而能处理中国国家的强制性标准GB 18030-2000字集的汉字,该字集可以处理27533个汉字。
- 王码大一统五笔字型输入法软件是现在的正式五笔字型输入法软件,安装包默认带有86、98和新世纪3个版本。
8.2 其它五笔输入软件 在王码五笔出现之后,又出现了许多其它的五笔输入法。由于86版编码的专利开放,它们大多采用86版的编码方式,但也有使用者个人提供98编码的码表。它们在造词等功能上加以改进,也获得了一定的用户群。这其中也有一部分是以五笔编码形式为主的输入平台,它们不仅可以以五笔方式来输入,也可以根据用 五笔字型输入法 户的需求安装不同的码表以提供其它编码的输入方式。
|