分享

发现汉字编码的“准文字”

 知识是能量 2019-07-28

 著名科学家钱伟长早在1986年曾经指出:“好的编码方案还没有出来,好的编码方案应该是一种文字,或者是准文字。”

请大家先认真读懂了这句话,按照钱伟长的说法,应该存在着一种“文字”或“准文字”,大家按照这种“文字”或“准文字”打字时,就像打英文单词一样,只要按字母的顺序照打即可,无需再进行任何的编码转换。如今,30年过去了,钱伟长企盼的这种“文字”或“准文字”是否已经出现了呢?

在读到钱伟长先生的这种说法之前,我一直在为一个问题而陷入百思不得其解之中,那就是如何才能较好地表达九宫格下打五笔的击键路径问题。

幸好偶然间在网上读到了一篇文章,其中就有我上面引用的钱伟长的那句话。当我反复思索“准文字”究竟应该是个什么样子时,某日,终于灵感发作,我觉得我发现了汉字编码的“准文字”。

我前天写了一篇博文,没有大张旗鼓地说我发现了“准文字”,而是先把图画下来,告诉大家如何将九宫格下打五笔的汉字编码以九宫格图表达出来。下图就是在上一篇博文中给50个汉字所做的可视化图形表达,把汉字移到九宫格外,九宫络内显示的就是那个汉字编码的“准文字”了。

发现汉字编码的“准文字”

比如在第一个九宫格内,可以看到一个“收”字,一个“一”和一个“丨”。如果按照我当初表达击键路径的设想,图中应该是以“一”那个位置为起点,画一条线到“丨”的位置,然后还必须表明何处为起点,何处为终点。再比如最后一个九宫格内,可以看到一个“火”和一个“米”字图形,如果按照我当初表达击键路径的设想,要在“米”字位置连击4次,才能打出“火”字来,那击键路径根本就画不出来。可见,想要以击键路径来表达打字过程,以静态图形表达是很困难的。

但有了“准文字”的想法,就变成了如何在九宫格上表达编码,同时还能表达击键的顺序。这样,汉字中最基本的4个笔形“一”、“丨”、“丿”、“乀”就派上了用场。

现在,大家应该可以看明白了,九宫格代表的就是打字时的虚拟键盘,先在有“一”的位置点击,再在有“丨”的位置点击,余下类推,到所有笔形打完后,就可以在选字区看到想要打的汉字了。

有人说,你这算“准文字”吗?

我说,这当然算“准文字”,因为它具有“准文字”的全部特征,条件是不要离开九宫格。

有人说,你讲这个有什么用呢?

我说,这件事对成年人也许没什么用,但对幼儿学认字、学打字可不知道简单了多少倍。

长期以来,小学生学汉字依据的是汉语拼音,在掌握汉语拼音之前,幼儿的汉字识字教学只能通过读短诗或看图片一类,要实现写汉字的教学是很困难的。

而如果汉字有了“准文字”呢?情况就大不一样了。幼儿在学会“准文字”的同时,也能够将字打出来,学习汉字的效率也将大大提高。

也有人会提出,有那么多运用九宫格输入汉字的输入法,你为何要单选百度手机输入法呢?

因为,我已亲自验证这个输入法很好用,打字速度也很快。或许是如钱伟长30年前所说“好的编码方案还没有出来”,或许是好的编码方案我还没有见到,但这毕竟是一款可以立即安装使用的输入法软件。

为了能在幼儿的汉字教学中推广这种学认字、学打字的方法,首先应使幼儿教师的语言学教学,不只是学习拼音输入法,也要适当增加形码输入法教学,从而改善幼儿园教学的外部环境。

有关“准文字”的话题,应该还有许多可讨论之处,今天就写到这里吧!但我相信,如果这个发现能够被更多汉文字学家所认识,其所产生的推动幼儿汉语教学革命,将是具有历史意义的。

 

附:钱伟长生平简介

钱伟长(1912.10.9—2010.7.30),江苏无锡人,世界著名科学家教育家,杰出的社会活动家

1931年考入清华大学,1942年获多伦多大学博士学位。19465月,钱伟长回国,应聘为清华大学机械系教授,兼北京大学、燕京大学教授。中国人民政治协商会议第六至第九届全国委员会副主席,中国民主同盟第五届、六届、七届中央委员会副主席,第七届、八届、九届名誉主席。曾任上海大学校长,南京大学暨南大学南京航空航天大学江南大学名誉校长、扬州大学名誉董事长、耀华中学名誉校长。

1984年,他提出汉字宏观字形编码,简称“钱码”。

1986年,在国家标准局组织的全国第一届汉字输入方案评测会上,在34种方案中,“钱码”被评为A类方案。

钱伟长从大学起,就坚持体育锻炼。在清华期间,已经是大学足球队的主力左前锋。1937年,入选中国国家足球队队并参加了在菲律宾举行的远东运动会。古稀之年的钱伟长以长跑作为锻炼形式。九十岁后,依然坚持每天步行三千步。

通过攻关,钱伟长发现汉字可以宏观识别,无须字字笔画明察,可以望文生义。于是他于1984年提出了宏观字形部件编码法即“钱氏汉字电脑输入法”,对在电脑中应用汉字输入法有开山之功。

平时人们经常是近似地、模糊地捕捉字形部件特征来读音辨义。“钱码”以汉字的宏观字形部件编码,则把151种基本部件按形状相似、相近归类,定义在39个键位上。例如,把“其、耳、且、目、自、白、臼、贝、见、页”等部件编为一码,便于联想。“钱码”允许重码,其字频最高的字直接跳入文本,其他同码字按常用字频排列于下,可供选择。使得码长缩短,效率提高。一个汉字最多选3个字形部件完成编码,有39个最常用字一键为码。且“钱码”具有容错能力,很多汉字可以采用不同的分割方式,来适应各人理解上的差异,记忆量少,易学易用。

“钱码”的词组输入方式也是早期开创性工作。钱老设计宏观码作出了部件定义,虽然没有进一步阐释,但为人们对部件的深入研究奠定了基础。这是因为汉字编码的困难根本在于“部件的处理”。表形码之所以首先抓个部件定义的牛鼻子,正是因为陈爱文先生探索和总结了编码设计的历史经验,看出了汉字编码设计发展的症结。对钱老的部件定义作出了具体的、明确的阐释后才得到了部件清单。部件清单使表形码获得突破,使编码方案的基本材料从主观“优选”的“围墙”里摆脱出来,并开始了对汉字字形规律的探究。

钱伟长语录

  ——我不是党员,不过我还是拿党的事业作为我的终生事业。为了我们的民族,我们个人吃点亏不要后悔,不值得后悔。

  ——我一辈子就是这样,所以有人说我不务正业,今天干这个,明天又干那个。我说我是看国家哪方面需要我,我就力所能及地去干。我的基础好一点,有这个能力可以这样做。

  ——我可以临时开一个题目,保证三个月内就可以开展。我会查资料,看书也快,今天干完这个,明天就可转到另外一个题目去。我的题目很杂,什么都有,因此有人说我是“万能科学家”。其实不是万能,不过我会去学一类东西,我会看人家的东西,看懂了我自己能下结论,并在这个基础上再做下去。我懂得爬在人家肩膀上,我要永远爬在人家肩膀上。

  ——我不是天才,我的学习是非常勤奋的,我发现很多东西我还不懂,需要,我就学。你们不要相信天才论,关键是在于刻苦和努力。没有学不会的东西,问题在于你肯不肯学,敢不敢学。

  ——什么是应试教育?就是学校忙于应付考试,小学应付考中学,中学应付考大学。现在的考试非常刻板,数理化都是硬碰硬的,差一分就落选,家长就要交许多钱。搞到最后,成了哪个学校升学率高的,那个学校就是好学校。仅就智育而言,这也是片面的。

  ——学校体育很重要。好处之一是自身健康,另外运动也可以培养人,培养人的分析能力、决策能力。


 

重要说明:当我开始写《九宫格五笔打字开讲了》的系列文章时,已对准文字的表达形式做了全面改进,此文中的图看上去太原始了。研究者若有兴趣,可从第29讲开始看起,那里有比较详细的说明。

我的新浪博客网址:http://blog.sina.com.cn/lizhanjun194902

直接点击该网址,即可搜索相关文章。

作者:2016/8/21

  

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多