分享

要学会多角度理解 文章中的有些句子

 昵称25382711 2018-12-19

  中文信息处理,是用计算机对中文(包括口语和书面语)进行转换、传输、存贮、分析等加工的科学。

  中文信息处理是一门与语言学、计算机科学、心理学、数学、控制论、信息论、声学、自动化技术等等多种学科相联系的边缘性学科。随着科学技术的发展,中文信息处理技术已经渗透到社会生活的各个层面,它包括汉字信息处理和汉语信息处理两个方面。

  汉字信息处理是中文信息处理的关键和基础,其难点是汉字编码问题。汉字编码的设计,应当从系统的角度出发,根据不同用户(专业录入员、一般用户等)的需要制定出不同的技术标准,如:输入速度、存储空间、处理效率以及掌握输入方法所需的训练时间等。并且,应由国家统一评选出几种标准的编码方案,以实现汉字编码方案的标准化。

  目前,我国已研制出了数百种汉字编码方案,其中部分方案已通过上机实验,或已被采用。除此之外,还研制出了各种汉字输入键盘、汉字字库、仿真汉字终端、汉字打印机。汉字的内码有效地解决了中西文兼容的问题;计算机激光汉字照排系统已研制成功;同时,手写体和印刷体汉字识别的研究工作已取得了一定成绩。

  汉语信息处理是汉字信息处理的进一步发展,它要在汉字输入的基础上,研究汉语的词汇、句法、语义、语境的自动处理问题,是中文信息处理的高级阶段。目前,汉语信息处理在机器翻译、汉语的人机对话和中文情报检索等方面,已经取得了一定的成果。机器翻译目前已经研制出英汉、俄汉、法汉、日汉和汉外等系统,其中有的系统已经迈向了实用化和商品化的道路。现在我国已经出现了不少研究情报检索系统的单位,并取得了一定的成果。情报检索的关键是情报检索语言的建立,词的切分问题也将直接影响情报检索系统的工作;目前,中文情报检索系统已经实用化。至于汉语的人机对话,目前还只限于书面部分,有关汉语语音的人机对话系统的研究还处于实验阶段,有的学者正在设计中文听写机,以实现汉语口语的自动听写。

  汉语信息处理,还包括言语设计、计算机辅助语言教学(编制各种语言教学软件)、语音识别、各种言语合成编辑照排系统、方言研究、修辞学研究(用系统的方法研究风格特征,并进行风格比较等)、索引、词表和词典的编制工作等。其中言语统计工作,由于自动切词的问题还没有彻底解决,所以许多统计是在人工辅助切词的基础上进行的。

  用计算机对汉语进行研究,即让计算机对各种方言特征,如声母、韵母、声调、鼻化、腭化等现象进行描写和比较。目前,我国已开始用计算机进行方言研究和绘制方言地图的工作了。

  中文信息处理技术,是自然信息处理的一个分支。它需要以大量的语言知识、背景知识为依据,对中文信息的人脑处理过程进行模拟。当前的中文信息处理系统,还处于初级阶段,许多处理过程,尤其是机器翻译、人机对话等,还需要对汉语本身进行研究,附加某些必要的选择条件和限制。例如,词汇限制,语句形式限制,语义和语境知识的限制等等。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多