分享

“汉字全息资源应用系统”来了!

 Purefact 2019-01-17

2019年1月11日,教育“奋进之笔”行动、国家语委重大基础资源建设项目“通用汉字全息数据库建设”的标志性成果——“汉字全息资源应用系统”发布会在北京师范大学举行。教育部语言文字信息管理司、北京师范大学等相关单位负责人,学界和媒体代表等参加发布会。


会议现场(主办方供图)

 

开展通用汉字全息数据库建设,是贯彻落实《国家语言文字事业“十三五”发展规划》,推进语言文字信息化建设的重要举措。该项目由北京师范大学中国文字整理与规范研究中心、汉字研究与现代应用实验室负责实施,历时3年建设形成重要成果“汉字全息资源应用系统”并供社会使用。

 

发布会上,项目主持人、北京师范大学王立军教授介绍了汉字全息资源应用系统的研发背景、意义,研发团队构成等基本情况,概括了该系统在内部设计、外在表现方面的特点,并展望了系统的应用前景。

 

王立军教授发言(主办方供图)

 

“汉字全息资源应用系统”是什么

“汉字全息资源应用系统”是在新型汉字理论的指导下,充分运用当前的数据库技术、信息挖掘技术等现代化手段,对海量的汉字信息资源进行有机整合,从形、音、义、用、码五大维度,较为全面地呈现古今汉字的属性体系,构建出一个科学、系统、实用的汉字全息资源应用平台。

 

系统界面(主办方供图)

 

“汉字全息资源应用系统”中有什么

此次上线的系统提供了丰富的汉字多维属性资源,包括图形信息资源和文本信息资源,分别来自古文字拓片、文字编、历代辞书、规范字表、编码字符集、经典文献、中小学语文教材等。可谓把古今常用汉字相关知识“一网打尽”。


来感受一下目前系统提供的资源:

★  字符集:4种,共计81,722字;其中通用规范字8,105字,古籍印刷字16,490字,历代汉字16,489字;

★  辞书:20种,结构化数据494,615条,扫描图片数量91,442面;

★  古籍文献:60种,提取用例1,364,375条,共计34,793,090字;

★  历代字形图:415,675个。


“汉字全息资源应用系统”有何特色

 

系统内部设计特点(主办方供图)

 

系统外在表现特点(主办方供图)

 

此外,作为信息化时代的研究成果,该系统采取深层和表层两级结构模式,使纷繁复杂的汉字属性信息有条不紊地展示出来。系统所开发的深层系联工具,可以深入揭示汉字之间的复杂关系;汉字演变动画模块,直观形象地展现出汉字从古到今的演化过程。


“汉字全息资源应用系统”能干啥

★  基础教育及汉语国际教育领域的教学平台

★  汉语言文字学领域专家学者的科研平台

★  汉字类数字化产品的开发平台

★  国内外文化爱好者的学习平台


如此“高大上”的系统怎么用?王立军教授对此作了详细演示。

“在搜索栏输入一个字,例如‘中国’的‘国’,点击检索后,系统不仅可以显示其古今字形的演变、字义条目,还可以查到其在一些常用古籍文献中被使用的情况。比如在《史记》中它出现了多少次。”“再比如,想看‘典’字的字形演变,在历代字型检索模块输入这个字,就可以看到一段一分钟左右的动画,形象展示了‘典’从甲骨文、金文直到现代宋体的书写形式演变。”他介绍道。

 

“典”字形演变动画(系统截图)

 

该项目的成功建设,需要先进的理念支撑。北京师范大学资深教授王宁代表设计团队和制作团队,介绍了项目设计的三个主要理念。一是属性的分解。团队在传统的汉字“形、音、义”三方面属性外增加了“码”和“用”,将笼统的汉字个体的资源库,改造为汉字的属性库,解决关联的多角度问题。二是层次的确立。将汉字分为常用—通用—适用—罕用—无用5个层次,把无限的关联变为可以操作的有限关联,一方面可以在应用中扩大有用信息的使用度,另一方面使垃圾信息、无用信息、重复信息逐步退出关联,不再干扰有效信息的集合和调用。三是中介的寻求,系统以《说文解字》的9,353个小篆和10,516个字样为中介,保证了不同形制、不同字体、不同时代汉字的最大限度关联。

 

王宁教授致辞(主办方供图)

 

北京师范大学副校长郝芳华在致辞中,对项目研发团队的辛勤工作表示敬意,对国家语委的支持表示感谢。她表示,北师大的汉语言文字研究工作近年来发展很快,取得了丰硕成果。“汉字全息资源应用系统”是北师大交叉学科研究项目中研发速度最快、成果最显著的,希望它能够成为汉字汉语教学研究、传统文化推广传播的优质平台。

 

郝芳华副校长致辞(主办方供图)

 

教育部语言文字信息管理司副司长刘宏参加了此次发布会。他肯定了“汉字全息资源应用系统”的建设成果,为北师大对国家语委项目的关心与支持表示感谢,对项目研发团队表示敬意。他表示,这一系统在推进语言文字工作、服务国家发展需求方面发挥了重要作用:一是服务文化强国建设,传播中华文化,更好地展示汉字的发展及其文化内涵,促进汉字文化发扬光大;二是服务教育现代化,以全国教育大会精神为指引,提供满足学校师生多元需求的汉字信息资源平台;三是服务语言文字事业发展,促进语言文字的规范化、标准化和信息化,助力国家通用语言文字普及攻坚等重点工程实施。

 

刘宏副司长讲话(主办方供图)

 

 此次新闻发布会由北京师范大学教授、文学院党委书记康震主持。

活动中,刘宏、王宁、王立军、康震共同启动“汉字全息资源应用系统”,宣布该系统正式上线。这是语言文字工作者书写教育“奋进之笔”、回应人民关切的重要实践,有助于使语言文字发展的最新成果惠及更多领域和更广大的人民群众。 


刘宏、王宁、王立军、康震共同启动“汉字全息资源应用系统”(主办方供图)

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多