分享

布依语语言资源的保护、开发与利用

 风吟楼 2020-08-07

布依语属汉藏语系侗台语族壮傣语支,主要通行于贵州省西部、西南部和南部等布依族聚居地区,与同语支语言关系密切。按语言资源的类型来分,布依语属于“语言活力强盛的强势语言资源”,但无论是资源的保护还是开发和利用都尚处于起步阶段,有着极大的潜在价值。



布依语语言资源现状及其保护工作实践


随着社会经济的发展和跨学科研究的进步,语言作为一种资源的理念深入人心,其价值属性越来越多地受到更多的关注和重视。中国境内语言资源库藏丰富、类型多样,按语言属性和通行的区域可分为国家通用语、汉语方言和少数民族语言3种;按价值和功能属性,主要包括本体资源、派生资源和以公民的语言能力为衡量标志的国民语文素质资源3类。其中,国家通用语的语言资源研究最为全面系统,成果也最为丰硕,并已开始应用服务于提升国民整体语文素质;汉语方言次之,现亦基本完成了对本体资源的研究,开始着手开发和利用纷繁的派生资源;少数民族语言的相关工作依托“中国语言资源保护工程·民族语言调查”项目刚刚起步,且在现阶段仍停留在本体资源的调查、记录和保存阶段。


(一)布依语语言资源现状

布依语内部差异不大,根据各地语音和部分词汇的不同,分为3个土语,按通行区域分别称为黔南土语、黔中土语和黔西土语,习惯上又叫做第一、第二和第三土语。其中,第一土语通行范围最广,从最东边的黔南州荔波县到最西边的云南省罗平县均属于该土语;第二土语通行于以贵阳市为中心的贵州中部地区,包括黔南州北部的几个县,安顺市的部分地区,以及贵州省西北部的黔西、织金等县;第三土语通行于贵州省西部,包括六盘水市、黔西南州的普安与晴隆等县和安顺市的镇宁与关岭等地区。布依语语言规范程度较高,语言功能较完善,当下广泛使用于民族自治州、县公务活动中,但在不同地区的使用情况各不相同。根据使用频率和交际范围的不同,可将布依语的语言活力简单分为4个等级:(1)强活力。该等级的布依语是家庭、社区和跨社区本民族内部的主要交际用语,主要分布在布依族相对集中的黔西南和黔南部分地区,如望谟、册亨、安龙和罗甸等县;(2)次强活力。这一等级的布依语仍是家庭和社区的主要用语之一,同时兼用汉语的现象十分普遍,跨社区的言语交际则以汉语为主,主要分布在与当地汉族或其他少数民族杂居的布依族地区;(3)次弱活力。该等级的布依语已经显露濒危趋势,主要局限于家庭内部中老年人的交际,青少年绝大多数情况下都使用汉语,社区和跨社区交际也多以汉语为主,主要分布在城镇化程度相对较高的布依族地区;(4)弱活力。这一等级的布依语已经濒危,交际功能严重衰退,仅在少数老年人(祖父母辈)间偶尔使用,汉语取之成为家庭、社区和跨社区的主要交际用语,主要分布在一些布依族杂散居地区。
(二)布依语语言资源保护工作实践
中国语言资源保护工程(以下简称“语保工程”)的开展与实施极大地助力了布依语语言资源的保护工作,催生了全面、系统且信息化的具体实践。自2015年启动之初到 2018 年底,先后立项4个课题对贵州省望谟县、龙里县、镇宁县和云南省罗平县的布依语开展了以调查、记录和保存为主的语言资源保护工作。调查采用现代化信息技术,遵循统一的技术规范,对包括3000个词、100个语法句、20分钟话题讲述、20分钟口头文化在内的布依语语言材料和部分地方普通话语料进行音视频同步摄录和国际音标的转写。现将具体调查过程简述如下。

1. 发音人的遴选

根据《中国语言资源调查手册·民族语言》的相关要求,每个民族语言调查课题选取主要民语发音人1名,要求为男性,年龄为55-65周岁,家庭母语环境单纯,没有长期外出经历,小学以上、大专以下文化水平,母语熟练。总体来说,已立项调查的4个布依族地区语言保持情况都比较好,具有较强的语言活力,在主要民语发音人的选择上基本不存在困难。口头文化的发音人对年龄、性别和文化程度等没有严格的规定,但在县城里已经很难找到能用布依语讲故事和唱民歌的母语人了,传统文化传承的情况不容乐观。

2. 纸笔记录

纸笔记录是语言学田野调查的基本功,语料记录的准确与否,直接关系到语言研究的深度和广度。我国少数民族因大都没有沿用的本民族传统文字,其语言研究对纸笔记录的依赖性更为显著。实践证明,前期的纸笔记录可以大大减少发音人在摄录过程中的思考时间,提高录音录像的效率,降低错误率,可谓事半功倍。与此同时,我们也发现,发音人在面对调查时的语言熟练程度往往不及平时的语言交际,且在组词成句时常常受限于汉语目标句的语法,句子越复杂,摆脱的难度就越大。

3. 语料摄录

对语料进行音视频的同步摄录既是语保工程的亮点和特点,也是整个调查工作中最为重要的环节之一。摄录的具体方法多样,考虑到课题组的实际情况,我们选用了逐词逐条摄录的方法,多次实践也已经证明,这种最“原始”的方法恰恰是最符合少数民族语言资源调查实际的。整个音像摄录环节包括4个部分:提词、录音、摄像和审核。其中,提词是指工作人员(一般可以由摄像人员兼任)语音提示发音人所需对译的汉语词条、语法例句或话题等;录音和摄像分别由专人负责,且需保证摄像的时间长于录音的时间;审核主要是保证质量(参数、分辨率、流畅度、音质和画质等)和删除无关或错误的条目。整体而言,语料的音像摄录尤其强调协调合作,其中任何一个环节出错,都会导致摄录工作的停滞以及后续工作的紊乱。


布依语语言资源的开发与利用


“语言资源”的概念是在社会对语言大范围大规模需求的背景上形成的,“有价值、可利用、出效益、能发展”是语言作为资源存在的主要特征。事实证明,言语集团的交际手段与生产手段是息息相关的。随着社会的不断发展进步,知识量的增长速度和不同言语集团传递信息的交际活动,已经开始成为影响社会生产力发展的重要因素,语言资源的价值属性也日益凸显,亟待我们去开发和利用。

中国境内语言资源库藏丰富,已经识别和正在使用的语言涉及汉藏、阿尔泰、南岛、南亚、印欧等5大语系,还有部分混合语以及语系、语族或语支难以界定的若干语种,共计130余种。当下,人们对语言资源的开发和利用主要集中在汉语和汉语方言上,有传统文字的主要民族语言,如藏语、蒙古语、维吾尔语、朝鲜语等也在资源的开发利用上取得了一些初步的成果,但对于大多数无文字民族语言,甚至是人口较少民族语言或濒危语言的资源开发和利用仍停留在调查记录的阶段,距离真正的开发和利用还很远。在国家语言资源保护工程的支持下,布依语语言资源的调查、记录和保存工作现已基本完成,如何对其进行开发和利用已经开始提上议事日程并备受关注。综合现有布依语语言资源实况和语料数据,现阶段的资源开发和利用应着力以下三个方面。


(一)智能教育平台建设

据第6次全国人口普查统计,布依族现有人口280余万,布依语广泛通行于贵州省黔西南布依族苗族自治州和黔南布依族苗族自治州等地区,具有使用域广、使用人口多、使用频率高等特点。随着经济全球化和城镇一体化程度的不断提高,布依语已经出现衰退趋势,母语教育因教材和教学方法的落后也开始出现瓶颈,改进教学方法和发展母语教学的呼声日益响亮。有鉴于此,布依语的语言教学不能再停留在传统教学模式中,而应利用信息化和多媒体手段,建设包括多媒体教材、视听教学软件和微课、慕课在内的智能教育平台。综合考量现有语料数据,现阶段的布依语智能教育平台建设应以多媒体教材为中心,在整合修订原有教材的基础上,推出统一规范的语言教材并为其配备配套的教学音视频,让语言教学生动化和具体化,激发青少年学习母语的热情。此外,日常会话读本和常用词汇等课外读物也可采用配套音视频的方法编写出版。

(二)应用型双语人才培养模式的建构

随着我国社会经济的快速发展,跨区域的人口流动越来越频繁,民族间的交往和交流显著增多,语言接触迅速上升为学界和社会大众普遍关注的热点问题。为了实现语言互通,不少民族地区开始推行双语教育,积极鼓励少数民族干部群众学习全国通用的普通话,取得了较好的效果。值得注意的是 ,大多数民族地区在推行双语教育的过程中,忽略了对当地汉族干部群众的民族语教学,进而导致了人才匮乏和语言能力不均衡等现象的出现。据布依语语言资源数据显示,布依族地区在教师、政府办事大厅的公职人员和法官等岗位上的双语人才数量严重不足,不少在岗的汉族干部由于不懂布依语,导致在开展工作时困难不断、阻力重重。面对这种情况,应对岗位所需的人才素质进行深入分析,针对职业岗位需求优化语言资源配置,制订相应的双语人才培养目标,分职业开展专项语言教学,建构适应社会需求的应用型双语人才培养模式。

(三)语言运作技术的信息化

语言运作技术的信息化是语言信息处理的主要内容之一,是指让计算机模拟大脑的语言运作机制,实现机器自动生成和理解语言信息。当今社会,信息化程度正飞速提高,人们日常需要接触和处理的语言信息数量都是惊人的,仅靠人力难以应付,迫切需要借助计算机来协助处理这些海量的语言信息。目前,语言运作技术的信息化主要聚焦在普通话上,在机器翻译、自动文摘、信息检索、信息过滤、语音识别与合成等领域已经取得一些阶段性成果;对部分汉语方言和少数民族语言虽有涉及,但广度和深度远不及普通话,一些人口较少民族的语言和濒危语言更是鲜有问津。究其原因,笔者发现,语言运作技术信息化的实现主要依赖于两个方面的工作,一是语言资源建设和语法,二是语义的算法设计。其中,语言资源建设是基础中的基础,资源数量的多少和质量的好坏直接决定了语言运作技术信息化的程度。纵观现行少数民族语言保护工作,布依语语言资源建设日渐成熟,目前已经完成了4个主要土语区的词汇、句子和语篇的数据采集及音视频建档工作,具备了一定的语言信息处理条件。为了更好满足布依语语言信息处理的需求,我们应进一步整合和优化现有语言资源,推进语法、语义的算法设计,尽快在机器翻译、语音识别与合成等领域实现新的突破,让布依语插上信息化的翅膀飞进千家万户。

文章节选自:朱德康2019  布依语语言资源的保护、开发与利用,《贵阳学院学报》(社会科学版)第5期。

题图来源:百度图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多