分享

“音乐资源的数字化”与“数字化的音乐资源” —— 由音乐类非物质文化遗产文献数据库建设工作引发的思考

 阿里山图书馆 2016-10-31

我国积淀了丰厚的音乐类非物质文化遗产,且近年来,国内的“非遗”领域的工作亦逐渐取得了诸多成效。保护和利用好非物质文化遗产,对弘扬中国优秀传统文化具有重要意义。近些年,我国开始实施文化信息资源共享工程,将中华优秀文化信息资源进行数字化加工和整合以通过共享工程网络体系,实现优秀文化信息资源在全国范围内的共建共享,推动非物质文化遗产资源的数字化保护。在当代,音乐资源的数字化正在给资源的保存、传播和利用带来变革,这种变革无疑将会提高人类对音乐资源的生产、保存和利用效率。在实施相关工作的过程中,宜先厘清对“音乐资源的数字化”这一问题的理解,其中,还需重点明确“音乐资源的数字化”与“数字化的音乐资源”二者之间的关系,特别是其区别的问题。笔者认为二者的区别在于:音乐资源的数字化关注的重点是数字化的方法、手段与途径等方面;而数字化的音乐资源关注的重点是资源的可靠性、使用效率与运用、怎样与教学相结合、版权处理等问题。

一、音乐资源的数字化

在本部分中,笔者将从含义、方法、意义三个方面,谈“音乐资源的数字化”。

(一)音乐资源的数字化的含义

所谓数字化就是将许多复杂多变的信息转变为可以度量的数字、数据,再用这些数字、数据建立起适当的数字化模型,把它们转变为一系列二进制代码,引入计算机内部进行统一处理——这就是数字化的基本过程。音乐类非物质文化遗产资源的数字化主要包括文本数字化、图像数字化、视频数字化、音频数字化四个方面的内容。数字化标准可参照国家图书馆出版的文献加工标准和操作指南① 来制定(如《国家图书馆文本数据加工标准和操作指南》、《国家图书馆音频数据加工标准和操作指南》、《国家图书馆视频数据加工标准和操作指南》、《国家图书馆图像数据加工标准和操作指南》等)。

数字化加工流程就是将音乐类非物质文化遗产资源从各种来源转换为电子影像文档并建立索引的过程。从数据库的工作流程看,可分为资源收集、资源整理、资源分类、资源数字化(包括:资源扫描、元数据标引、数据校验、属性标记等)、数据录入、技术实现等几个环节。这些构成一个完整的工作流水线,各道工序流程环环相扣,组成一个完整的系统,如图所示。

数字化工作流程图
(二)音乐资源的数字化方法

随着社会信息化的发展,音乐类非物质文化遗产资源数字化已经成为一种必然趋势。而在资源数字化的过程中难免存在一些问题与障碍,因而,如何更好地建立和完善音乐类非物质文化遗产资源的数字化的方法,是亟待解决的问题。

文本资源数字化方法 文本资源数字化主要结合采用文本化与图像化两种方法(参见王荟、肖禹著《地方志数字化模式与案例分析》,国家图书馆出版社2012年版,第12)。在当前的技术条件下,文本资源数字化过程通常不是将各种载体的音乐类非物质文化遗产的相关文献直接转化成文本数据,而是先将其转换成图像数据,再由图像数据转换成文本数据。这样一来既保存了原始资料的面貌,也能够对资料中的文本进行索引,为以后的检索做准备。

文本化是将各种载体的文献转化成文本数据的过程。文本化优势在于:

第一,相对于索引数据、书目数据和图像数据,文本数据既能揭示文献包含的绝大部分信息,又能支持检索和显示;

第二,文本数据是信息检索、显示、抽取,数据分析与挖掘等一系列后续应用的基础,内容、格式、数据质量、描述方式等都会对后续应用有直接的影响,也间接决定着数据库的应用水平(参见滕腾《蒙古族音乐数据库的设计与制作》,中国音乐学院博士学位论文2013年,第96-97)。

尽管如此,文本化也存在不足之处:第一,文本数据会损失部分版式信息;第二,由于文字识别率的限制,文本化过程会引入一些文字错误,后期仍需要人力介入进行修正;

第三,文本数据比书目、索引、图像等类型数据复杂——中文文本数据的索引制作方法一直以来是数字化研究与实践的重点和难点。

根据文本的特殊性,文本资源数字化手段主要借鉴了图像资源数字化的方法。图像化是将各种载体的文献转化成图像数据的过程。其优势在于:第一,图像化是唯一能真实保留文献原貌的数字化方法;第二,图像化在整个文献数字化过程中是一个承前启后的环节,纸质文献转换成数字图像,也是数据库建设中的基础部分——尤其音乐领域内的文本文献中包括的大量谱例,无法直接转为文本数据,选择图像化是唯一的保存途径。

图像化的不足之处在于:未进行文字识别的图像化,在使用的过程中是无法进行检索的。

总之,对于文本资源数字化而言,通常将文本化与图像化这两种数字化方法结合使用。单一的文本化方法,是没有图像信息的,这样会有失内容本身在原载体中的位置与样式;而单一的图像化方法,是没有文字信息的,其不足之处是日后不能进行文字检索。另外,对于音乐类的资源,文本中有时会插入谱例图像等,因此单一的文本化是不可取的。只有将文本化与图像化相结合,才能既方便检索,又能看到其在书籍等载体中所呈现出原始的样式。因而,我们数字化后的电子书,或者下载的电子书,可以根据研究的不同内容,进行随心所欲的检索,并运用到实践与研究中。

图像资源数字化方法

图像资源数字化流程主要包括加工准备、设备和技术参数的选取和设定、数字资源创建、数字图像后期处理、元数据加工等(参见朱强、张春红、龙伟主编《国家图书馆图像数据加工标准和操作指南》,国家图书馆出版社2011年版,12-15)。可进行图像数字化的资源类型主要包括:普通图书类、胶片类、古籍类、手稿乐谱类、拓片类、照片类、绘画类、报纸、小型实物类,以及一些复合文献、原生图像数字资源等。

图像资源数字化方法除了上述谈到的图像化方法,还可针对图像资源的特点,进行一些特殊的处理。需要注意的是,图像资源中包含的人物、时间与地理信息应该一并进行处理。对于时间信息与地理信息,均可使用自动抽取技术或由人工添加到元数据中。对于图像中的人物信息,可借助人脸识别技术进行自动识别,并进行人工标注与校对。这些信息一旦以元数据形式存在,将给检索带来很大便利。

音、视频资源数字化方法

音、视频资源数字化方法的主要流程包括资料整理、内容采集、压缩转换、音频编辑、附属物件处理、元数据加工等。其管理性元数据元素主要包括:信息资源标识符、来源、音频或视频格式、视频色彩、画面宽高比、音频采样频率、比特率、音频量化位、通道数、采样方式、帧速、音频设定、加工方式、代理标识符、代理名称、代理类型、职能、事件标识符、事件类型、操作、操作日期时间、设备、压缩方法、数字对象的格式、语种、关联、收藏级别、存储介质、持续的时间、文件的大小等(参见朱强、张春红、龙伟主编《国家图书馆图像数据加工标准和操作指南》、《国家图书馆视频数据加工标准和操作指南》,国家图书馆出版社2011年版)。同时还包括音乐类非物质文化遗产资源具体的特有元数据元素。

同时,音、视频可能包含语音信息,在数字化过程中,可以结合采用语音识别与人工录入这两种方式,使其中的文本信息保留下来,以便于日后检索。需要说明的是,对音、视频资源中相关的封面、文字介绍等附属物,应采取图像化或文本化的数字化方法。最后将数字音、视频对象与数字附属物件对象,组合成完整的资源,并通过元数据关联起来。

综上,文本,图像,音、视频资源的数字化是建立数据库系统的必经环节。数字化后,经过整合的有序的数字资源集合,即为资源库(此处的“资源库”与文中谈到的“数据库”均指代同一事物)。作为资源的集合,资源库容纳的资源类型多样,资源内容丰富,组织手段繁多,展示方式灵活。资源库中各种类型的资源围绕某一主题进行整合,可以直接满足用户某一方面的需求;不同“粒度”(所谓“粒度”(granularity),本文指信息粒度,指的是信息单元的相对大小或粗糙程度。系统选择不同的信息粒度作为主线,将延伸出不同的使用方式。比如对于音乐的信息结构来说,“歌曲”这个层级上有“专辑”、“歌手”,另外还包含“风格”、“年代”、“地区”、“语种”等维度的诸多复杂信息)的资源有机地组织在一起,共同为同一主题服务;资源经过深入的标引,可以支持显示、浏览、检索等功能;各类资源之间彼此关联,形成多维的资源网络(参见《地方志数字化模式与案例分析》,第260)。不同的研究者根据自身需求进行使用。

(三)音乐资源的数字化的意义

音乐资源的数字化是趋势。音乐资源数字化后,可通过网络,使音乐类非物质文化遗产的展示、传播与利用极为便捷,打破了特定时间、场所的限制,最大限度地实现了音乐资源的利用和共享(参见杨海波《数字技术与山东非物质文化遗产保护》,载《山东社会科学》20091期,第155)。音乐资源的数字化,既可以很好地保存传统音乐资源,又能使被数字化的音乐资源成为整个信息网络中的共享资源,以促进整个社会对音乐资源的开发和利用。因此,音乐资源数字化具有重要意义。更具体地说,表现为以下几个方面。

首先,纸本音乐资源数字化以后,既不会对原纸本造成损耗,又可依托计算机、平板电脑、电子阅读器等硬件设备很好地替代纸本文献,进而为更多用户服务。

其次,音乐资源数字化后,依托目录、索引、文本等数据,通过检索软件和数据库可以实现全文检索。通过全文检索,用户可以直接找到所需的文献、章节、篇目、段落甚至字句。

第三,音乐资源数字化后,知识提供方式不同于传统的文献检索,它打破了文献原有的组织结构。将大量的文献还原为不同粒度的知识和与知识相关的资源后,用户可以摆脱单个文献的限制,依据自身的需求,直接获取特定知识和资源见陈红彦《关于进一步加强古旧方志资源利用的思考》,载《图书馆工作与研究》2013年第12102)。

二、数字化的音乐资源

关于对“数字化的音乐资源”的认识,以下将从含义和类型这两方面展开。

(一)数字化的音乐资源的含义

数字化的音乐资源,即数字音乐资源。数字音乐资源是音乐文献信息的表现形式之一,是将计算机技术、通信技术及多媒体技术相互融合而形成的以数字形式发布、存取、利用的音乐信息资源总和(参考“百度百科”中的“数字资源”词条。

http://baike.baidu.com/view/82034.htm)。数字化的音乐资源的类型主要包括:电子音乐文献和网络音乐资源两种类型。电子音乐文献是以音响、形象等方式记录知识的载体,换句话说,电子音乐文献是指除印刷型音乐文献以外的非印刷型音乐文献,它是伴随计算机和相关新技术的应用而诞生的新的音乐文献载体,主要包括:缩微型、视听型、机读型、光盘型、联机数据库、网络信息等几种类型(参见四川音乐学院图书馆编印《音乐文献及其利用(四川音乐学院图书馆利用指南)》,20005)。而网络音乐资源是指借助于网络环境可以利用的各种音乐信息资源的总和。 

(二)数字化的音乐资源的类型

数字化的音乐资源的来源方式主要有:

其一,从纸本进行数字化的音乐资源,即前文所述的音乐资源数字化方法及类型中提到的;

其二,电子音乐文献资源。记录音乐文献使用的信息符号主要有文字、记谱符号、音频、视频信号等。姜玉明在《试论电子文献的概念及其类型》一文中,对电子文献类型的划分是按贮存内容的表现形式、存贮载体、性质(数据类型)、记载的表现形式、信息提供的方式、信息加工层次、功能等进行的(笔者将相关内容整理在表1中。参见姜玉明《试论电子文献的概念及其类型》,载《图书情报知识》2003年第1期,第71-73页。兹一并对表1中的某些语汇简介如下。电子图书又称e-book,是指纸质型图书的电子化形式以及书籍以电子版的方式(其载体为软盘,或光盘,或网络)呈现,并通过电脑或电子图书阅读器进行阅读的一种电子文献。数据库型的电子文献主要包括各种各样的数据库,如各图书馆内部计算机用的馆藏书目数据库、全国报刊索引(机读版)、中文科技期刊篇名数据库(光盘版)等。音像型电子文献类型主要包括音乐CD、电影或电视节目的VCDDVD等。多媒体型的电子文献,同时包含文字、声音、影像等多媒体信息,如各种多媒体教学课件。程序型的电子文献,主要包括各种计算机程序,如系统软件、应用软件、工具软件等。文档型电子文献,主要包括各种计算机程序生成的数据文档,如Word 文档、Excel 文档及各种格式的图片文档等。集成电路卡,包括各类游戏卡、磁卡等。磁带、磁盘、光盘、集成电路卡等电子文献又可统称为制品型(或封装型)电子文献。网络型,即来自网络上的各种电子文献,如电子邮件、电子图书、电子杂志、电子报纸、在线电影、在线音乐,以及通过终端下载的各种程序及各种文档等。此种文献类型,我们也可以称之为网上文献)。

肖希明等在《数字信息资源建设与服务研究》一书中,根据不同的标准,将数字信息资源按照内容的表现形式、存储信息的介质、数据传播的范围、生产途径和发布范围、生产方式、性质和功能等,划分为多个类型(笔者根据相关内容整理成下页表2希明等著《数字信息资源建设与服务研究》,武汉大学出版社2008年版,第5-9页。兹对表2中的两个语汇简介如下。磁介质,包括:磁盘、磁带、磁盘阵列、硬盘、活动硬盘等。光介质,即光盘,分为两类:一类是只读型光盘,包括CD-AudioCD-VideoDVD-AudioDVD-VideoDVD-ROM等等;另一类是可记录型光盘,包括CD-RCD-RWDVD-RDVD+RDVD+RW等等)。

如上所述,音乐资源的范围非常广泛,形式多种多样,依据不同的标准,可以划分为多种不同的类型。然而,对于众多的音乐资源类型,其采集方式也会根据资源类型的不同而不同

、需要探讨的问题

关于音乐资源的数字化,需要探讨的问题主要有以下四个。

第一,就数字化而言,音乐类非物质文化遗产具有其特殊性,要分清哪些音乐资源是可以进行数字化的,哪些资源是不可以进行数字化的,以及资源数字化存在

哪些益处与弊端,等等。

第二,如何建立良好的可持续发展体系,摆脱以往的项目模式(项目一结束,成果就库存起来再也不更新),使其“活”起来。

第三,机构间合作,如何避免重复劳动以及如何进行权限的分配?如,许多书籍类文本文献已经由商业公司完成了数字化工作,如何以较低的成本使用这些已有数字化成果?

第四,保证音乐资源的有效与合法使用,如与资源所有人进行版权协商,完善与实施知识产权保护相关法律法规等。因此,音乐资源数字化要根据成本效益最大化的原则,按照现实需要的情况,实施音乐类非物质文化遗产资源筹集整理工作人员与专业技术人员、系统与扫描设备的科学搭配,完善音乐类非物质文化遗产资源数字化的人力物力资源,促进音乐类非物质文化遗产资源数字化工作效率最大化。

而针对数字化的音乐资源,需要探讨的问题主要有以下四个。

第一,如何做到数字化音乐资源的利用最大化?

第二,如何甄别网络音乐资源的可靠性?

第三,如何将可靠的音乐资源有效地纳入音乐教学及其他应用领域?

第四,如何处理音乐资源的版权问题?

综上所述,笔者认为:音乐资源的数字化不等于数字化的音乐资源,在实践的过程中切勿将二者混淆。另外,音乐资源的数字化问题是一项复杂、艰巨的工作,对于实施与运作的过程中可能会遇到的各种局限,应有清醒的认识,不可因为其复杂性避而不作。音乐资源数字化是构建数据库的重要环节,因此,要择选国内外的先进技术手段进行操作,并在实践过程中不断地进行补充与完善。

                           原载《音乐传播》2015年第3期

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多