分享

古保论坛丨国家古籍保护中心古籍书目数据库建设实践

 新用户10697297 2021-11-08
“中华古籍保护计划”启动后,国家古籍保护中心[1]作为全国古籍保护工作的业务组织机构,在文化行政部门领导下,组织开展全国古籍普查登记工作,同时负责汇总古籍普查成果,建立中华古籍综合信息数据库,形成全国统一的中华古籍目录;协助部际联席会议办公室建立《国家珍贵古籍名录》;有步骤地开展海外古籍调查工作等。从国家古籍保护中心的职能范围,可见其工作内容与古籍书目数据关系密切。随着工作的展开,出于及时汇总成果并服务业界和公众的需要,国家古籍保护中心建设了一系列古籍书目数据库,如“全国古籍普查登记平台”“全国古籍普查登记基本数据库”“国家珍贵古籍名录数据库”“海外中华古籍书目数据库”“中华历代古籍书目数据库”等。本文就这些古籍书目数据库的建设实践展开论述。
 

古籍普查相关数据库
全国古籍普查登记工作是“中华古籍保护计划”的首要任务,是全面了解全国古籍存藏情况、建立古籍总台账、开展全国古籍保护的基础性工作,其中心任务是通过每部古籍的身份证——“古籍普查登记编号”和相关信息,建立国家古籍登记制度,加强各级政府对古籍的管理、保护和利用。全国古籍普查登记工作将全国古籍收藏单位分为基层古籍收藏单位、各省级古籍保护中心、国家古籍保护中心三级,采用“分级负责、逐级提交”的方式进行普查:各古籍收藏单位对馆藏古籍进行详细清点和编目整理,通过在“全国古籍普查登记平台”上登记古籍普查数据并导出为Excel文件,或者直接在Excel文件中录入古籍普查数据,并按国家古籍保护中心规定的著录规则、格式规范整理为Excel格式的古籍普查登记表格,提交所属省级古籍保护中心;各省级古籍保护中心负责对本地区古籍普查登记数据进行汇总并审核,提交国家古籍保护中心。各收藏单位古籍普查登记表格经省级古籍保护中心审核、出版社编辑审校后,编纂出版为各收藏单位的《古籍普查登记目录》
图片
自全国古籍普查登记工作启动以来,在国家古籍保护中心的统筹安排下,在各省级古籍保护中心的有效组织和各古籍收藏单位的大力支持下,全国古籍普查登记工作取得了令人瞩目的成绩,距离达成“基本完成全国古籍普查登记工作”这一在《“十三五”时期全国古籍保护工作规划》中明确提出的要求已十分接近。截至2020年底,全国古籍普查完成总量为汉文古籍270余万部(另藏文古籍18000函),占预计汉文古籍总量的94%以上;全国29个省份基本完成汉文古籍普查工作,共2830家古籍收藏单位完成古籍普查登记工作,占预计单位总数的96%以上;累计出版376家收藏单位的《古籍普查登记目录》共计104种158册,收录109万余条数据。
(一)全国古籍普查登记平台
图片
为利用现代信息技术更迅速更规范地开展古籍普查登记工作,国家古籍保护中心开发研制了“全国古籍普查登记平台”(以下简称“普查平台”)。普查平台是全国古籍普查登记工作的基础业务平台,于2008年初开始建设,2009年9月正式投入使用。普查平台采用分布式架构,在国家古籍保护中心及各省级古籍保护中心均设有服务器。全国2000余家古籍收藏单位可通过互联网访问所属省级古籍保护中心的普查平台,开展古籍普查在线登记工作。普查平台实现了汉文古籍、简帛、碑帖拓本、少数民族文字古籍[2]的普查登记,可以为每一部古籍自动生成唯一标识号——“古籍普查登记编号”。普查平台提供古籍普查登记、数据导入、数据导出、数据审核、数据同步、数据发布、数据维护、数据检索、统计分析、参考工具、单位管理、用户管理、个人空间、数据分配等一系列功能,实现了从古籍登记、本单位审核、省级古籍保护中心审核、国家古籍保护中心审核到数据发布这一普查工作流程[3]
普查平台的建设有如下特点:
1.字段设置和界面设计上充分考虑古籍的复杂多样性,尽量尊重古籍编目的传统和习惯。字段设置上,著录字段尽可能求全,因而多达上百项,包括普查编号、索书号、分类、题名卷数、著者、版本、版式、装帧、装具、序跋、刻工、批校题跋、钤印、附件、文献来源、修复历史、丛书子目、定级、定损、定级书影、定损书影等,用以尽可能完备地著录一部古籍的各方面信息。界面设计上,尽可能贴近古籍编目的传统和习惯,实现界面排布的灵活性,如考虑到多著者、多题名著者的情况,允许著者块、题名著者块整体增加、插入、删除;对于丛书子目的著录,可以灵活地增加或插入同级子目或子级子目,并根据子目层级自动赋予相应子目编号。
2.检索功能较为完备。为了尽可能多地检索普查平台上的著录内容,普查平台的“古籍信息检索”功能支持对题名、著者、版本、收藏单位、索书号、正式普查编号、旧普查编号[4]、文献类型、分类、装帧形式、古籍定级、全书破损级别、版本年代、版本类型、批校题跋者、序跋著者、刻工姓名、印章释文、附注、操作时间、操作方式、用户、数据状态等字段进行检索,既可以检索古籍的主要著录内容,也可以检索数据的操作历史,检索功能相对来说较为完备。另外,因普查平台采取分布式架构,全国古籍普查登记数据分布在各服务器上,因而普查平台近年来研发了“集成检索”功能,可以实时在线检索各服务器上的数据,可查看数据详情及书影图片,并可套录相应数据。目前[5]“集成检索”功能支持对国家古籍保护中心普查平台服务器及浙江、陕西、甘肃、云南、黑龙江、河北、江苏、福建、宁夏、海南等省级普查平台服务器进行检索,随着其他省级普查平台更新到最新版,将可以支持对更多省级普查平台服务器进行检索,最终实现对全国所有普查平台服务器进行检索。
3.重视对以往古籍编目数据的继承。普查平台的“数据导入”功能支持将MARC[6]、Access或古籍目录(Excel)[7]等格式的馆藏编目数据及古籍档案(Excel)[8]、国家珍贵古籍名录申报书(Word)等多种格式的文件导入普查平台,从而避免数据的重复录入,减轻普查人员工作量,提高工作效率。
4.重视古籍普查数据的共建共享。普查平台的“数据套录”功能支持套录本地服务器上及国家古籍保护中心普查平台服务器上的数据。“集成检索”功能可以检索并套录其他省级普查平台服务器上的数据。套录数据仅仅套录古籍的共性信息(如分类、题名卷数、著者、版本、版式等),普查人员可以在此基础上,根据本馆藏书的实际情况,完善这些共性信息,补充个性信息,从而提高著录效率和数据规范性。
5.重视古籍普查成果的转换。普查平台的“数据导出”功能支持将普查数据按当前页面上的选中范围或当前检索结果的序号范围或所有数据导出为古籍目录(Excel)或古籍全字段表格(Excel)、古籍档案(Excel)、国家珍贵古籍名录申报书(Word)等多种格式的文件。在《国家珍贵古籍名录》的评审工作中,部分单位的国家珍贵古籍名录申报书就是在普查平台导出文件的基础上补充申报原因等信息而成的。
目前普查平台各服务器上的普查数据共计150余万条,其中浙江、江苏、安徽、河南、陕西、甘肃、北京等省级普查平台上的数据做得较多较好。 
(二)全国古籍普查登记基本数据库(中华古籍索引库)

图片

发布网址:http://www./pcab/zhgjsmsjk/

在普查平台投入使用后,经过几年的实践探索,各级古籍收藏单位普遍反映古籍普查著录项目过多过细,十分影响普查登记效率和普查成果揭示速度。国家古籍保护中心在广泛听取古籍普查一线人员及相关管理人员意见的基础上,经充分探讨,对之前的古籍普查工作方案进行了调整,于2012年初发布了《全国古籍普查登记工作方案》,确立了开展古籍普查登记、出版《全国古籍普查登记目录》、编纂《中华古籍总目》三步走的方式,并开始全面推进古籍普查登记工作。《全国古籍普查登记工作方案》从工作实际出发,避繁就简,遵循简明扼要、客观著录原则,对古籍普查著录项目大大加以简化,将原来的上百项简化为13项基本项目,其中必登项目更是减为6项(索书号、题名卷数、著者、版本、册数、存缺卷),而分类、批校题跋、版式、装帧形式、丛书子目、书影、破损状况则列为选登项目。是否登记选登项目,选登项目的多少,将由各单位在保证必登项目的前提下量力而行。《全国古籍普查登记工作方案》还调整了普查登记工作流程,开始推行Excel格式的古籍普查登记表格,与普查平台并行使用。随着各古籍收藏单位的普查数据不断出版为《古籍普查登记目录》,国家古籍保护中心需要一个新的平台向公众及时发布古籍普查数据,“全国古籍普查登记基本数据库”(以下简称“普查基本库”)[9]随之应运而生。
为了将Excel格式的古籍普查登记表格按照统一的样式排版为Word格式的《古籍普查登记目录》,并为之自动编制题名和著者的拼音索引、部首笔画索引、四角号码索引,国家古籍保护中心开发研制了“中华古籍索引库”系统。因种种原因,在《古籍普查登记目录》正式出版工作中,并未利用“中华古籍索引库”排版和编制索引,但出于实际工作需要,国家古籍保护中心利用“中华古籍索引库”发布子系统以发布全国古籍普查登记数据,从而形成了普查基本库。普查基本库是全国古籍普查登记工作的重要成果之一,于2014年10月正式开通并对外提供服务。普查基本库发布的内容为各古籍收藏单位正式出版的《古籍普查登记目录》数据,每条数据主要包括普查编号、索书号、题名卷数、著者、版本、册数、存缺卷、收藏单位等内容。普查基本库支持用户按照题名著者、版本、收藏单位、普查编号、索书号、批校题跋、名录编号、分类、装帧形式、所属丛书题名、子目、附注等字段进行简单检索(不限字段的检索)和高级检索(字段间的组合检索,支持“与、或、非”逻辑运算),支持繁简通检。检索结果实现了对检索词的高亮显示,并支持按照普查编号和题名拼音进行排序。用户可在检索结果中按照单位进行导航,从而对被检索古籍在全国的收藏分布情况一目了然。
目前普查基本库累计发布264家单位(涉及28个省份及中直系统)的古籍普查数据825362条7973050册。这些数据来源于正式出版的《古籍普查登记目录》,是经过各古籍收藏单位目验原书、省级古籍保护中心组织专家审核、出版社审校后的精数据,数据质量相对较高。普查基本库是全国各古籍收藏单位首次按照统一的古籍著录规则完成的普查工作成果,有效履行了“中华古籍保护计划”要求的摸清古籍家底的任务,实现了全国现藏古籍的统一检索。随着古籍普查登记工作的不断推进,随着各古籍收藏单位的《古籍普查登记目录》不断出版,将有更多的古籍普查数据在普查基本库中发布,全国古籍存藏情况将越来越清晰地呈现在公众面前。

国家珍贵古籍名录数据库

图片

发布网址http://www./pcab/gjzggjml/

《国家珍贵古籍名录》是由国务院及文化和旅游部[10]公布的我国现存珍贵古籍目录,旨在集中人力、财力,对浩瀚古籍中具有特别重要文献价值、文物价值、艺术价值的古籍予以重点保护。截至目前,共公布六批《国家珍贵古籍名录》,全国485家机构或个人收藏的13026部古籍入选,其中,汉文文献11855部(含甲骨4条共11家单位,简帛187种,敦煌遗书405件,碑帖拓本207件,古地图149件,汉文古籍10903部),少数民族文字古籍1133部,其他文字古籍38部。
“国家珍贵古籍名录数据库”(下文简称“名录库”)[11]于2018年9月28日上线,首次以数据库的形式公开发布第一批至第五批《国家珍贵古籍名录》收录的古籍信息。2021年3月2日,国家古籍保护中心更新发布第六批《国家珍贵古籍名录》收录的古籍信息。名录库发布的入选古籍信息,在名录公布的古籍题名卷数、著者、版本(含补配信息)、批校题跋、存缺卷、收藏单位等信息基础上,依据申报资料增加了索书号、册/件数等信息,并进一步对著录信息进行细化切分,增加了文献类型、文种、分类[12]、版本年代、版本类型等信息。如果入选古籍在互联网上已发布全文影像,名录库还将附上全文影像链接以便用户访问阅读。目前名录库内已标明国家图书馆465部古籍在“中华古籍资源库”中的全文影像链接。名录库支持用户按照入选古籍的名录编号、名录内容[13]、名录公布批次、名录公布时间、文献类型、文种、分类、省份、收藏单位、索书号、题名著者、版本(含补配信息)、批校题跋、版本年代、版本类型、是否有全文影像等字段进行检索,支持用户自行选择是否开启繁简共检功能。检索结果默认按名录编号排序。
古籍在流传过程中存在同一部书最终分藏多家机构的现象,名录中合并著录为一个编号(如名录编号00940、00982、09905)用以体现合璧关系,加之出土地相同但多家机构分藏的甲骨也合并著录为一个编号(如名录编号09860、11376),因此,第一批至第六批《国家珍贵古籍名录》虽然为13026个编号,但按收藏机构分拆统计则收录了13036部古籍。名录库为了统计方便,收录的是按收藏机构分拆后的名录条目,但会在“名录内容”字段显示名录公布时的完整著录内容,同时会在检索结果页面底部显示当前名录条数,即当前检索结果对应的名录编号数。
 

海外中华古籍书目数据库
“海外中华古籍调查暨数字化合作项目”是“中华古籍保护计划”的重要组成部分。由于历史和社会的原因,有数以百万册计的中华古籍(含民国线装书)存藏于海外各类公私机构。这些海外存藏的中华古籍数量众多,是我国古代典籍的重要组成部分,也是反映中华文明在世界文明中流传发展脉络的重要明证。
建设“海外中华古籍书目数据库”(下文简称“海外库”)是“海外中华古籍调查暨数字化合作项目”的重要内容,是实施海外中华古籍调查工作、逐步摸清海外中华古籍存藏分布情况的重要途径。海外库收录海外所藏中华古籍的相关信息,著录内容主要包括收藏机构、索书号、分类、题名卷数、著者、版本(含补配信息)、版本年代、版本类型、版式、装帧形式、册数、存缺卷、批校题跋、所属丛书题名、子目、旧藏信息、数据来源、原书页码等。信息主要来源于目前已出版的海外机构所藏古籍书目,少部分来源于国际交换所得的古籍编目数据。目前已累计完成包括美国、加拿大、西班牙、法国、英国、新西兰、日本等7个国家近百家机构的百万余条(含子目条数)书目数据的建设工作。
海外库目前处于数据积累阶段,数据尚未正式发布。
 

中华历代古籍书目数据库
建立“中华历代古籍书目数据库”(下文简称“历代库”),收集整理中国历史上曾经出现过的典籍文献信息,与全国古籍普查登记工作和海外中华古籍调查工作一脉相承,互为补充,有助于摸清我国历代典籍流散史和古代学术流变史。
历代库先从目前已有整理或影印的历代古籍书目文献做起,著录内容主要包括分类、题名卷数、著者、版本、批校题跋、版式、装帧形式、存缺卷、册数、函数、部数、牌记、刻工、避讳字、钤印、旧藏信息、存佚情况、数据来源、原书页码、原书卷次等。目前已累计完成近60万条(含子目条数)书目数据的建设工作。
历代库目前处于数据积累阶段,数据尚未正式发布。

结语

普查平台、普查基本库、名录库、海外库、历代库的建设均立足于国家古籍保护中心的工作实际。普查平台、普查基本库分别是全国古籍普查登记工作的工作平台和发布平台,有效保障了全国古籍普查登记工作的开展及其成果的及时展示,切实履行了摸清古籍家底的任务,最终将形成中国境内现藏古籍的统一联合目录,将完整揭示中国境内古籍的存藏情况。海外库的建设服务于海外中华古籍调查工作,旨在尽快摸清海外中华古籍的存藏情况,但受限于目前条件,只能先从汇集整理目录做起。普查平台、普查基本库和海外库是从空间维度出发完成古籍的调查工作,如果全部建设完成,将中国境内外的古籍收藏机构尽行掌握,中华古籍在全球的存藏分布情况将一目了然。历代库则是从时间维度出发完成古籍的调查工作,从而摸清我国历代典籍的流散历史和相关学术的演变脉络,为现藏古籍提供历史上的佐证,便于摸清具体古籍的递藏关系。普查平台、普查基本库、海外库、历代库互相配合,互相补充,就能充分揭示古籍在古今中外的分布情况。名录库所收古籍是从中国境内一、二级古籍中遴选的具有重要文物、文献、艺术价值的珍贵古籍,有利于古籍的分级管理和保护,更应该重点建设、充分展示,这也有助于提高全社会关心古籍、保护古籍的意识,从而在增进文化认同中坚定文化自信。

注释:

[1] 2007年5月15日中央机构编制委员会办公室批准国家图书馆加挂“国家古籍保护中心”牌子(中央编办复字[2007]53号),5月25日国家古籍保护中心正式挂牌成立。
[2]其中藏文古籍著录界面支持藏文、汉文双语著录,其他少数民族文字古籍采用汉文著录。
[3]普查平台原设有发布子系统,发布的数据为普查平台上经国家古籍保护中心审核通过的数据。2012年初全国古籍普查登记工作进行了调整,普查平台上,国家古籍保护中心不再审核并发布数据,发布子系统不再使用。
[4]“正式普查编号”字段用以著录正式出版的《古籍普查登记目录》中的普查登记编号,“旧普查编号”为普查平台著录数据时自动生成的普查登记编号。在普查平台数据未修改成与已出版数据一致之前,二者相同。
[5]“目前”指2021年3月初,下同。
[6]导入前,可以在MARC与普查平台默认对应关系的基础上自行配置适配本单位的对应关系。
[7]导入前需要调整为普查平台支持的标准表格。
[8]古籍档案俗称“十六表”,是普查平台投入使用前用以临时过渡的古籍登记表格。
[9]访问网址:http://202.96.31.78/xlsworkbench/publish(国家图书馆馆内访问网址:http://192.168.42.12/xlsworkbench/publish)。
[10]第一批至第五批《国家珍贵古籍名录》由国务院公布,第六批《国家珍贵古籍名录》经国务院批准同意,由文化和旅游部公布。
[11]访问网址:http://202.96.31.79/nlcab/public!mlSearch.action(国家图书馆馆内访问网址:http://192.168.42.10/nlcab/public!mlSearch.action)。
[12]仅汉文古籍有,分类仅限经、史、子、集、丛一级分类。
[13]除名录编号外的名录完整著录内容。
参考文献:
①国家古籍保护中心.全国古籍普查登记工作方案[EB/OL].[2021-03-02].http://www./pcab/gjpc/gjpp_pcjs/.
②包菊香.古籍目录索引的自动编制:以“中华古籍索引库”为例[J].中国索引,2013,11(1):25-29.
③洪琰,王沛.全国古籍普查登记工作实践与思考[J].国家图书馆学刊,2014,23(5):12-17.

(原载《古籍保护研究》(第七辑),引用请以原文为准。)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多