1 什么是古籍数字化?
这似乎不应该成为一个问题,但它关系到对古籍数字化的定位,故有必要作深入探讨。应该说,在这个基本问题上人们的认识是存在一定误区的,最常见的就是把古籍数字化仅视为存储介质的转换,其目的也只是保护和储存古籍。如:“古籍数字化就是利用数字技术将古籍的有关信息转换成数字信息存储在计算机上,从而达到使用和保护古籍的目的。”[2]“古籍数字化就是采用计算机技术,对古籍文献进行加工、处理,制成古籍文献书目数据库和古籍全文数据库,用以揭示古籍文献中所蕴涵的极其丰富的信息资源,从而达到使用和保护古籍的目的。”[3]“所谓古籍数字化,是利用现代信息技术,将历来抄写本、刻铸本、雕版、活字版、套版及铅字印刷等方式所呈现的古代文献,转化为电子媒体的形式,通过光盘、网络等介质保存和传播。”[4]类似的观点还很多,兹不一一列举。诚然,古籍储存介质的转换可以解决长期困扰人们的古籍保存问题,也在一定程度上方便了人们使用,但笔者以为,这些定义尚不足以反映古籍数字化的实质。从本质上讲,古籍数字化不是一个单纯的技术问题,而是一个文化问题和学术问题。
2 什么样的古籍适合数字化?
我国现存古籍约有近20万种,对它们全部进行数字化似不大可能也没有必要。这实际上就面临一个选题的问题。古籍数字化对象的选择必须遵循现实性和实用性的基本原则,如前所述,古籍数字化的现实目标是为普及文化和科研服务,但当前最紧迫的任务还是为人文社会科学研究服务,具体来讲就是要解决文史资料查找费时费力的老大难问题。中国古籍汗牛充栋,经过系统整理的毕竟不多,方便的检索工具,如引得、通检、索引、汇编等也很有限,难怪以清代三百年间第一流人才的心思精力研究经学,却只取得了一点点的成果,两千四百多卷的《清经解》,大多是一堆流水烂账,没有条理,没有系统,人人从“粤若稽古”、“关关雎鸠”说起,怪不得学者看了要望洋兴叹。[7]而且,一般的人工检索工具所能揭示的信息含量相比浩如烟海的古籍资源来讲,可谓沧海之一粟,也不便于人们进行全面研究。从满足人们对古籍信息资源需要的角度来看,大型的丛集汇要搜罗宏富,传统文化的经典基本包罗在里面,是最适合的检索对象,但人工查检往往是费力不讨好。现在由于古籍数字化实现了语义关联的全文检索功能,检索不再是问题,那么这些大型工具书应成为古籍数字化的首选。丛书如《四库全书》《四部丛刊》《四部备要》《二十五史》《十三经注疏》《诸子集成》《历代史料笔记丛刊》等;类书如《艺文类聚》《玉海》《永乐大典》《太平御览》《册府元龟》《古今图书集成》等;总集如《先秦汉魏晋南北朝诗》《全上古三代秦汉三国六朝文》《文苑英华》《两汉全书》《全唐诗》《全唐文》《全唐五代诗》《全唐五代词》《全宋诗》《全宋词》《全宋文》《全辽文》《金文最》《全金元词》《元诗选》《全元文》《全元戏曲》《全明诗》《全明词》《全明文》《全清词》《清文海》等,还有历代别集,历代会要会典等。这些古籍的数字化足以满足一般文化普及和学术研究的需要。
3 由谁来完成古籍数字化?
当前,除了古籍爱好者和研究者进行的零星古籍数字化工作外,成规模的数字化工作基本上由三类机构来完成的。一是教学和研究机构,如中国社会科学院的数字化项目《全唐诗》《全唐文》《十三经》《诸子集成》等,武汉大学的电子版《四库全书》,深圳大学的电子版《红楼梦》,香港中文大学中国文化研究所先后推出的先秦两汉、魏晋南北朝古籍数据库及竹简帛书和甲骨文数据库,台湾地区“中央研究院”的《汉籍电子文献》系列等,都属此类。这类机构的数字化对象选择性比较强,主要是根据教学和研究工作的实际需要来决定选题的;二是图书馆等公益性机构,如国家图书馆的古籍特藏文献数字化计划、上海图书馆的善本数字化项目、北京大学图书馆《中国基本古籍光盘库》项目等就属此类,这类机构古籍数字化主要是根据其馆藏特色来进行;三是商业性机构,如超星数字图书馆进行的古籍数字化项目、书同文数字化技术有限公司推出的电子版《四库全书》《四部丛刊》,国学公司推出的数字化《国学宝典》,迪志文化出版有限公司与上海人民出版社推出的文渊阁《四库全书》电子版等,均属此类。商业机构的古籍数字化项目的选择主要是根据市场来决定的,哪一类文献有市场,就进行哪一类文献的数字化。考虑到市场的运作,常常会选择大型类书、丛书如《古今图书集成》《四库全书》《四部丛刊》等等。
4 如何实现古籍数字化?
古籍数字化的方法和步骤是由古籍数字化的本质和目标所决定的。
[1] 史睿.试论中国古籍数字化与人文学术研究.国家图书馆学刊,1999(2).
[2] 厉莉.古籍数字化的现状与对策.江西图书馆学刊,2002(1).
[3] 张雪梅.古籍数字化与文献信息资源共享.天津工业大学学报,2002(3).
[4] 陈阳.古籍数字化发展状况概述.电子出版,2003(8).
[5](英)斯诺著;纪树立译.两种文化.北京:生活·读书·新知三联书店,1994.
[6] 朱岩.古籍数字化实践.
http://www./newpage/wjls/html/8mulu.htm.
[7] 史睿.试论中国古籍数字化与人文学术研究.国家图书馆学刊,1999(2).
[8] 李国新.中国古籍资源数字化的进展与任务.大学图书馆学报,2002(1).
原文发表于《图书馆论坛》2005年第5期
作者简介
李明杰,1971年生,江西丰城人,现为武汉大学信息管理学院教授、博士生导师。主要研究领域:文献学与中国图书文化史。主要著作有《宋代版本学研究》(齐鲁书社2006年)、《中国出版史·古代卷》(湖南大学出版社2008年)、《中国古代图书著作权研究》(社会科学文献出版社2013年)、《简明古籍整理教程》(武汉大学出版社2018年)、《暮雨弦歌:西德尼·D·甘博镜头下的民国教育(1917-1932)》(武汉大学出版社2019年),发表学术论文70余篇。