分享

周文业 | 五大名著主要版本数字化比对本丛书简介(下)

 liuhuirong 2023-04-08 发布于湖北

内容提要:本文介绍中国古代小说版本数字化研究的现状,中国古代小说版本数字化比对方法,主要介绍五大名著主要版本数字化比对本的编写情况,并对五大名著版本比对中一些问题分别作了详细说明。对五大名著版本版本研究发表了一些看法。最后介绍了历届中国古代小说版本数字化研讨会举办情况。

关键词:五大名著 版本 数字化

例5 《西游记》世德堂本、唐僧西游记、西游证道书、朱鼎臣本四版本分栏对照(第1回部分文字)

分栏对照

例6 《西游记》世德堂本、唐僧西游记、西游证道书、朱鼎臣本四版本逐行对照(第1回部分文字)

逐行对照

例7 《金瓶梅》词话本、崇祯本二版本分栏对照(第1回部分文字)

分栏对照

例8 《金瓶梅》词话本、崇祯本二版本逐行对照(第1回部分文字)

逐行对照

例9 《红楼梦》八版本分栏比对(第一回部分文字)

分栏对照

例10 《红楼梦》八版本逐行比对(第1回部分文字)

逐行对照

一般研究版本差异时,可先用分栏显示观察版本文字差异的整体情况,寻找问题。

通过分栏比对发现问题后,再针对个别问题,用逐行比对显示方式,再逐字比对,仔细研究。

计算机比对有两种结果:分栏显示和逐行显示。而版本录入又有繁体字和简体字两种,因此组合后有四种比对结果。

(1)繁体字分栏显示。

(2)繁体字逐行显示。

(3)简体字分栏显示。

(4)简体字逐行显示。

5.其他统计

此外,版本数字化后,还可用计算机对几个版本文字的相似度,以及版本的句长、同词脱文进行计算自动统计,供研究分析。

三、五大名著版本数字化比对本丛书

(一)五大名著主要版本纸本比对本

五大名著主要版本比对本是在每本书的几个主要系列中,各选一种主要版本进行比对。

l 《三国志演义》:嘉靖本、叶逢春本、黄正甫和毛本,四种。

l 《水浒传》:容与堂本、郁郁堂本、评林本和金本,四种。

l 《西游记》:世德堂本、唐僧西游记、朱鼎臣本和西游证道书,四种。

l 《金瓶梅》:词话本和崇祯本,二种。

l 《红楼梦》:甲戌本、庚辰本、戚序本、甲辰本、列藏本、郑藏本、梦稿本、程甲本、程乙本,九种。

(二)纸本比对本的价值

有人认为编写这种纸本比对本没有多大意义,现在对版本有兴趣的人不多,有多少人会去买?这也是事实。

据我所知,只有《红楼梦》版本研究还有不少爱好者,对其他四大名著版本有兴趣的人确实不多。

但造成这种情况的一个根本原因是,虽然各种版本的影印本和排印本出版很多,但缺乏真正可以使学者很方便地了解版本文字差异的相关资料。

要学者们都去逐个比对版本文字差异根本不现实,这是导致对版本有兴趣和研究的人越来越少的根本原因。

但如果出版了这种纸本比对本,对于普及版本肯定有帮助,学者从比对本可以清楚看出版本的文字差异,就会引起对版本研究的兴趣,从而推进版本研究。

但纸本比对本的市场究竟有多大,目前还难以估计,还要看推出后的效果如何。

我想,我把这十几年研究成果做个总结,也算是一个成果吧,也是了了自己的一个心愿吧。

《三国志通俗演义文史对照本》

(三)版本比对本的编写

下面介绍五大名著版本比对丛书编写方法。

1.分栏和逐行

为便于读者比较阅读和比较两版本文字差异情况,纸本同时推出分栏显示和逐行显示两种纸本。因为两种方式各有优缺点。

2.简化字和繁体字

古代小说版本数字化文本有简化字和繁体字两种,经考虑最后决定只出版简化字版。这是因为:

第一,纸本是面对一般学者和版本爱好者,因此简化字方便阅读。

第二,繁体字的文本录入中有大量异体字和俗体字,要逐字检查,工作量极大。而简化字相对工作量较小。

3.不标点、分段

简化字录入时都有标点和分段。但因为版本文字比对时,如果插入标点比对,各个版本文字标点不同,会导致比对混乱。因此比对结果不加标点,不分段。

这对于一般学者阅读没有什么问题。

4.文字错误和异体字、俗体字

原文本中有时有一些明显的文字错误,多是抄录时发生的错误。这些文字错误有的对版本研究还有参考价值。

考虑编辑纸本比对本不是供一般阅读的,而主要是供版本研究参考的,因此对这些抄录中发生的文字错误一般都不改正。

另外,由于古代小说是供一般大众阅读,因此抄写时不十分严谨,有很多异体字、俗体字。

在主要版本比对本中,全部改为正体字。但在其他版本比对本中,对于异体字和俗体字,将根据具体情况处理,有些改为正体字,有些就不改了。

5.文字差异大不比对

有些版本某些回目中的文字差异巨大。如《水浒传》中田王二传,全传本和简本故事差异太大,无法比对。因为没有比对,为便于读者阅读,文字就增加了

标点符号。但因为故事完全不同,因此文字也就没有分段。

6.故事颠倒

《水浒传》刘唐送书给宋江和宋江见阎婆两故事,在容与堂本、评林本和全传本、金批本完全颠倒了。

在比对本中,为使读者更清楚这两个故事颠倒的情况,比对分两次进行。

第一次不改变顺序比对第20回和第21回,这样比对结果会出现大批文字空白。第二次人为改变故事顺序,改变全传本、金批本故事顺序,和繁本一样,再比

对一次,这时文字差异就大大缩小了。

7.文字缺失

有些版本中文字有整回文字缺失。如《三国演义》叶逢春本十二卷中缺失两卷,为保持完整,缺失部分用其他版本(如余象斗本)补上,并加注。

8.分回不同

有些版本的分回不同,这又有两种情况。

l 有的是两回合并为一回。如《水浒传》简本的回目差异很大,有104回、115回等几种。因为回目不同,因此有些回目就合并了。如评林本104回中第7、8

两回合并为一回,类似情况还有很多。

l 有的是回目相同,但分回处不同。这在《三国演义》版本中有多处。在《西游记》中《西游证道书》因为补充了唐三藏出身,分回处和其他版本不同。

这样如照样比对,就会出现文字极大差异,对阅读很不利。

为此,对这类问题都做了调整。

l 两回合并为一回的,仍分为两回比对。

l 分回处不同的,选择某个版本为标准,其他版本都照此本分回处来修改。

这些修改都逐一加注说明。

以上这些修改并未改动版本的原文,而只是为比对更清楚,而只改动了比对方式而已。

9.版式、篇幅

纸本比对本如果开本小,每栏(每个版本)的文字太少,显示阅读不方便,因此决定采取8开本,10号字。版式为55×47字,每页约2585字。

五大名著主要版本两种形式比对本,总计23册,总字数约3,900万字。

五大名著主要版本比对本篇幅:

四、对古代小说版本研究的看法

五大名著版本问题一贯非常复杂,对此有如下体会。

第一,研究版本首先是要分析文字差异。

数字化比对可以快速、一字不漏地查出所有的文字差异,为后续分析打下很好的基础。

戚序本和庚辰本关系等研究利用了数字化比对,效果很好。在数字化比对基础上,还要根据分析的目的,对文字差异进行分类,以便于下一步研究。

第二,要对文字差异进行合理的解释。

解释中要特别注意解释的多种可能性,不带任何偏见。对以上所有问题,还都存在多种解释,即存在多种可能性。对多种可能性要进一步分析哪种可能性更

大。

要注意,从不同角度分析,各种可能性的大小会不同。这样问题最终又演变成哪种解释更合理,哪种可能性更大的问题。而这又是仁者见仁,智者见智的问

题了,最终恐怕无法得出大家都认可的结论。

这也是古代小说版本研究中的难题,很多问题最终都没有结论。

第三,要特别注意研究各种问题的严密推理。

在版本研究中,严密的推理非常重要,有些学者的推理根本不合逻辑,和这样的学者讨论问题就非常困难了。

第四,版本研究的复杂性。

虽然数字化比对可以做到无一遗漏,但由于资料不足,又有多种解释和可能性,很多问题最终可能还是无法得出令人信服的结论。

五大名著版本中的矛盾非常多,这些矛盾是如何产生的,又有多种解释。

由于资料不足,要确定到底是什么原因造成这种矛盾现象,是十分困难的,甚至可以说,要彻底破解这些谜团是完全不可能的事情。

第五,研究只要有进展就是进步。

对五大名著版本研究只要发现矛盾,进而分析这些矛盾,提出各种解释,分析各种可能性,把研究推向前进,就是有意义的,是值得的。

对上述五个问题的研究,虽然可能没有得出令红学界所有人都信服的最后结论,但很明显是有所前进的。

我认为,只要研究有所推进,提出一些新看法,就值得肯定,就是好事,就应支持。

五大名著研究是十分复杂的,深入研究下去,会发现其中矛盾重重。

目前很多学者不愿意研究版本。因为版本中矛盾太多,不管如何研究,都无法得出令人信服的结论。与其做这样无结果的研究,不如去做其他实实在在有结

果的研究,更有成效。

我觉得这种看法虽然有道理,但版本研究也不是就没有前途了。但仔细分析版本研究还是有继续研究的余地的,虽然难度很大,越深入难度越大,但还不是

就没有任何值得研究的了。

我还在坚持研究五大名著的版本,日本也有学者在研究古代小说版本,对此我并不悲观。

古代小说版本是非常复杂的,对古代小说版本研究应注意以下问题。

1.研究古代小说版本不能只举出几个例子就轻易下结论。因为这些例证基本都不是“铁证”,都可能有多种解释,抓住几个例子就下结论,就犹如瞎子摸

象,只看到部分环节就对整体下结论。

2.研究古代小说版本一定要尽可能把证据收集全,以往人工整理,人工比对版本的文字差异,是极其费事的事情,要收集全部证据几乎不可能。

现在版本数字化后,版本文字比对就是轻而易举的事,可以做到逐字比对,从而可以对版本做彻底的分析。

3.在全面、彻底分析的基础上,要特别注意分析多种可能。过去很多学者习惯于,只找到一种对自己最有利的可能,就下结论,而根本不考虑其他可能。这

样的分析和结论都是不可靠的。

4.在多种可能中,要注意研究哪种可能性更大。当然由于角度不同,对哪种可能性更大也会有不同看法。

5.对版本研究也有悲观的看法,一者认为版本中的各种情况,都有多种解释,即“公说公有理,婆说婆有理”,最后没有结果。事实可能确实如此,但仔细

分析,把各种可能都分析透,也是进步。

6.对版本研究的悲观看法还认为,由于不可能找到作者的原本,不可能找到版本演化中的所有版本,因此版本研究是没有前途的,白费力。的确,要找到作

者原本和收集全部版本是不可能的,但这不意味着版本研究就没有前途。

在新方法(如数字化)出现后,研究还是会有进展的。版本研究只要方法正确,就会有进展,虽然有时这些进展可能是很微小的。

《一百二十回本版本研究和数字化论文集》

五、中国古代小说戏曲暨数字化研讨会

从中国古代小说版本数字化研究开始,我就认为这些研究必须相互交流。但如果只靠发表文章的话,推进会非常慢,最有效、最快捷的方法是举办研讨

会,这样学者们可以直接面对面交流。

为此,从1999年《三国演义》版本数字化开始,我就筹备举办研讨会。

2001年在首都师范大学举办了第一届国际研讨会,时隔一年之后,2003年在首都师范大学举办了第二届国际研讨会,从此每年举办一次,一直坚持到今日。

中国古代小说戏曲文献暨数字化学术研讨会从2001年举办第一届以来,已经先后举办过21届,11届在中国大陆,即

2001、2002、2005、2007、2009、2011年6届在北京首都师范大学

2013年在上海复旦大学,

2015年在河北廊坊师范学院,

2017年在北京中国传媒大学,

2019年在湖北师范大学,

2021年在广州大学(线上)。

有10届在中国大陆以外,即:

2004年在韩国首尔详明大学,

2006、2014年在日本东京大东文化大学,

2016年在日本早稻田大学,

2008年在澳门大学,

2010年在韩国首尔成均馆大学

2012年在台湾嘉义大学,

2018年在马来西亚马来大学、德国维藤大学和奥地利维也纳大学,

2020年在德国(线上),

2022年在日本(线上)。

2001—2022年二十一届中国古代小说戏曲文献暨数字化学术研讨会

从2001年由我发起举办第一届“中国古代小说文献暨数字化研讨会”以来,在我一个人的努力下,研讨会得到国内外热心学者的大力支持,能够坚持十几

年,每年都举办,连续举办二十一届是很难得的。这二十一次专题研讨会大大促进了中国古代小说数字化的发展,研讨会对于促进中国古代小说、戏曲文献暨数

字化的交流和研究起了很好的推动作用。

总 结

古代小说版本数字化是研究古代小说版本的重要工具,计算机自动比对可以显示出版本的文字差异,所有文字差异一字不少,全部可显示出来。

计算机自动比对可大大减轻人工比对的劳动,使得学者有更多时间和精力,去从事版本的研究工作。

纸本出版物可以清楚显示各个版本的文字差异,对了解主要版本的整体差异很有帮助。

当然数字化也不是万能的,数字化比对结果最终还是需要人工去研究分析。

计算机只能显示文字差异,而无法进行分析,分析研究还需要人工来进行。因此对数字化既不能否定,也不能估计过高。但数字化肯定对版本研究有很大帮

助是不可否认的事实。

欢迎学者对五大名著主要版本比对本提出意见,以便把这套书做的更好。

《中国古代小说数字化随笔》

文章作者单位:首都师范大学

本文获授权由本公众号首发,转发请注明出处。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多