《金瓶梅》版本现状

《金瓶梅》版本和其他四大名著相比,比较简单,只有三种,即“崇祯本”、“词话本”和张竹坡评本。

张竹坡评本以崇祯本为基础加评语,实际属于崇祯本系统,因此《金瓶梅》也可以只分为“词话本”和“崇祯本”两个系统。

“词话本”即《新刻金瓶梅词话》100回十卷,为明万历年间刻本,因为书名中有“词话”字样,因此一般称为“词话本”。

“崇祯本”即《新刻绣像批评金瓶梅》100回二十卷,为明崇祯年间刻本,因此一般称为“崇祯本”,有插图二百幅。另还有内阁文库本系列,但实际是崇祯本的修订本。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(1)

张评本即《张竹坡批评第一奇书金瓶梅》,刊刻于清康熙三十四年,是以崇祯本为底本,文字略有修改,主要增加了近十万言的总评、回评和读法等评论。

考虑到词话本和崇祯本都没有批语,只有张竹坡本有批语,因此张竹坡本批语没有比对价值了。

而张竹坡本在文字上又与崇祯本基本相同,再把张竹坡本文字和词话本、崇祯本进行比对也意义不大。因此《金瓶梅》文字比对本目前只做“词话本”和“崇祯本”的文字比对,没有批语。

不同的使用目的,使用不同的比对本

对《金瓶梅》版本有兴趣的人可分为三类。

第一类人只希望了解版本的大致情况。

这些人并不专业从事版本研究,只需要对于各种小说的各种版本的差异有个大致了解,只要知道版本分类大致情况,和版本之间的大致差异就可以了,不想了解版本更详细内容。

如对于《金瓶梅》版本只要知道《金瓶梅》版本有三种,每种的大致情况就可以了。这是古代小说一般研究人员和学生。

对于这部分人,只要看相关版本研究的资料即可,不必为他们提供专门版本研究资料。

第二类人对版本有兴趣,需要知道一些详细情况,但不进行深入研究。

这些人也并不专业从事版本研究,但不只是对于各种小说的各种版本的差异有个大致了解就可以了,还想知道版本更详细内容,有时由于研究的需要,也可能需要仔细了解某部小说的版本差异的一些细节情况,但又不想知道太详细了。

这些学者无需像版本研究学者那样细致了解各种版本的差异,不像版本研究人员要求那样“深”,但要求“宽”。

如对于《金瓶梅》版本,不只要知道《金瓶梅》版本有三种,每种的大致情况就可以了,还要知道三类内文字的差异到底有多大?文字差异大致是什么情况。

因此对于这部分人,应该提供对应他们要求的版本研究的专门资料,这样的版本资料只要使他们大致了解版本差异即可,最好是一个全面、概括、清楚、简介的资料,使得他们可以很方便大致了解版本文字的差异,无需进行仔细研究。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(2)

第三类人是专业从事古代小说版本研究的学者。

对于版本研究的专业学者,要求是“精”和“深”,收入的版本数量越多越好。

不止要大致知道各类版本的文字差异,还要研究各类版本内部的差异的演变,要研究版本细节。

对于《金瓶梅》要研究词话本和崇祯本所有文字的细微差异。

因此对这些专业版本研究学者,提供的版本比对要尽量细致,最好要做到逐字比对。就要提供最完整、最详尽的版本研究资料。

总之,对不同人员,应该提供不同的版本资料。

为此,针对上述第二类和第三类人员,利用数字化比对,分别制作和提供了分栏比对本和逐行比对本两种文字比对本。

《金瓶梅》词话本、崇祯本文字的两种比对本

要针对不同使用者,完成《金瓶梅》两个版本文字的不同比对结果,最好的办法是数字化比对。即先把两本文字数字化,再利用计算机对两版本的文字进行自动比对,文字相同的对齐,文字不同的错开。

计算机比对有两种比对结果,有两种显示方式,分别适合上述两种用户。

1.分栏显示

即一个版本占一栏,下面是词话本和崇祯本第四回部分文字的分栏比对结果。(排版原因,表格省略。)

上例描述西门庆和潘金莲初次见面,崇祯本比词话本增加了大段描写。(排版原因、表格省略)

上例描述西门庆和潘金莲初次见面,崇祯本将词话本文字做了大幅度修改。(排版原因,表格省略。)

上例描述潘金莲和王婆对话,崇祯本将词话本文字做了部分修改。

这种分栏显示方式可以清楚看出两本文字的大致差异,可以看出崇祯本对词话本文字做的很多删改。但文字到底差别在哪里,实际并不十分清楚。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(3)

2.逐行逐字显示

即一个版本占一行,下面是词话本(词)和崇祯本(崇)第四回部分文字的逐行比对结果。

词:妇人慌的扯住 他裙子便双膝跪下说道 干娘饶恕王婆 道你们都

崇:妇人慌的扯住她 裙子红着脸低了头只得  说 声干娘饶恕王婆便道你们都

  -------------------------------------

词:要依我一件事妇人便道休说一件便是十件奴也依干娘王婆道从今日为始瞒着武大每日

崇:要依我一件事 从今日为始瞒着武大每日

  -------------------------------------

词:休要失了大宫 人的意早叫你早来晚叫你晚来我便罢休若是一日不 末我便就对你武

崇:休要失了大 官人的意早叫你早来晚叫你晚来我便罢休若是一日不来 我便就对你武

  -------------------------------------

词:大说那妇人 说 我只依着 

崇:大说那妇人羞得要不的再说不出来王婆催逼道却是怎的快些回覆我妇人藏转  着头

  -------------------------------------

词:干娘说便 了王婆又道西门大官人你自不用着老身说得这十分好事已都完了

崇:低声道来 便是了王婆又道西门大官人你自不用 老身说得这十分好事已都完了

  -------------------------------------

词:所许之物不可失信你若负心一去了不来我也要对武大说西门庆道干娘放心并不失信婆

崇:所许之物不可失信你若负心 我也要对武大说西门庆道干娘放心并不失信婆

  -------------------------------------

词:子道你每二人出语无凭 当各人留下件表记物件拿着才见真情西门庆便向头上拔下一

崇:子道你每二人出语无凭要 各人留下件表记拿着才见真情西门庆便向头上拔下一

  -------------------------------------

词:根金头银簪又来插在妇人云髻上妇人除下来袖了恐怕到家武大看见生疑      

崇:根金头 簪 来插在妇人云髻上妇人除下来袖了恐怕到家武大看见生疑妇人便不肯拿

  -------------------------------------

词: 一面亦将袖中  巾帕递 与西门庆

崇:甚的出来却被王婆扯着袖子一掏掏出一条杭州白绉纱汗巾  掠与西门庆

  -------------------------------------

词:收了三人又吃了几杯 洒已是下午时分那妇人便起身道武大那厮也是归来时分奴回家

崇:收了三人又吃了几杯酒 已是下午时分那妇人 起身道          奴回家

  -------------------------------------

词:去罢便  拜辞王婆 西门庆踅过后门归来先去下了帘子武大恰好进门且说王婆看着

崇:去罢便丢下  王婆与西门庆踅过后门归来先去下了帘子武大恰好进门且说王婆看着

  -------------------------------------

词:西门庆道好手段么西门庆道端的亏了干娘  智赛随何机强陆贾女兵十个九个都出不

崇:西门庆道好手段么西门庆道端的亏了干娘真好                 

  -------------------------------------

词:了干娘手 王婆又道这雌儿风月如何西门庆道这色系子女不可言婆子道他 房里弹唱

崇:   手段王婆又道这雌儿风月如何西门庆道 色系子女不可言婆子道 她房里弹唱

  -------------------------------------

词:姐儿出身甚么事儿不久惯知道得还亏老娘把你两个生扭仿 夫妻强撮成配你所许老身

崇:姐儿出身甚么事儿不久惯知道 还亏老娘把你两个生扭 做夫妻强撮成配你所许老身

  -------------------------------------

词:东西休要忘了西门庆道干娘这般费心我到家便取锭银子送来所许之物岂肯昧心王婆道

崇:东西休要忘了西门庆道      我到家便取 银子送来        王婆道

  -------------------------------------

词:眼望旌节至  耳听好消息不要交老身棺材出了讨挽歌郎钱西门庆道但得一片橘皮吃

崇:眼望旌  捷旗耳听好消息不要交老身棺材出了讨挽歌郎钱西门庆        

这种逐行显示方式刚好和前面分栏显示相反,两本文字差异整体上不明显,但文字上下逐字比对,个别文字的具体差别十分清楚。

1.词话本“便双膝跪下”,崇祯本改为“红着脸低了头”。

2.词话本“妇人便道休说一件便是十件奴也依干娘”,崇祯本删除。

3.词话本“我只依着干娘”,崇祯本改为“羞得要不的再说不出来。王婆催逼道:却是怎的快些回覆我?妇人藏转着头低声道:来便是了”。

4.词话本“干娘这般费心我到家便取锭银子送来所许之物岂肯昧心”,崇祯本改为“我到家便取银子送来”。

至于崇祯本为何要做这些修改,就得人工再仔细分析了。计算机文本比对只能提供文本差异。

因此,这两种显示方式各有优缺点。

分栏显示中,版本文字差异整体情况显示清楚,一眼可看出两版本文字差异的大致情况。但文字差异的细节不明显和清楚。

逐行显示和分栏显示刚好相反,逐行显示文字差异细节清楚,逐行文字上下比对,可以清楚看出两本文字逐字的差异。但文字差异的整体情况不如分栏比对清楚。

繁体字和简体字

比对本分别采用了繁体字和简体字两种。之所以采用两种文字是因为两种文字的使用目的不同。

繁体字保留了原本文字的原貌,同一个字可能有不同写法,即异体字、俗体字,繁体字本都保留下来,因为这些异体字、俗体字在版本研究中有时很有用。

如果都变成正体字,就看不出这些变化了,对版本研究有时很不利。因此繁体字本保留了各种异体字和俗体字是有必要的。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(4)

但大量异体字、俗体字对阅读很不利,对版本比对也很不利。对于主要是阅读的用户来说,保留这些异体字、俗体字没有多大意义。

因此为了一般阅读需要,又制作了简体字本。这样对一般阅读和文字比对就很清楚和方便了。

因此,繁体字和简体字本各有各的用途,可适应不同用户。用户可根据自己需要选择。

简体字、繁体字和分栏、逐行四种比对本

《金瓶梅》版本数字化已经完成了四种版本,即词话本、崇祯本中的北京大学本、东京大学本和张评本。

由于张竹坡评本是以崇祯本为基础加评语,实际两版本文字差异很小。

崇祯本中的北京大学本、东京大学本文字差异也不大。因此《金瓶梅》计算机自动比对只比对词话本和崇祯本的北大藏本两个系统。

词话本和崇祯本两个版本分别录入了简体字和繁体字,又有分栏和逐行两种显示方式,这样计算机自动比对本最后就有四种结果:

1.繁体字分栏比对本,

2.繁体字逐行比对本,

3.简体字分栏比对本,

4.简体字逐行比对本。

这四种比对本开本有16开本(B5纸)和8开本(A4纸)两种。因为每本书很厚,因此每本都分为上下两册。

16开本书较厚,但开本略小。而8开本相对较薄,但开本较大。因为打印16开本和8开本每页价格相同,因此相对而言,8开本因为页数略少,因此略便宜一些。总之,各种开本各有优缺点。

这样四种比对本总计有8种形式。四种比对本8种形式的篇幅、成本价格统计如下表。(排版原因,表格省略。)

如前所述,由于分别采用繁体字、简体字和分栏、逐行显示,就有四种比对本,这四种比对本是针对四种不同的用户。如何使用繁体字、简体字和分栏、逐行四种比对本

一般用户阅读可使用简体字本,版本专业人员研究可使用繁体字本。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(5)

在分栏和逐行比对方面,如只是想了解两版本文字的大致差异,可选分栏比对本。如还想进一步了解两版本文字差异的细节,可选逐行比对本。

一般研究版本差异,可先用分栏显示观察版本文字差异的整体情况,寻找问题。

通过分栏比对发现问题后,再针对个别问题,用逐行比对显示方式,再逐字比对,仔细研究。

因此把四种比对本都整理出来,读者可根据自己需要选择。

第一,繁体字逐行比对本:专门从事版本研究,需要研究文字细微差异,可使用繁体字逐行比对本。

第二,繁体字逐行比对本:专门从事版本研究,不需要研究文字细微差异,只要大致知道版本文字差异,可使用繁体字分栏比对本。

第三,简体字逐行比对本:不专门从事版本研究,但需要了解版本文字的细微差异,简体字逐行比对本。

第四,简体字分栏比对本:不专门从事版本研究,不需要了解版本文字的细微差异,只要知道版本文字的大致差异即可,可使用简体字分栏比对本。

其实,得到此两种版本任意一种比对本,实际就等于同时获得了词话本和崇祯本,还可以看出两本差异,可谓一举多得。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(6)

《金瓶梅》词话本和崇祯本简体字两种比对本在2016年广州第十二届国际《金瓶梅》学术研讨会曾作为样书,提交大会,受到一些金学专家的一致好评,认为这种比对本对于研究《金瓶梅》版本是个很方便的工具书。

由于当时只是初稿,错误很多,只各带了一本,赠送给了最需要的学者。

会后又对文本再进行了初步整理,在2017年云南大理《金瓶梅》研讨会上再提供给感兴趣的学者们。

文字录入中的问题

1、文字标点。简体字本文字加标点,对阅读十分方便。但比对中加入文字标点后,对检查文字差异很不利。

比对主要是研究文字差异,不是为阅读,因此比对中都删除了所有的标点。

2、异体字、俗体字。《金瓶梅》文本最大问题是有大量异体字和俗体字,这些字多数在计算机字库中是没有的。

如对文字要求比较高,这些字就得逐字造字,工作量极大。考虑本书不是正式出版物,只是提供给学者参考,因此就用相近的字代替。

如将来正式出版时再逐一造字解决这个棘手问题。

3、色情描写。一般正式出版时,《金瓶梅》中的色情描写都被删除了。考虑本书是为学术研究所用,因此这些色情文字都予以保留。

4、校对。所有的比对文本都未经过仔细校对,如要正式引用,请务必再与原书核对。

插 图

《金瓶梅》词话本没有插图,但崇祯本有插图。

崇祯本有多种,包括:王孝慈旧藏本、北大藏本、天津图书馆藏本、首都图书馆藏本、日本内阁文库(现日本国立文书馆)藏本、日本东京大学东洋文化研究所藏本等。

各个版本的插图中,王孝慈旧藏本、北大藏本插图质量较好。

由于本书主要是用于比对研究版本的文字,插图只是辅助性质。因此没有固定选用某个版本的插图,而是从上述藏本中,分别选用了图像质量比较好、比较清楚的插图,也就不再一一注明各幅插图的来源。

崇祯本插图多数是单独成册。本书为使插图和文本更紧密连接,便于读者阅读,没有把插图单独成册,而采取一般做法,把插图置于每回之前。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(7)

发行和出版

词话本和崇祯本的两种比对本目前都已经整理完成,本书是为研究使用,不公开出售。

如有人需要,可直接来信、来电联系告知需要哪种比对本,我可以打印成书后快递发出,只收成本费(见表2),快递费采用倒付,即由用户支付。

如有出版社曾出版过词话本和崇祯本两种《金瓶梅》版本,也就有了这两种版本的电子文本,再用计算机进行自动比对,就可很快生成这两种比对本,因此要出版这两种比对本实际也是很容易的。

如果出版社只出版过词话本和崇祯本中的一种版本,只要再校对出另一种版本,利用计算机也可自动生成这两种比对本。

古代小说版本数字化后,除上述比对外,还可进行一些数字化的研究,如差异统计、同词脱文统计、句长统计、对话统计等,分别简介如下。

词话本、崇祯本文字差异比较

词话本和崇祯本有两处文字差异很大,一处是第1回,一处是第53-54回。

词话本第1回是先介绍武松打虎,然后再说西门庆、潘金莲。而崇祯本第1回是直接从介绍西门庆开始,然后转入武松打虎后被迎接回县城,没有讲述武松打虎的过程。

第1回词话本和崇祯本简体字差异为28.99%,两个版本文字差异太大,如直接比对没有任何意义,为此第1回文字不做比对。第2回词话本和崇祯本差异为83.03%,文字差异较小,因此做了比对。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(8)

词话本第1回末尾讲潘金莲勾引武松,武松痛斥后搬出武大家。而在崇祯本中,这部分是改在第2回开头。这是因为崇祯本因为删去武松打虎,第1回文字减少,为各回文字平衡,就把词话本第一回末尾这段故事改到崇祯本第2回开头了。

如照原文比对词话本和崇祯本,这段文字就无法比对了。

为比对清楚,就把崇祯本第2回的这段文字,挪到第1回结尾,这样就可以比对两本的这段文字了。

词话本和崇祯本另一处文字差异大之处一般认为是第53-57回,对此很多学者进行了分析。

其实仔细比对这几回崇祯本和词话本简体字文字差异结果如下:

第53回:4.24%,第54回:3.54%,第53-54回文字几乎完全不同。

第55回:44.64%,第56回:66.8%,第57回:70.3%,第55-57回文字差异从44.64%到70.3%,从不到一半,到70%,部分文字相同。

因为第53-54回文字差异太大,文字不做比对。第55-57回部分文字差异差异不是太大,因此还是进行了比对。

下面是利用计算机自动计算出的崇祯本和词话本简化字、繁体字各回文字差异。

繁体字差异都比简体字小,这是因为有多种繁体字对应一个简体字,因此简体字差异就减小了。(排版原因,表格省略。)

以上对词话本和崇祯本各回文字的繁体字和简化字的差异进行了计算,下面以繁体字为例,进行初步分析。

词话本和崇祯本100回平均差异为70.62%。

根据词话本和崇祯本差异计算结果,100回可分为以下三类。

(1)差异最大的3回在20%以下。

第1回(15.84%)、第53回(3.51%)、第54回(2.81%)的差异都在20%以下,这是由于崇祯本文字做了大幅度改写,导致差异大大下降。

(2)差异差异中等的5回在60%以下。

100回中有5回差异在60%以下。

第55、74、66、73回差异分别为39.39、48.78、52.8、54.631%,这是由于崇祯本删除了词话本大段文字,两本文字都有较大差异,导致差异下降。

(3)差异很小的3回在83%以上。

100回中差异最小的3回是:第88回“陈敬济感旧祭金莲 庞大姐埋尸托张胜”83.37%、第32回“李桂姐拜娘認女 應伯爵打渾趨時”83.67%,和87回“王婆子貪財受報 武都頭殺嫂祭兄”84.52%。这3回崇祯本文字几乎没有改动。

除上述介绍的几回以外,100回中其他各回差异都在60—82%之间。

词话本和崇祯本同词脱文

“同词脱文”是中国古代小说中经常发生的事情。小说在抄写或刻印中,当同一词出现两次而位置很近时,由于疏忽,很可能会将第二个词看成第一个词,而将两个词中间的文字遗漏掉,称为“同词脱文”或“串行脱文”。

同词脱文是小说研究,特别是版本演化分析的一个有力手段,在古代小说版本研究中被广泛采用。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(9)

在《三国演义》版本研究中,英国魏安用人工统计所收集到的35个版本,共发现154处“同词脱文”,以此对《三国演义》版本演化进行了详细分析,得出了《三国演义》版本演化图。

另外,在目前《红楼梦》热点问题“程前脂后”的论战中,同词脱文也是一个重要的分析研究手段。

有人也是利用人工方法,统计庚辰本和程甲本的同词脱文,共发现120多处。

传统人工进行多个版本同词脱文分析是非常繁琐的事情,效率极低,要准确统计和比较两个版本之间的同词脱文,是非常困难的事。

而用计算机代替人工比较和准确统计两个版本之间的同词脱文,是非常容易的事,效率大大提高,在这方面,最能发挥计算机的优势。数字化同词脱文为学者研究版本提供了一个有利的工具。

用计算机统计《金瓶梅》词话本和崇祯本的“同词脱文”,总计有15处,都是崇祯本出现了同词脱文,而词话本没有任何同词脱文。这说明崇祯本晚出,其文字是修改过的,有脱文,因为要词话本后出就要增补这些文字,这是十分困难的。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(10)

下面逐一列出这15处同词脱文。

1、第2回:18字

词话本:嫦娥偷汉子这婆子端的惯调风月巧排常在公门操斗殴这婆子正开门在茶

崇祯本:嫦娥偷汉子这婆子正开门在茶

脱文为:这婆子

2、第14回:21字

词话本:不知往房里去了俺姐儿一日脸不知匀多少遭数要便走的匀脸去了诸般都好只

崇祯本:不知往房里去了诸般都好只

脱文为:去了

3、第18回:17字

词话本:苦这等费心月娘递了酒经济傍边坐下须臾馔肴齐上月娘陪着他吃了

崇祯本:苦这等费心月娘陪着他吃了

脱文为:月娘

4、第25回:15字

词话本:道爹若这等才好休放他在家里使的他马不停蹄才好正说着西门

崇祯本:道爹若这等才好正说着西门

脱文为:才好

5、第29回:23字

词话本:八羔子学舌打了他小厮说他小厮一点尿不晓孩子晓的甚么便唆调打了他恁一顿早是

崇祯本:八羔子学舌打了他 恁一顿早是

脱文为:打了他

6、第35回:26字

词话本:每 冬衣了正是恨小非君子无毒不丈夫毕竟未知后来何如且听下回分解正是只恨闲愁成

崇祯本: 们冬衣了  正是只恨闲愁成

脱文为:正是

7、第45回:24字

词话本:在外边伺候西门庆即令与我叫进来不一时把六名乐工叫至当面跪下西门庆向伯爵道他

崇祯本:在外边伺候西门庆 向伯爵道他

脱文为:西门庆

8、第52回:16字

词话本:起思量起怎不上心伯爵道揉着你那痒痒处不由你不上心无人处无人

崇祯本:起思量起怎不上心  无人处无人

脱文为:不上心

9、第65回:25字

词话本:是小的妹子西门庆问你们吃了酒饭不曾周采道小的刚才都吃过酒饭了西门庆因一回想起

崇祯本:是小的妹子 西庆因想起

脱文为:西门庆

10、第74回:17字

词话本:酒四样下饭西门庆看贴儿上写着眷晚生王宷顿首拜西门庆即便叫王经

崇祯本:酒四样下饭西门庆即叫王经

脱文为:西门庆

11、第75回:23字

词话本:一百本历日西门庆叫了陈经济来问了四包银子已久交到后边去了西门庆走到厅上春

崇祯本:一百本历日 西门庆走到厅上春

脱文为:西门庆

12、第75回:25字

词话本:  乞我把贼瞎淫妇一顿骂立撵了去了若不是大妗子劝着我验上与这贼瞎淫妇两个耳刮子

崇祯本:方才  把贼瞎淫妇两个耳刮子

脱文为:贼瞎淫妇

13、第78回:14字

词话本:上 腹溶溶被翻红浪那阵上刷刺刺帐控银钩被翻红浪精神健  

崇祯本:上复 溶溶 被翻红浪精神健那阵

脱文为:被翻红浪

14、第83回:24字

词话本:管上下尊卑一个气的吁吁犹如牛吼柳影一个娇声历历犹似莺啭花间一个椅上逞雨意

崇祯本:管上下尊卑 一个椅上逞雨意

脱文为:一个

15、第85回:27字

词话本:高遮了太阳薛嫂道孩儿出了痘疹了没曾妇人道何曾出来了还不到一周儿哩薛嫂道春梅姐说爹

崇祯本:高遮了太阳 薛嫂道春梅姐说爹

脱文为:薛嫂道

句长和对话

小说版本数字化以后,就可利用计算机对文本的句长和对话进行统计。句长是指两个任意标点之间句子的字数,对话是指对话文字在全部文字中的比重。

下表是对五大名著句长和对话的统计。

书名

版本

句长

对话

平均句长

排序

对话句长

排序

对话比重%

排序

《金瓶梅》

词话本

6.5

7

6.7

3

60.9

9

崇祯本

6.4

6

6.7

3

65.1

10

《三国演义》

嘉靖本

5.7

1

5.6

1

38.6

1

黄正甫本

5.8

2

5.6

1

41.7

2

毛本

5.7

1

5.6

1

42.4

3

《红楼梦》

庚辰本

7.0

9

7.1

6

48.7

5

程甲本

6.8

8

7.0

5

50.0

6

《水浒传》

容与堂本

6.1

4

6.3

2

48.2

4

金评本

6.3

5

6.3

2

52.7

7

《西游记》

世德堂本

6.0

3

6.8

4

54.6

8

根据上述统计,五大名著句长和对话的排序如下。

句长(长——短)

1

2

3

4

5

红楼梦

西游记

金瓶梅

水浒传

三国演义

对话(多——少)

1

2

3

4

5

金瓶梅

西游记

水浒传

红楼梦

三国演义

句长最长的是《红楼梦》,最短的是《三国演义》。

对话最多的是《金瓶梅》,最少的也是《三国演义》。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(11)

总 结

古代小说版本数字化是研究古代小说版本的重要工具,计算机自动比对可以显示出版本的文字差异,所有文字差异一字不少,全部可显示出来。

计算机自动比对可大大减轻人工比对的劳动,使得学者有更多时间和精力,去从事版本的研究工作。

纸本出版物可以清楚显示各个版本的文字差异,对了解主要版本的整体差异很有帮助。

当然数字化也不是万能的,数字化比对结果最终还是需要人工去研究分析。

计算机只能显示文字差异,而无法进行分析,分析研究还需要人工来进行。因此对数字化既不能否定,也不能估计过高。但数字化肯定对版本研究有很大帮助是不可否认的事实。

金瓶梅版本的数字化比对和研究(金瓶梅版本的数字化比对和研究)(12)

文章作者单位:首都师范大学

本文由中国《金瓶梅》研究会授权刊发,转发请注明出处。

,