《紅樓夢》等名著作者是誰?讓數(shù)學(xué)來證明
《紅樓夢》是一人所作?
《紅樓夢》成書迄今已逾200年,作為中國最重要的一部小說,它不僅感動了中國人,也得到其它民族的重視與喜愛?!都t樓夢》有各種不同的版本,數(shù)十種續(xù)書,流傳到世界各國,被翻譯成各種文字,透過不同的文字翻譯,感動了不同民族的人民。
長期以來,人們普遍認(rèn)為曹雪芹只寫了《紅樓夢》的前80回,后40回是高鶚續(xù)寫,但數(shù)學(xué)統(tǒng)計進(jìn)入文學(xué)領(lǐng)域后,這個定論遭到了計算機的質(zhì)疑。1981年,首屆國際《紅樓夢》研討會在美國召開,美國威斯康星大學(xué)講師陳炳藻獨樹一幟,宣讀了題為《從詞匯上的統(tǒng)計論〈紅樓夢〉作者的問題》的論文,首次借助計算機進(jìn)行《紅樓夢》研究,轟動了國際紅學(xué)界。陳炳藻從字、詞出現(xiàn)頻率入手,通過計算機進(jìn)行統(tǒng)計、處理、分析,對《紅樓夢》后40回系高鶚?biāo)鬟@一流行看法提出異議,認(rèn)為120回均系曹雪芹所作。
語體風(fēng)格是人們在語言文字表達(dá)活動中的個人言語特征,是人格在語言文字活動中的某種體現(xiàn)。這種風(fēng)格可以在一定程序上通過數(shù)量特征來刻畫。例如,句長和詞長可以代表作者造詞句的風(fēng)格,當(dāng)然,反映作者風(fēng)格的不是單個詞的詞長和單個句子的句長,而是以一定數(shù)量的語料為基礎(chǔ)的平均句長和平均詞長;此外,字、詞在作品中出現(xiàn)的頻率也是個人風(fēng)格的體現(xiàn)。利用計算機計算一部作品或作者平均詞長和平均句長,對作品或作者使用的字、詞、句的頻率進(jìn)行統(tǒng)計研究,從而了解作者的風(fēng)格,這被稱之為計算風(fēng)格學(xué)。計算風(fēng)格學(xué)現(xiàn)在在社會科學(xué)領(lǐng)域成為一門饒有興味的學(xué)科,尤其在判斷作者真?zhèn)?,考證作者疑難方面更是大顯身手。
讓佚名作現(xiàn)身
“作者考證”有時是一個很困難的問題,計算風(fēng)格學(xué)可被應(yīng)用來解決這種問題。我們看看兩個例子。
出現(xiàn)于16世紀(jì)90年代的一部五幕劇《愛德華三世》,表現(xiàn)了14世紀(jì)英王愛德華三世統(tǒng)治時期勇武的騎士精神。但該劇作者究竟是誰,戲劇界爭論了幾百年。不久前,通過電腦對該劇的語言風(fēng)格進(jìn)行分析,莎翁作品的權(quán)威機構(gòu)——阿頓公司正式確認(rèn),《愛德華三世》是莎士比亞的一部早期作品。莎劇專家說,這部作品本身所表現(xiàn)出的深刻人性、博大精神和文辭語言的華麗無可辯駁地“用莎士比亞自己的聲音”證明了它的來源。
1964年,美國統(tǒng)計學(xué)家摩斯泰勒和瑕萊斯考證了12篇署名“聯(lián)邦主義者”的文章作者,可能的作者是兩個人,一個是美國開國政治家漢密爾頓,另一位是美國第四任總統(tǒng)麥迪遜。究竟是哪一位呢?統(tǒng)計學(xué)家在進(jìn)行分析時發(fā)現(xiàn)漢密爾頓和麥迪遜在已有著作中的平均句長幾
乎完全相同。這使得這一能反映寫作風(fēng)格特征的數(shù)據(jù)此時失效了。于是,統(tǒng)計學(xué)家轉(zhuǎn)而從用詞習(xí)慣上來找出這兩位作者的有區(qū)別性的風(fēng)格特征,而且終于找到了兩位作者在虛詞的使用上有明顯的不同。漢密爾頓他已有的18篇文章中,有14篇使用了“enough”一詞;而麥迪遜在他的14篇文章中根本未使用“enough”一詞。漢密爾頓喜歡用“while”,而麥迪遜總是用“whilst”。漢密爾頓喜歡用“upon”,而麥迪遜很少用。然后,再把兩位可能的作者的上述風(fēng)格特征指標(biāo),與未知的12篇署名“聯(lián)邦主義者”的文章中表現(xiàn)出來的相應(yīng)的風(fēng)格特征進(jìn)行比較。結(jié)果發(fā)現(xiàn)那位署名“聯(lián)邦主義者”的作者就是美國第四任總統(tǒng)麥迪遜。這樣就了結(jié)了這一考據(jù)學(xué)上長期懸而未決的公案。兩位統(tǒng)計學(xué)家所使用的數(shù)學(xué)方法也得到了學(xué)術(shù)界的好評。