首頁 文化 副刊文學

美國《聯邦論》到底是誰寫?亞歷山大.漢彌爾頓(Alexander Hamilton)、詹姆士.麥迪遜(James Madison),還是約翰.傑(John Jay)?

《文學大數據》是統計學家分析風格指紋的有趣書籍!(創意市集提供)
《文學大數據》是統計學家分析風格指紋的有趣書籍!(創意市集提供)

⊙班‧布萊特(Ben Blatt)
(編輯前言:該書剛出版即榮登亞馬遜暢銷榜「現代文學評論」分類第一名,並獲得許多外媒推崇。

這是一本乍看很難讀、但卻令人會心一笑的文學評論。如果你對語言學有一定造詣,會讀得津津有味;如果你喜歡推理小說,會驚訝作者切入分析文學評論的各種不思議角度,但卻不是你最討厭的那種;如果你只喜歡純文學,一定對作者如何解析大作家們的副詞使用感到有興趣⋯⋯

最重要的是,這是一本不難讀的評論,而且你一定想知道,統計學哪來的本事,可以解決歷史學家百年爭論不休的問題!並且已經運用在今日的Google的文本分析上。

該書中文版最令人推崇的是,譯文流暢且對細節多有解釋,消除了外文中譯的文字隔閡,實為佳作!)

為了《聯邦論》(The Federalist Papers)中12篇文章的身世,歷史學家曾經爭論了超過150年之久。

《聯邦論》是為美國邁向民主制度打下基礎的文集,雖然它舉世聞名,還是為美國歷史定調的標章,但其各篇文章的作者真實身分仍不為人知。

這些文章出自哪些開國元勳之手,已引發了無數的爭論,也在史學圈掀起一場筆仗。究竟是誰寫下了這些動人的文字,奠定了美國的治國基礎?

答案就藏在字句裡—不過,要找到這些關鍵字,學者不須詳讀,而是要「細算」—他們只要檢視數據就行了。

John Jay出身富有家庭,曾任紐約州長、國務卿與美國首席大法官。John Jay出身富有家庭,曾任紐約州長、國務卿與美國首席大法官。(公有領域)

這個謎團起源於1787年末,當時有一系列提倡正式制憲的文章以筆名「聯邦黨人」(Publius)在紐約數家報紙上發表。用這麼愛國的筆名來掩飾作者的真實身分,有種莫名的詼諧感。事實上,在1787年的近400萬美國居民當中,只有3個人可能是幕後寫手。

漢彌爾頓、麥迪遜、傑就是作者—這在當時已是公開的祕密,不過沒人想挺身而出,承認自己寫了哪些文章。

他們3人都有政治抱負,之後也分別成為美國的財政部長、總統與首席大法官,下筆為文不是沒有好理由。然而,他們的過分謹慎使得作者的謎團牢不可破,在往後多年還不斷撩撥著史學教授與業餘者的心。

1804年,解答終於浮現了。

同年7月11日,漢彌爾頓給友人伊格伯特.本森(Egbert Benson)留了一封短箋,上面載明了《聯邦論》每篇文章的作者。那時,漢彌爾頓正在為隔天與亞倫.伯爾(Aaron Burr)的決鬥做準備,他對《聯邦論》的歷史重要性與自己的存活機率顯然心裡有數,所以他決定不讓作者身分的實情隨自身性命一起埋沒。

Alexander Hamilton曾經參與美國獨立戰爭,也美國首任財政部長,曾建立國家銀行、關稅系統,並重建國家信用制度。Alexander Hamilton曾經參與美國獨立戰爭,也美國首任財政部長,曾建立國家銀行、關稅系統,並重建國家信用制度。(公有領域)

真相應該就此大白才對,好奇的觀眾沒理由去懷疑漢彌爾頓的第一手知識。

然而,13年後,麥迪遜在結束第2任總統任期時提出了他的《聯邦論》作者名單—內容與漢彌爾頓有別,且漢彌爾頓聲稱自己為作者的12篇文章,麥迪遜也說自己是作者。

這下子又開啟了新的一波辯論潮,歷史學家為此爭論不休超過了一個世紀。

由James Sharples所繪的James Madison肖像,其為美國第四任總統,該畫現藏於普林斯頓大學。由James Sharples所繪的James Madison肖像,其為美國第四任總統,該畫現藏於普林斯頓大學。(公有領域)

直到兩世紀後的1963年,這樁懸案才終於破解。

最終解答來自哈佛大學的費德列克.莫斯提勒(Frederick Mosteller)與芝加哥大學的大衛.華萊士(David Wallace)。

然而,與先前曾挑戰解謎的眾多教授相比,莫斯提勒與華萊士的不同之處在於:他們不是歷史學家,他們的學術工作也不是以研究美國開國歷史聞名。

他們發表過的論文,從未與史學有過絲毫關係。莫斯提勒和華萊士是統計學家。

莫斯提勒與華萊士用來終結這個作者謎團的方法,與政治或意識形態毫無關聯。他們首開先例,讓文字使用頻率與機率立了大功。

他們的研究過程在某方面來說很複雜,還有許多充滿階乘、指數、加總、對數與T 分布的方程式,但核心概念其實簡單得出奇:

.計算已知由漢彌爾頓或麥迪遜所寫的文章中,一般常用字彙的使用頻率。

.計算作者不詳的文章中,一般常用字彙的使用頻率。

.比較文章中相同的常用字彙使用頻率,以判斷作者不詳的文章出處。

事後看來,在那些複雜的機率方程式派上用場前,這兩位統計學家得出的結果也已經很一目了然了。

《聯邦論》中,在確定出自麥迪遜之手的超過半數文章裡,他都用了whilst(While 的英式拼法),但卻從沒用過while ;漢彌爾頓則相反,在他執筆的約1/3文章裡,他都用了while,whilst 則完全不見蹤影。

在制定憲法過程中,美國政治家寫下85篇文章分別論述美國憲法、聯邦制度,是研究美國憲法最重要的歷史文獻之一,後出版合集,即為《聯邦論(The Federalist)》。在制定憲法過程中,美國政治家寫下85篇文章分別論述美國憲法、聯邦制度,是研究美國憲法最重要的歷史文獻之一,後出版合集,即為《聯邦論(The Federalist)》。(公有領域)

莫斯提勒與華萊士在分析結果時,靠的可不只一個字而已,這麼做在統計上可站不住腳。

反之,他們海選出數十個基本字彙,並計算這些字的使用頻率(在作者有爭議的文章中)。

許多字沒有半點政治涵義,但在兩位作者筆下的使用率卻天差地遠,舉例來說,麥迪遜用also 的頻率是漢彌爾頓的兩倍;漢彌爾頓用according 的頻率則比麥迪遜高得多。

時至今日,在更多大量的研究之後(無論是不是用統計的方法),莫斯提勒與華萊士的研究發現—即作者為麥迪遜—已成為統計學家與歷史學家的共識。

莫斯提勒與華萊士可謂時代先驅,他們的研究雖然涉及一些複雜公式,但主要仰賴的就是詞彙計算而已。用現代的電腦來計算字的數量與使用頻率可謂小事一樁,但在1963年卻並非如此。

為了體會他們兩人的經歷(或至少是他們手下研究助理的經歷),我把整本《聯邦論》列印出來,著手算算upon 有幾個。

30分鐘過後,我的進度只有全書的1/8,大約40頁,點到的upon 有37個。沒多久,我就頭昏眼花了。

「upon 在哪裡」簡直是魔鬼版的《威利在哪裡》。

莫斯提勒與華萊士雖然只考察了一個作者之謎,但他們成功的統計實驗卻有更深刻的意義:作家各自殊異的文風不僅穩定,還能預測。

會留下風格指紋的不只是十八世紀的政治家,不論是廣受歡迎、知名度高,或籍籍無名、飽受批評的作者,在數十年的寫作生涯中,所有的作者都會一再重複用字與行文結構。

(略有刪節,內文圖片非書中照片。)