劉禾(章靜繪)
劉禾,哈佛大學比較文學博士,先後執教於伯克利加州大學、密西根大學,現為哥倫比亞大學東亞係暨比較文學與社會研究所終身人文講席教授,曾任該研究所所長,古根漢獎得主。著有《跨語際實踐:文學、民族文化與被譯介的現代性(中國,1900-1937)》《帝國的話語政治:從近代中西衝突看現代世界秩序的形成》《弗洛伊德機器人:數字時代的哲學批判》《劍橋的陌生人》,編有《交換的符碼:全球流通中的翻譯問題》《持燈的使者》《書寫與物質性在中國:韓南紀念文集》《中國女性主義的誕生:跨國女性主義核心文本》《世界秩序與文明等級:全球史研究的新路徑》《全球語言正義》,注有《天義·衡報》校注本。
劉禾教授所著《弗洛伊德機器人》,原於2010年以英文刊行,中文版於今年問世。今年亦逢其處女作《跨語際實踐》梓行三十周年。《上海書評》對她的專訪,不僅聚焦於其近年關於人工智能與哲學之新思,亦循跡回望,以聯貫其三十載學術蹊徑。
劉禾談人工智能與哲學。采訪、攝像、視頻編輯:丁雄飛(08:17)
《弗洛伊德機器人:數字時代的哲學批判》,劉禾著,何道寬譯,中國大百科全書出版社,2025年6月出版,456頁,88.00元
您分別於2021年和2023年在《批評探索》(Critical Inquiry)上發表了《機器中的維特根斯坦》(Wittgenstein in the Machine)、《圖靈之後:哲學如何走進人工智能實驗室》(After Turing:How Philosophy Migrated to the AI Lab)兩篇長文。文中尤其區分了“人工智能實驗室中的哲學實踐”與“人工智能哲學”,前者指在機器裏做哲學、在人工智能實驗室克服形而上學。能否先請您從總體上談談對人工智能與哲學關係的看法?具體到您研究的劍橋語言研究小組(Cambridge Language Research Unit),為什麽您認為它的工作“首先是一場哲學上的突破,其次才是一項技術上的革新”?
劉禾:我寫這兩篇文章,確實是想探討哲學與人工智能的關係。今天圍繞人工智能的討論,無論在專業領域、媒體還是公眾層麵,往往不會把哲學置於優先位置。人們的關注點多集中於技術的潛能、應用的前景,或它會如何改變文明——一些論者甚至重提了人工智能或將毀滅人類的舊調。事實上,這類論斷早在幾十年前便已存在,隻是在計算機與大數據技術飛速發展的今天,人工智能的作用與社會關注度空前提高,於是人們更傾向於就事論事地談論技術本身。但如果回到二十世紀五十年代,從圖靈測試開始,哲學問題始終是推動人工智能研究的重要動力。正如“Artificial Intelligence”這個名稱的提出者約翰·麥卡錫(John McCarthy)所強調的,人工智能與哲學休戚相關,因為它直接觸及認知問題:若要設計出能夠模仿人類行為的機器,就必須首先對“認知如何發生”這一問題展開哲學層麵的思考。
我自己研究過劍橋大學的語言研究小組。這個小組由維特根斯坦的學生瑪格麗特·馬斯特曼(Margaret Masterman)在1956年創立。她招募了一批數學家和對計算機研究有興趣的學者,嚐試在當時仍十分原始的計算機上做信息檢索和機器翻譯實驗。冷戰初期,機器翻譯被視為一項戰略任務。美國迫切需要將大量蘇聯情報翻譯成英文,但懂俄語的人才極為稀缺。於是,無論是國家科學基金會,還是海軍、空軍,都投入大量資金,希望在機器翻譯方麵取得突破。然而研究人員很快發現,機器翻譯困難重重:究竟是在詞與詞之間,還是句子與句子之間建立對應關係?句法又該如何處理?這些都成了難題。包括喬姆斯基的轉換生成語法理論,也是在回應這類問題的背景下出現的。
瑪格麗特·馬斯特曼(1910-1986)
這裏最難解決的一個問題是詞的多義性,或者說詞與概念的糾纏。過去人文學者往往把詞和概念混為一談,比如研究“民主”時,以為隻要追溯詞源就等於解釋了概念。但一旦訴諸人工智能來處理自然語言就會發現,事情遠不止如此。機器會暴露一些国产AV蜜桃网站以往不太注意的哲學難題,迫使国产AV蜜桃网站再次追問語言是怎麽建構現實的。比如“邏各斯中心主義”七個字,到底是構成一個單一概念,還是其中的二字、三字可單獨成義?計算機長於符號處理,但缺乏“理解力”,無從判定。概念究竟在哪?詞義是不是就等同於詞典裏的解釋?一句話的意思是不是隱藏在句子深處?這些也是維特根斯坦當年提出的問題,而他的回答是否定的——句子的意義來自它與周圍句子的關係。這與今天一些基於上下文概率計算的語言模型在觀念上很接近。
這一觀念正是語義網絡(semantic network)研究的起點。問題是,計算機本身可以識別“序列”(sequence)——字母或數字的排列組合,卻不能自主識別語義邊界。這便是劍橋語言研究小組在早期實驗中所麵臨的挑戰。他們很快意識到,僅僅從技術層麵談機器翻譯無法解決問題,必須回到哲學層麵,回到維特根斯坦的哲學,尤其是他在1930年代於劍橋大學講授的晚期思想。這些思想後來被整理成《藍皮書》《棕皮書》,以及《哲學研究》等著作,語言研究小組創始人馬斯特曼直接參與過《藍皮書》的整理工作。然而,後人往往隻記得馬斯特曼是人工智能的先驅,卻忘記了她與維特根斯坦的哲學譜係關係。
維特根斯坦(右)與友人在劍橋的街道上,1935年。
《藍皮書》排印本
我在2022年采訪過當時唯一健在的劍橋語言研究小組成員約裏克·威爾克斯(Yorick Wilks),他保存並整理了一批馬斯特曼和劍橋語言研究小組的檔案,臨別時交給我保存,而第二年他就病逝了。馬斯特曼曾帶領小組成員係統研讀過維特根斯坦的著作。1953年,由維特根斯坦最器重的女學生安斯康姆(Elizabeth Anscombe)編輯出版了他身後代表作《哲學研究》;次年,馬斯特曼在英國亞裏士多德協會會刊(Proceedings of the Aristotelian Society)上發表了一篇極具分量的文章《詞》(Words),這是對維特根斯坦思想的直接回應。對於維特根斯坦在早期著作《邏輯哲學論》中提出語言的圖形理論(Picture Theory of Language),馬斯特曼認為,維特根斯坦走得並不遠。她主張,要推進這一理論,必須在真正存在過的基於圖像原則的語言中尋找實例,而最合適的例子就是古漢語,不妨嚐試理解漢語是如何組織其語義網絡的。
約裏克·威爾克斯編的馬斯特曼文集《語言、聯結與形式》(2005)
當時小組成員中有一位重要的英國學者韓禮德(M. A. K. Halliday)。他曾經是王力的學生,在劍橋教授中文,他在小組中發揮了關鍵作用:幫助大家理解為什麽中文可以成為哲學資源,並由此思考如何在機器上實現語言的圖形理論,這為機器翻譯奠定了基礎。順便說一下,韓禮德的係統功能語言學給早期美國人工智能研究也打上了不可磨滅的烙印,特裏·威諾格拉德(Terry Winograd)在麻省理工學院開發的著名的自然語言理解程序SHRDLU,就深受韓禮德理論的啟發。
韓禮德(1925-2018)
在此後二十年裏,馬斯特曼領導她的小組做了大量人工智能實驗:從最成功的語義網絡,到機器中介語(machine interlingua)、機械同義庫(mechanical thesaurus)。從譜係上看,今天人工智能中的向量空間研究,與他們當年的探索有著明顯的延續性。然而,關鍵不在於他們是否“預先做過”今天的研究,而在於驅動他們的並非單純的技術目標,而是哲學問題。他們真正關心的是:能否在機器上進行哲學活動,從而揭示語言中一些連維特根斯坦本人都未能完全觸及的問題。可以說,哲學在早期人工智能研究中的作用,並不是要建立所謂“人工智能哲學”。這一概念本身值得懷疑——如果它是真正的哲學,就不應被限定為“人工智能的”;哲學就是哲學。劍橋語言研究小組試圖在早期人工智能實驗中論證維特根斯坦提出的一係列基本問題:什麽是家族類似性(family resemblance)?詞語和圖案(pattern)有明確界限嗎?語言或符號的圖形理論是否站得住腳?如果這些理論無法在計算機上被論證,也許本身就有缺陷。因此,我的研究重點並不僅僅是為人工智能提供一種新的敘事框架,這不僅是科學史的問題,更關乎哲學演練。
您論斷,馬斯特曼是“第一位將對西方形而上學的批判推向超越字母書寫限度的現代哲學家”,她在人工智能實驗室中對邏各斯中心主義的哲學批判,比德裏達的解構更為激進。為什麽這樣說?
劉禾:馬斯特曼認為,維特根斯坦提出的哲學問題之所以重要,原因之一是它們可能突破心物二元論這類形而上學的根本限製。許多哲學家都意識到這樣做的必要性,其中包括德裏達。德裏達比馬斯特曼晚十餘年才提出走出邏各斯中心主義的問題,他並未讀過馬斯特曼的著作,更不可能關注人工智能與語言實驗的研究,因此他並不知道,早在他之前,已經有人在另一條路徑上走得更遠。
德裏達名著Of Grammatology的通行中譯為《論文字學》,我認為這是一個嚴重的誤譯。“Grammatology”更恰當的譯法是“文跡學”,《弗洛伊德機器人》的中譯本譯者何道寬先生采用了我的這一建議。德裏達關注的並非文字本身,而是所有能夠留下印跡(trace)的東西,包括非文字性的印跡,比如DNA、記憶的印跡,它們或許可見,或許不可見。這與中文語境裏的“文字學”幾乎沒有直接關係,後者是一個研究漢字係統的專門學術領域。德裏達真正念茲在茲者,是如何從西方形而上學內部,尤其是從語音中心主義的桎梏中突圍。他選擇的突破口是字母書寫遺留的印跡。所謂解構,正是借由這些印跡來揭示和動搖可見與不可見之間的關係。在這個關係中,他對語音中心論提出了一係列質詢:字母隻是聲音的拚寫嗎?憑什麽聲音就比書寫更貼近真理?德裏達提醒国产AV蜜桃网站,當人們強調聲音與真理的緊密聯係時,實際上正是字母書寫使聲音得以被辨認。德裏達在這種張力中展開工作,這已超出文字學或語文學的範疇。
德裏達《論文跡學》1967年初版本
德裏達的這項工作始於1960年代。他最早明確討論文跡學,是在1965年發表的一篇書評中,評論的對象是法國考古人類學家勒魯瓦-古爾漢(André Leroi-Gourhan)的兩卷本著作《手勢與言語》(Le Geste et la Parole)。這部書很重要,探討了手勢、技術與語言的演化,從史前岩畫一直延伸到當代的基因編碼。不過,雖然德裏達對邏各斯中心主義和語音中心主義做出了極為有力的批判,但他也認為,真正的“外部”並不可達。在我看來,這是一種退縮和偷懶:為什麽不可以設想走出形而上學?難道拚音字母的世界便是唯一可知的世界嗎?顯然不是。德裏達堅持從形而上學內部批評形而上學,但這未必是唯一的選擇。世界上存在多樣的書寫與符號方式,對於馬斯特曼來說——也對於維特根斯坦來說——這都意味著另外的可能性。
勒魯瓦-古爾漢著《手勢與言語》(1964-1965)
維特根斯坦沒有把注意力僅僅局限在拚音文字上,他也關注“之外”的問題,隻不過他的切入點是圖像、幾何符號,並且對數字符號表現出極大興趣。在《弗洛伊德機器人》裏,我曾提到德裏達對數字有種近乎敬畏的態度,認為數學語言不受語音中心主義的束縛,對形而上學有豁免權,並暗示像控製論之父維納這樣的學者,本可以借助數字來消解形而上學。但這一判斷未必成立,數字並不必然能消解形而上學。維特根斯坦就批評過羅素等人的命題邏輯(propositional logic),直言那是一種形而上學的幻象,對語言的理解根本是錯誤的。
相比之下,馬斯特曼及其劍橋語言研究小組在1950年代就已嚐試對邏各斯中心主義進行多重突破,他們在實踐中論證並延展了維特根斯坦的洞見。維特根斯坦往往在教學中用例子來啟發思考,而馬斯特曼等人因直麵機器上的語義網絡問題,雖認為其論述極其重要,卻也過於含糊,必須將其轉化為可測可算的形式。在這一過程中,他們發現漢字提供了一種資源。但不能簡單說漢字本身就能解構形而上學。他們通過“字”(馬斯特曼文章裏用的是韋氏拚音tzu)來重新界定語言單位。這裏的“字”並非有文化屬性的“漢字”,而是一個哲學範疇、一個表意符號。“概念”邊界模糊,無法直接運算;“字”則可以進入機器運算。
這也是為什麽我說德裏達的工作走得並不遠——不是誰更“激進”的問題,而是因為馬斯特曼的哲學探索產生了切實的後果:它推動了人工智能的發展,影響延續至今。成千上萬的人在日常交流中產生了語言數據,其中哪些詞使用頻率最高,哪些詞使用頻率最低,哪些詞與哪些詞組合得更頻繁,哪些組合更少——通過對語言現象的統計,語義網絡的樣貌逐漸清晰。正是統計方法推動了機器翻譯的突破,而這一突破也反過來揭示了語言使用的規律,從而印證了維特根斯坦的洞見。
許多人工智能史的敘述將AI的發展劃分為兩大路線:一是強調符號與邏輯推理的經典人工智能(Good Old-fashioned AI),二是強調大數據的自適應機器學習(adaptive machine learning)——二者分別對應了符號主義(symbolism)與聯結主義(connectionism)兩種主要技術範式。在您的論述中,機器翻譯的曆史似乎也呈現為類似的兩條進路:一條經喬姆斯基,上溯到邏輯實證主義,強調句法邏輯;另一條經馬斯特曼,上溯到維特根斯坦和日常語言學派,強調語義語用和自然語言數據。您將機器翻譯的成功歸結為後者的勝利,並將其定性為一場反邏各斯中心主義的哲學事件,於是,這也是AI共同體內部“反形式主義者”對“邏輯形式主義者”的勝利,是“字”的表意想象對“詞”的表音書寫的勝利。您所強調的哲學維度,是否正是通行的AI史敘事所忽略的關鍵環節?
劉禾:的確是的,語義網絡的思路與喬姆斯基的句法分析迥然不同。後者著重於主謂賓結構,並由此建立命題邏輯等形式模型。但如果隻做句法或詞匯層麵的分析,而不觸及語義,機器翻譯基本是無效的,根本不能稱之為“翻譯”。所以曾經有一段時間,許多機器翻譯項目陷入停滯,這一事業普遍被認為前景渺茫。於是,研究者們不得不直麵語義問題。事實證明,從語義入手才是機器翻譯唯一可行的道路。依靠大數據、語料庫和數學模型,研究者試圖劃定語義的邊界。
1960年代末的喬姆斯基
對比起來,語言學家拿一個孤立的句子來做句法分析,分析其深層含義——那並不是人類真實的交流狀態。羅素討論命題邏輯時喜歡舉古老的悖論“我在撒謊”來分析。維特根斯坦會問:這種句子到底在什麽語境下會出現?在日常情境中,人們通常會說“你在撒謊”,而不是“我在撒謊”。維特根斯坦認為這些邏輯學家是在生造語言,就像馬達在空轉,他強調必須回到真實的語言使用中來。馬斯特曼等人正是在這種理念下,嚐試構建機器模型,通過統計語言數據來理解語言,考察語義網絡,在此基礎上,再去考慮語言與語言之間的關係,進入機器翻譯的實踐。因此,他們首先做的是哲學工作,隻有在哲學上把問題澄清了,才能處理技術問題。所以我強調,技術本身並不天然具有哲學意義,而是必須經過哲學上的甄別:什麽重要?什麽次要?哪些東西之間有聯係?哪些東西可以進入機器計算?哪些不能?
馬斯特曼《扇簇與頭符》(Fans and Heads)一文中的示意圖,呈現了維特根斯坦所示三角形圖標(icon)的多重語境/意義。
馬斯特曼《翻譯》(Translation)一文中的“頭符”數學建模示意圖,呈現了“頭符”的“格”(lattice)結構:上層為一個“頭符”集合,中層為詞的各種具體用法,下層為詞義的交集,即共享的意義重心/概念。這種可計算的語義結構,便於機器翻譯和自動分析。
順便一說,所謂人工智能有新舊之分,但“新派”未必真新。今天,聯結主義被大肆吹捧。其實,神經網絡最早源於控製論。1943年,麥卡洛克(Warren S. McCulloch)與皮茨(Walter Pitts)發表了一篇具有深遠影響的論文《神經活動中內在思想的邏輯演算》(A Logical Calculus of the Ideas Immanent in Nervous Activity),提出機器與人腦在某種程度上具有共性,神經元的行為模式可以類比於機器的邏輯運算,即“開”與“關”的二元狀態。這類思維之所以在今天顯得前沿,隻是因為現在計算機在算力、記憶容量、運算速度方麵遠遠超過當年,才使得這些模型得以更充分地實現。
您在《帝國的話語政治》討論《馬氏文通》時,認為其藍本是《唯理普遍語法》(Grammaire générale et raisonnée),後者追求“普遍語法規律”的思想與喬姆斯基的“深層結構”說一脈相承。而在近年的論文中,您似乎借馬斯特曼,揭示了另一種普遍性:“表意原則存在於一切語言的運作中”。尤其令我驚訝的是,《帝國的話語政治》中對“六書”原則的描述——“可用於造字的部首數量是有限的,但是它們之間的組合可能是無限的”——似乎完美詮釋了您在AI論文中歸於馬斯特曼的“字”的組合邏輯(combinatory logic)。考慮到這兩處論述橫跨了二十年,是否可以這樣理解:您通過兩位“馬氏”,對比了兩種迥異的普遍性?甚至區分出“真普遍”與“假普遍”、“好普遍”與“壞普遍”?
劉禾:這兩者之間的聯係很關鍵,你的閱讀很深入,否則很難抓住這一點。我此前討論馬建忠著述的那一章題為“語法的主權身份”(The Sovereign Subject of Grammar),意在將其置於曆史語境中審視:漢語為什麽需要“語法”?“語法”為什麽重要?與此不同,馬斯特曼等人認為自己研究的是句子的“邏輯”,而非句子的“語法”。
1898年出版的《馬氏文通》
從這個角度看,《馬氏文通》的工作可以視為對西方形而上學和邏各斯中心主義的一次投降與臣服。這種臣服造成了嚴重的後果:馬建忠試圖用西方語法的有限框架來詮釋漢語,但他的操作領域並非活的語言,而是“字”的領域,或者說“文”的領域——《馬氏文通》的不少引文取自古籍經文。馬建忠試圖從中找出語法,這便混淆了中文的“字”與拉丁文的“verbum”或英文的“word”,在二者間建立了虛擬的對等關係,從而確立了一個極具誤導性的衍指符號(super-sign)——“字/word”。其結果是:文字被等同於語言,語言被等同於文字,兩個本應區分的係統被混為一談。這是一個無法成立的等式,但馬建忠未作深思。此後,中國的語法研究就在此基礎上展開,即便後人意識到不妥,試圖用新造的“詞”來代替“字”與“word”對應,也未能從根本上解決問題。
1660年出版的《唯理普遍語法》
西方語法進入中國文字領域後,製造了大量的混亂與偽問題,讓人們為之爭論不休。例如,學者們致力於分析漢字“詞性”或句子成分,但漢字高度靈活,很多時候無法被這些生硬的語法“帽子”所框定。這種誤解的根源,可以追溯到馬建忠的天主教背景及其傳教士老師。長期以來,傳教士一直將漢語視為單音節語言。令人驚訝的是,這一論斷至今仍為一些語言學家所接受。這顯然是“文”與“言”不分的典型體現。正如趙元任通過聲譜儀記錄所示,無論何種方言,人們說話時都是連貫的語流,而非一個個孤立的音節。傳教士之所以產生漢語是單音節語言的錯覺,是因為他們學習漢語是從認字入手,而絕大多數漢字確實對應一個音節,於是他們便誤將書寫單位的特征當作了口語的特征。說“漢字是單音節的”或許在經驗上成立,但說“漢語是單音節的”則根本站不住腳。
劉禾著《帝國的話語政治》2014年修訂譯本(楊立華譯)
與此形成對照的是,馬斯特曼敏銳地意識到,普遍性不在聲音的領域:不同語言和方言在聲音上彼此相對隔絕,無法互通。真正的普遍性隻能在表意領域中尋找。如此,馬建忠與馬斯特曼的區別清晰可見:馬建忠承襲了傳教士對漢語和漢字的誤解,並認為語法具有普遍性,這與後來喬姆斯基通過句法尋求普遍性的思路如出一轍。而馬斯特曼則發現了漢字的潛能,認為漢字作為表意符號,擁有類似數字的組合邏輯,這與羅素等人思考的命題邏輯截然不同。在漢字係統中,“文字”與“數字”皆為“字”,其涵蓋範圍更廣,因此更抽象,也更普遍。
您在論文裏有這樣一個設問:“機器中介語是普遍語言嗎?”文中並未給出明確答案。您怎麽看實基於中介語(interlingua)的機器翻譯與萊布尼茨的“普遍語言”(characteristica universalis)構想之間的關係?
劉禾:自十七世紀以來,尤其是萊布尼茨之後,歐洲思想界始終存在著一股尋找普遍語言的熱情。這種執念背後,往往潛藏著神學動機。他們所尋找的普遍語言,也被理解為一種原始語言(primitive language),所謂“原始”並非指落後或野蠻,而是在神學框架內指向最古老、最根本的語言,是對《聖經》所述“亞當語”的想象。起初,他們認為這種語言存在於古埃及;後來,當傳教士抵達中國,並向歐洲匯報他們在這裏似乎發現了普遍語言時,這股熱情再次被點燃。
需要澄清的是,曆史上的普遍語言不應與国产AV蜜桃网站討論的中介語混為一談。歐洲人那一時期對普遍語言的追尋,是在神學或科學主義驅動下尋找普遍性的曆史文化現象。而中介語則是一種數學建構,它在任意兩種自然語言之間充當轉換代碼。但如果一定要在當下語境中討論何謂“普遍語言”,我認為,它也不再是国产AV蜜桃网站通常所理解的“語言”,而是一種“通訊代碼”(communication code)。在《弗洛伊德機器人》中我曾討論過克勞德·香農(Claude Shannon)的“機識英語”(Printed English),他試圖將其發展為一種“通用代碼”(universal code)。在機器主導的時代,真正獲得普遍性的,正是這種數學化的代碼。
按您所述,香農為信息係統發明了表意英語,將英語改造成統計化的符號係統,由此奠定了電子書寫的基礎。這似乎顯示出香農的工作與馬斯特曼的思想之間存在高度相關性。而您在《弗洛伊德機器人》討論機識英語的一章,還提到香農與圖靈從事的是平行工作。那是否可以說,這三位分屬不同領域的思想家,共同推進了您所謂“二十世紀中葉表音書寫的表意轉向”,而這恰恰定義了整個數字媒介的未來?
劉禾:国产AV蜜桃网站確實可以將圖靈、香農和馬斯特曼視為二十世紀中葉思想界的三個關鍵節點。盡管他們的具體工作方向不同——圖靈致力於建立現代計算機的理論基礎,香農致力於建立通訊網絡,馬斯特曼致力於建立語義網絡——但他們殊途同歸地意識到了同一個核心問題:為使機器能夠有效工作,必須創造一種機器可識別的、基於表意邏輯的代碼。
圖靈在1936年的論文《論可計算數及其在判定問題中的應用》(On Computable Numbers, with an Application to the Entscheidungsproblem)中,用一個機器模型為可計算性提供了嚴格的數學定義,奠定了現代計算機的理論基石。隨後,他在1950年的文章《計算機器與智能》(Computing Machinery and Intelligence)中,進一步探討了機器是否具有思考能力與智能潛力。
艾倫·圖靈(1912-1954)
馬斯特曼是三人中唯一明確使用“表意”這一概念的,相比之下,香農作為工程師,雖未在哲學或概念層麵概括,但他的實踐卻在另一個維度上印證了同樣的結論。他的核心洞見源於對摩爾斯電碼的分析:他發現電碼不僅包含一長一短的信號,更關鍵的是包含了有意義的停頓。沒有停頓對信號進行切分,信息便無法構成。香農的創舉在於,他將這一發現應用到字母係統中,發明了一套包含二十七個字母的“機識英語”。這第二十七個字母,就是“空格”。這個空格並非傳統意義上的“空白”,而是一個表意符號。它的作用是為連續的字母流提供邊界,從而界定出字母或“詞”的單位。例如,字母序列“C-A-T”之所以能被識別為一個單元,正是因為它被前後的空格所界定。因此,當香農將“空格”作為一個正式的字符引入字母表時,他實際上完成了一次深刻的轉化:他將一個原本表音的係統,通過加入一個純粹表意的結構性符號,改造成了一個機器可以讀取的、數字化的表意係統。
“信息論之父”克勞德·香農(1916-2001)
香農基於電報與通信實驗所得的“空格/表意”發現,與馬斯特曼通過漢字得出的“表意邏輯”,可謂異曲同工。漢字當然不依賴空格,但“字”作為表意符號,其本身就蘊含著組織意義與構建語義網絡的能力。香農和馬斯特曼都證明了,機器處理信息的基礎不在於模擬人類語言的語音或語法,而在於識別和操作具有清晰邊界的、表意性的代碼單元。《弗洛伊德機器人》雖然出版於十五年前,但它與我當下的研究依然緊密相連。
您在論文中批判了塞爾(John Searle)的“中文屋”思想實驗,指出其背後有一種“不對稱的互斥邏輯”,並視之為“他者心靈形而上學”的複活。這和您過去在翻譯研究中論及的“話語運動的方向性”“不均衡分布的話語場”似頗有共通之處。為什麽要您要在論述人工智能的既定主幹中,特地旁生一枝,對“中文屋”加以申論?
劉禾:我之所以堅持討論“中文屋”的論題,是因為這個思想實驗在人工智能的教學與研究中,造成了極其惡劣的誤導。它不僅扭曲了公眾與學界對人工智能的理解,更引發了認知科學領域長達二十餘年、哲學水平堪憂的無效爭論。在西方哲學領域,構想思想實驗是其慣用手法,而這些實驗往往始於一個可疑的預設——從不通文明人語言的野蠻人開始——以此來展開推論。當“中文屋”以類似的方式登場時,我覺得有必要指出其背後的問題。這個思想實驗,以及它所屬的哲學方法,實質上是在用一種更隱晦、更不易察覺的方式,延續和維護著種族主義偏見。它打著探討“圖靈測試”的科學旗號巧妙織就一套論述。許多人或許能直覺到其中的不妥,卻緘默不言。這種模式並非偶然,而是源自一個曆史悠久且根深蒂固的西方哲學傳統,其核心特征在於對自身思想優越性的篤信。由此,圍繞人與機器的討論從一開始就陷入了這個充滿偏見的框架。我的批判矛頭並非僅僅指向塞爾個人,而是他背後那個自信且始終將自身置於優越地位的哲學傳統。
劉禾編《世界秩序與文明等級》(2016)
您在介紹馬斯特曼時,引用了威爾克斯的說法:馬斯特曼常常會提到“羅熱的無意識”(Roget’s unconscious),意指“詞庫中詞與詞之間的交叉指涉,蘊含著一般規律”。這和《弗洛伊德機器人》裏討論的“控製論無意識”和拉康學說似乎遙相呼應。我的疑問是:您在寫《弗洛伊德機器人》階段,對“將人腦作為計算機來進行控製論意義上的新規劃”,基本持批評的態度;而在“表音書寫的表意轉向”框架下,對這些技術似乎又有比較積極的看法。這裏是否有一種微妙的張力?
劉禾:国产AV蜜桃网站先談機器無意識的問題。幾十年來,人們一直在問,機器最終能否實現認知、獲得與人同等的智能?而爭論的焦點,往往被設定為“機器能否獲得意識”。這一設問本身,就包含了一個根本性的假設:它將意識作為衡量智能的唯一標尺,並預設了一個原子化的、以自我意識為中心的“人”作為參照。這種視角的根本問題在於,它完全忽略了無意識在人類行為中的作用。早在控製論與人工智能興起之前,弗洛伊德與拉康的精神分析理論就已經揭示:驅動人類行為的主要動力並非來自意識,而是來自無意識。
拉康的洞見尤為關鍵。他對控製論的研究抱有濃厚興趣(例如當時關於鯨魚、海豚如何交換信息的研究),因為這些自動運作的信息係統,恰恰可以比擬為人的無意識。拉康的名言——“無意識是像語言那樣被結構起來的”“無意識是他者的話語”——指明了無意識並非深藏於大腦內部的神秘之物,而是一個外在的、社會的、自動化的結構。符號秩序以及社會性的語言、規則被反複操演,最終驅動国产AV蜜桃网站形成自動反應,例如口誤、失言便是無意識的顯現。從這個角度看,機器的運作邏輯與人的無意識展現出驚人的相似性。機器的自動運轉,正如同語言符號係統的自動運轉。然而,在控製論和人工智能的主流研究中,“無意識”始終是被科學家們刻意壓抑的對象——盡管有像勞倫斯·庫比(Lawrence S. Kubie)這樣的精神分析師身處核心圈內。但這個被壓抑之物卻不斷回訪,幹擾他們。因此,我認為,機器真正能與人展開深刻對話,並成為国产AV蜜桃网站有效思考對象的層麵,恰恰是在無意識的層麵。
由此便引出了對控製論進行批判性審視的問題。我的書裏確實包含了對控製論的很多批評,尤其是針對其背後隱藏的帝國夢想與冷戰思維。所謂弗洛伊德機器人的群體,就是在控製論無意識的驅使下,在全球範圍內尋求軍事征服與壓迫,以滿足其控製他者的欲望。然而,識別並批判這些問題,與深入理解其理論貢獻,兩者並不矛盾。就像現在難免有人簡單地將人工智能視為洪水猛獸,但我認為,這種立場若要貫徹到底,就必須同時反對所有現代科技,因為它們無一例外地都與複雜的、“不幹淨”的權力係統(如帝國征服)糾纏在一起。關鍵在於,国产AV蜜桃网站不能因其在倫理或政治上存在爭議,就放棄對其進行深入研究。一個理論或發明,可能同時服務於多種目的。例如,香農在二戰及冷戰初期曾參與密碼學與保密通信的研究,但這並未妨礙他在此過程中提出奠基性的信息論思想。国产AV蜜桃网站不能因為其曆史用途而無視這些發現和發明。畢竟,隻有在深刻理解之後,国产AV蜜桃网站才會知道如何有效地批判。
如果依循您的界定,“弗洛伊德機器人”指的是一切無法脫離人機之間互為摹擬的無限循環關係,因而亦難以擺脫控製論無意識的存在,那當下的對話生成式預訓練模型(如ChatGPT)便可視為其最新的支配性形態。有一種批評聲音認為,此類對話機器人擅長無原則的諂媚,極易將常人的意見建製化,從而加劇社會意識形態的板結,您怎麽看?
劉禾:盡管ChatGPT的正式發布是在2022年底,但當前圍繞它的許多討論,早在半個多世紀前就已初見端倪。1966年,麻省理工學院科學家約瑟夫·維森鮑姆(Joseph Weizenbaum)開發了第一款具有廣泛影響力的聊天機器人ELIZA。維森鮑姆本人,作為模仿心理治療師的“DOCTOR”腳本的設計者(ELIZA—A Computer Program for the Study of Natural Language Communication between Man and Machine),對人們將ELIZA擬人化的狂熱提出了尖銳的哲學批評。他指出,人類用戶之所以感覺能與機器對話,並非因為機器具備智能,而是源於一種自我投射的心理機製。為了係統批判同事們在這種技術樂觀主義下的盲目,他寫了《計算機能力與人類理性》(Computer Power and Human Reason: From Judgment to Calculation)一書,並最終選擇疏遠自己開創的這一領域。
與ELIZA對話
維森鮑姆的洞察與拉康的理論不謀而合。拉康曾表示,當你在電話中與人交談時,聽見的首先是自己已經知道的東西。同理,用戶與ChatGPT的互動,正如與ELIZA的互動一樣,是一個將自身願望、幻想與期待投射到機器上的過程。機器生成的文本因語言固有的模糊性,為用戶提供了廣闊的詮釋空間,如同人們解讀算命先生的讖語,最終看到的隻是自己內心早已存在的答案。從這個角度看,ChatGPT的強大能力或許在於更高效、更全麵地映照和放大了人類的自戀。即便算法本身並未植入刻意討好之意,用戶也總能從模型的回答中,找到迎合自己期待的證據。當国产AV蜜桃网站撥開當前對聊天機器人的過度炒作,重審1966年的ELIZA,便會明白:構成這場人機互動幻覺的所有基本元素,其實半個多世紀以來,未曾改變。
在一些人看來,聊天機器人的發展可能進一步強化英語霸權,因為現有的網絡語料中英語占據最大份額,而小語種本就麵臨數據不足的問題。您在2023年主編了《全球語言正義》(Global Language Justice)一書,探討了如何應對語言消失的挑戰。能談談編這本書的初衷嗎?您認為當下的技術能否為瀕危語言的保護與複興提供新契機?
劉禾:編寫這本書的核心目標是構建一個更宏大的理論視野,將當代世界的生態變遷、移民浪潮、政治經濟動蕩與技術發展結合起來,重新審視什麽是語言。為此,国产AV蜜桃网站提出了“語言的生命世界”(the lifeworld of languages)這一核心觀念,意在強調,語言並非語言學教科書中僵化的語法結構,而是一個活生生的、依賴於使用者而存在的生命係統。然而,這個生命係統正麵臨嚴峻危機。近幾十年來,大量語言(尤其是原住民語言)正以前所未有的速度消失。聯合國雖已發起保護項目(我也參與其中),但国产AV蜜桃网站認為,僅僅聚焦於原住民語言是遠遠不夠的。国产AV蜜桃网站需要關注所有語言整體的生存狀態,即它們的“生命世界”。
這本書正是為了給這一思考奠定理論基礎。国产AV蜜桃网站引入了三個關鍵概念:logos(邏各斯)、techné(技藝)與oikos(家園)。logos指的是語言本身,追溯其作為“詞語”與“理性”的希臘詞源,繼而將其重新定義為人類語言的多樣性和複雜性。techné代表技術,強調任何對語言的思考都無法脫離技術維度。oikos是“家園”,作為“生態”(ecology)與“經濟”(economics)的共同詞根,指向語言所根植的社會與自然環境。通過這個框架,国产AV蜜桃网站將語言研究從傳統的語法學和語言學領域,挪移到了生態、政治經濟和數字技術交織的宏大視域中。
劉禾等編《全球語言正義》(2023)
我想著重介紹一下書中收錄的兩篇文章,它們精準地剖析了數字技術與語言存亡之間複雜而矛盾的關係。第一篇是伯克利加州大學的黛博拉·安德森(Deborah Anderson)寫的《為語言多樣性注入數字活力:文字符號編碼計劃》(Digital Vitality for Linguistic Diversity: The Script Encoding Initiative),介紹了她多年來與矽穀合作的成果。她的組織致力於幫助全球大小語種申請並進入統一碼(Unicode)標準。隻有被納入這個係統,一種語言的文字才能在電腦、手機等不同平台上被正確識別,否則隻會顯示為亂碼。她的文章通過豐富的案例(如為瀕危的美國原住民語言和非洲語言設計專用鍵盤),展示了這項工作如何為語言的數字化生存提供關鍵的技術支持。然而,進入統一碼並非一勞永逸的解決方案。伊莎貝爾·佐格(Isabelle A. Zaugg)的《數字領域的語言正義》(Language Justice in the Digital Sphere),以埃塞俄比亞的案例揭示了這一過程的複雜代價。她指出,一旦進入由西方主導的數字係統,這些語言不僅會麵臨被主流數字文化同化的風險,更會被置於一個新的等級體係中。在計算機科學領域,語言被劃分為“高資源語言”(high-resource language)的語料庫和“低資源語言”(low-resource language)的語料庫,這種劃分本身就預設了其地位的不平等。此外,進入係統也意味著可能受到各種形式的監控。
這兩篇文章共同揭示了一個深刻的悖論:一方麵,進入數字係統確實能吸引年輕一代使用本族語言,有數據顯示這有助於語言的傳承和網絡多元化;另一方麵,這種進入又伴隨著新的權力關係和文化風險。在全球技術化的背景下,參與或不參與數字世界,已不再是一個可以自由選擇的問題。一個人固然可以隱居遁世,但若要參與社會生活,就無法回避網絡。那麽,你是用英語進入,還是用你母語的符號進入?這使得語言正義的問題變得異常尖銳:它不再是一個關於“好與壞”的價值選擇,而是一個關乎“生與死”的存亡抉擇。這其中的邏輯,與近代中國加入由國際法所規定的主權國家體係有相似之處:在一個已然成型的全球係統麵前,選擇不參與,往往等同於選擇消亡。這才是国产AV蜜桃网站今天討論語言正義時,所必須麵對的根本局麵。
若將表音書寫的表意轉向視作某種對邏各斯中心主義的勝利,那它會產生政治後果嗎?顯然,很長一段時間裏,即便這一轉向正在發生,人們依然處於西方建構的世界秩序中。英語主宰著全球的地緣政治和話語秩序,話語的運動不斷迫使漢語進入改造之途。在為石靜遠的《漢字王國》(Kingdom of Characters: The Language Revolution that made China Modern)所寫的書評裏,您提醒讀者注意,統一碼標準與冷戰時期大多數信息技術標準一樣,是由矽穀,而非任何漢字文化圈的國家所決定。在《翻譯的事件性》(The Eventfulness of Translation: Temporality, Difference, and Competing Universals)一文結尾,您期待亞非作家會議的遺產,能通過未來潛在的翻譯,在時間的長河中延續下去。那麽“麵向未來哲學的表意想象”(ideographic imagination for future philosophy),會不會成為撬動現實的潛在杠杆?
劉禾:如何看待一項哲學或科學發明的政治後果?如果国产AV蜜桃网站追問馬斯特曼,其關於語義網絡的研究有何政治意涵,她很可能會回應說,她關心的是哲學問題與技術的可行性問題——即機器能否運作。或許在她看來,所謂的“政治後果”取決於後續一係列不可預知的事件如何展開。她無法預見,像我這樣的後輩學者會發掘出她的文章,並確認其對人工智能發展所起到的重要指導作用。俗話說,一碼歸一碼。當国产AV蜜桃网站研究哲學時,国产AV蜜桃网站關注的是其內部的對話、分歧與思想轉折,而非要求它產生直接的政治效應。同樣,當国产AV蜜桃网站研究國際政治,例如國際法的翻譯或條約談判,国产AV蜜桃网站麵對的是另一套截然不同的符號行為與運作規則。將異質的領域簡單混為一談,無助於国产AV蜜桃网站理解任何一方。
更重要的是,一項發明的後果,尤其是其政治後果,往往是無法預見的。世界在變化中,一個係統由誰始創並不重要,因為其未來的演化路徑充滿了不確定性。這就像討論一項科技發明是“好”是“壞”一樣困難。誠然,對於像原子彈這樣目的性極強的發明,其政治後果相對清晰;但對於計算機的發明,其初衷與對今日造成的深遠影響之間,已難建立直接的聯係。實際上,當国产AV蜜桃网站追問“政治後果”時,国产AV蜜桃网站往往在預設一種因果關係(causality)。然而,早在控製論的時代,學者們就開始反思這種思維模式。在著名的梅西會議(Macy Conferences)上,他們集中討論了“循環因果律”(circular causality)與“反饋”(feedback)的概念。在反饋係統中,A作用於B,必然導致B反作用於A,最終使得誰是因、誰是果變得無法分辨。他們關注的正是這種複雜係統內部的互動關係。當国产AV蜜桃网站麵對政治、經濟、文化交織的複雜現實時,任何單一的因果鏈條都顯得蒼白無力。正如維特根斯坦所警示的,當国产AV蜜桃网站談論“因果”時,国产AV蜜桃网站很可能隻是在將自己有限認知內所認可的邏輯關係,強加於事物本身。
1953年在紐約舉行的梅西控製論會議的與會者
您近來的寫作愈發有打通文學和學術之勢:《劍橋的陌生人》融虛構、寫實、史敘於一體自不待言,《機器中的維特根斯坦》雖是學術論文,卻用了偵探小說的筆法——“誰是瑪格麗特·馬斯特曼?”維特根斯坦與圖靈,同時在您的論文和小說裏相遇。像《弗洛伊德機器人》這樣的書,盡管也討論文學文本,但與傳統意義上的文學批評、文學理論、文學史都相去甚遠。您是在自覺地重新發明文學、重新發明學術寫作、重新發明文學研究嗎?
劉禾:在寫《機器中的維特根斯坦》這篇論文時,我確實融入了某些文學技巧。此番嚐試,一方麵源於我完成了實驗性作品《劍橋的陌生人》(初版名為“六個字母的解法”)之後,有意識地將一些虛構敘事手法引入學術寫作的探索,另一方麵,則是因為當時馬斯特曼研究幾乎處於闕如狀態。麵對一位幾乎被遺忘的思想者,必須借助一種“發現式”的寫作去重構其思想輪廓。令人欣慰的是,該文發表後,學界有越來越多人開始重新關注馬斯特曼。因此對我而言,文學手法的介入並非為了降低閱讀門檻。事實上,這篇文章的理論性和閱讀挑戰性,可能比我任何其他作品都要強。
劉禾2023年出版的《六個字母的解法》更新版——《劍橋的陌生人》
我也並非第一個主張“重新發明文學”的人,最早還是李陀提出來的。我始終強調,當代文學的視野亟需拓寬。如今許多小說,讀者僅看幾頁便能預見其走向,其根源在於經驗的局限性——太多作品沉溺於作者身邊那一點小小的體驗。文學必須加強其“思想性”,這種思想性並非要讓文學變得非文學化,而是要求它對世界和曆史抱有更深沉的好奇。它意味著文學的疆域必須擴大,不能僅僅局限於個人情感的狹小圈子。因此,我有意識地在虛構創作中引入曆史與哲學。新版《劍橋的陌生人》中加入了圖靈和維特根斯坦的故事,因為我正好在研究他們。他們不僅是劍橋的風景,更是思想的交鋒點,他們的故事不隻是人物八卦,更是智識與時代的碰撞。
在文學研究方麵,我也致力於揭示文學與科學之間被忽視的聯係。克勞德·香農讀過喬伊斯的現代主義經典《芬尼根的守靈》,並從中獲得信息論的靈感。博弈論的奠基人馮·諾依曼(John von Neumann)與摩根斯特恩(Oskar Morgenstern),著迷於福爾摩斯的演繹推理,並將其視為策略思維的文學範本。更早的,俄國數學家安德烈·馬爾可夫(Andrey Markov)為建立“馬爾可夫鏈”這一如今在計算機科學中無處不在的模型,其最初的數據便來自對普希金詩歌《葉甫蓋尼·奧涅金》的字母頻率分析。這些科學家是如何與文學互動的?他們是如何閱讀文本的?這在當下的文學研究中往往被忽略。因此,我的工作就是想將這些被割裂的領域重新連接起來,讓文學的疆域變得更寬廣。
2024年是福柯去世四十周年。在您的早期研究中,可以清晰看到福柯理論的印跡。您會如何描述他在您思想曆程中的作用?
劉禾:福柯很重要,至今我仍在課堂上講授他的理論。對我來說,他的學說在幾個關鍵方麵產生了啟發。首先,是他在檔案中做哲學的方法。通常,學者進入檔案館是為了爬梳曆史文獻,以構建一種曆史敘事。但福柯的獨特之處在於,他進入檔案館是為了做哲學。當年我在伯克利的許多同事都與他有過交往,我雖未曾親見,但聽說他時常待在班克羅夫特圖書館(Bancroft Library)——一個收藏了大量手稿和檔案的地方——閱讀十六、十七世紀的檔案。他像考古學家一樣,在看似雜亂的材料碎片中挖掘、評估,並最終獲得自己的思想發現,而不是接受一個現成的故事。
其次,福柯一再強調,他所做的並非傳統的“思想史”,而是“知識考古學”。我常常要求我的學生深入思考這一區別。後者的核心在於分析話語和話語的曆史。福柯認為,国产AV蜜桃网站用以構建知識的語言和概念框架並非永恒,而是在持續的流變之中。理解話語為何在知識考古中占據核心地位,是理解福柯的關鍵,也是早期啟發我的另一個要點。對話語轉變的重視,直接催生了我的跨語際實踐研究。我發現,當代漢語的書寫和表達在很大程度上是由外來語言的句法、詞匯和表達方式塑造的。一個明清時代的人很可能無法讀懂《上海書評》的任何一篇文章,因為其中充斥著大量跨語際實踐創造出的新詞匯——我稱之為“衍指符號”。這些符號徹底改變了現代漢語書寫的版圖。因此,在研究現代文學時,對語言本身的知識考古變得至關重要。跨語際實踐研究,正是在文學領域內進行的一次知識考古。我在書後附上的詞語表,是一個引子,旨在揭示国产AV蜜桃网站語言地圖發生的巨大變遷。
劉禾著《跨語際實踐》2022年修訂譯本(宋偉傑譯)
然而,我的研究也讓我發現了福柯理論的局限性,並由此引出了我的批判性發展。我認為,福柯雖然關注話語內部的轉變,但對不同語言接觸時產生的認識論衝突關注不足。正是在研究《天津條約》這類檔案的過程中,我遇到了一個福柯理論無法直接處理的問題。當條約迫使“夷”與“barbarian”這兩個詞並置時,国产AV蜜桃网站該如何從哲學上表述這種由權力關係強加的認識論衝突?這便是我提出“衍指符號”概念的契機。關鍵不在於爭論“夷”是否等同於“barbarian”,而在於承認“夷/barbarian”這個符號的誕生。它是一個被條約強行規定的、具有曆史性和強製性的語義係列,不容個人選擇。我認為,如果福柯的研究能夠更細致地關注兩種語言之間的認知距離,他或許也能達到相似的結論。