迴歸結構主義,理解語言機器
語言的本質是什麼?語言與計算之間究竟是怎樣的關係?人文學界是否真的理解大語言模型的運作方式及其意義?近日,紐約大學德語系副教授、數字理論實驗室主任萊夫·韋瑟比(Leif Weatherby)的《語言機器:文化人工智能與剩餘人文主義的終結》(明尼蘇達大學出版社,2025)出版。他認爲,大語言模型實現了認知與語言、計算的分離,這一現象與早期結構主義理論相呼應。他試圖讓大家迴歸結構主義這一多年前的語言學-文學理論框架,來理解今日所處的世界。
韋瑟比發明了“剩餘人文主義”一詞,來描述當下的人機關係,主張我們應該積極、勇敢地重新思考人與技術的關係,而不是消極地退守到一個越來越小的“剩餘”領地裏,堅持一種脆弱的人類本質定義。
他指出,人文學界現在分爲兩大陣營,質疑人工智能的一方認爲人類語言的本質是“說話者意圖”,或認爲語言即認知而非文字,大語言模型的輸出與語言的內在認知法則毫無關聯。正是抱有這樣的觀念,所以有了“機器能完成X,但人類能做得更優或更‘真實’”的邏輯。而全面擁抱人工智能的一方則已接受了機器優於人類的前提,只關心人類如何在超級智能時代生存。
在韋瑟比看來,雙方都沒有真正關注技術本身,並且都預設了一個不可逾越的人機鴻溝,這種思維反而阻礙了對語言本質的深入理解。
大語言模型的整個系統基於文本運行,語言傳遞所依賴的聲音元素不復存在,我們面對的是純粹文本符號(token)與特定數學方法的交互。這讓韋瑟比自然而然地轉向索緒爾以來的結構主義。他在一篇採訪中(JHI blog)做了詳細介紹。
結構主義將語言視爲語言符號相互關聯的完整體系。這一體系具有動態性,意義由整體系統而非單一“指稱”決定。也就是說,系統並非由“岩石”“母親”等指稱堆砌而成的總和。意義是由系統內部關係決定的,系統衍生出語言的指稱功能及其他局部功能。
大語言模型的訓練方式與之高度相似:海量文本經預處理壓縮爲矩陣模型,查詢時便從中採樣。大語言模型實現了認知與語言、計算的分離。因此,結構主義語言觀與大語言模型有一個核心共通點,即語言具有本體性,其動作獨立於心理學、形而上學或邏輯學的範疇。結構主義也最透徹地闡釋了語言非全然屬人的特質。
韋瑟比同時指出,索緒爾的語言價值論與馬克思的價值理論存在平行關聯。詞語的價值由其在整個語言矩陣中的位置決定——即“不存在實質內容”——這恰恰與馬克思對價值與價格問題的思考方式一致。
當前寫作、藝術與高等教育遭遇的“危機”,其根源正是人類難以區分大語言模型與人類的文本輸出。而韋瑟比卻說,這充分證明我們已在最本質層面捕捉了語言,證明了語言結構與數學結構有着更深層次的契合。並且,大語言模型讓人類首次以量化的方式觸及文化整體的分佈,必將拓展我們觀察真實文化系統運作的能力,而人工智能也終將具備文化屬性。
韋瑟比相信,結構主義還有許多理論潛能有待發掘,如雅各布森、巴特乃至德里達對控制論的涉獵,就很值得進一步發展,以解釋當下現實:如今,數字與文字在系統層面協同運作,無需明確的概念介入即可產生交互並輸出成果。
韋瑟比稱自己的新著是本“理論書”而非歷史研究,旨在發展一種“剝離認知的語言與圖像”的混合理論,整合文學理論、認知科學和數據科學。他希望能建立一個研究所有意義生成形式的“普遍詩學”。
他認爲,這是人文學科回應人工智能挑戰的世代機遇——數據科學已跨入人文領域,人文學者需要正面回應,而非躲在那些過時的術語背後。一個心照不宣的現實是,人文學者在“過去一兩代人之前,已退出這類問題的嚴肅討論”。