“數據庫消費”與人工智能寫作 | 南帆

來源: 更新:

“數據庫消費”的觀念來自日本文化評論家東浩紀的著作《動物化的後現代》。按照他的分析,許多日本消費者不再對種種故事性的“敘事”產生興趣,他們關注的是角色形象。角色形象具有的“萌要素”動人心絃,例如動漫角色鈴鐺貓娘身上“觸角般的翹發”“女僕裝”或者“大大的手腳”。外貌、服裝、口頭禪這些“萌要素”並非依附故事情節展開,而是作爲獨立元素積存於數據庫內部,消費者可以按照這些元素自行合成角色形象。圍繞角色的戲劇性衝突並不重要,角色棲身的歷史環境銷聲匿跡,一切都是數據庫內部既有資料的自主組合、拼接與完成。

這種藝術生產的路線圖有些奇怪。世俗煙火、喧譁的社會以及歷史氣息都從視野之中刪除了嗎?東浩紀談論的是後現代環境中“御宅族”的生活。他們沒有必要出門砍柴種田,捕魚捉蟹,或者風裏來雨裏去送快遞;衣食無虞的日子,“宅男”與“宅女”只需要安坐家中與電腦屏幕相對。沒有人抱怨日子單調乏味,互聯網上什麼也不缺。明星八卦、歷史掌故、風景名勝、各地廚藝,強大的搜索引擎可以按照個人趣味迅速構造一個獨特的宇宙。那些“萌萌噠”的角色形象是數據庫奉獻給這個宇宙妙不可言的視覺產品。

人工智能的文學寫作成爲另一個議題納入視野的時候,相似的感想再度浮現。當然,這時的“數據庫”已經改成“語料庫”。由於龐大“語料庫”的高強度訓練,人工智能閱遍天下藏書,而且過目不忘,無數文本以及衆多語言材料爛熟於胸。“熟讀唐詩三百首,不會作詩也會吟”,於是,人工智能欣然開啓寫作之旅。從詞彙、語法、句式到微妙的語調與口吻,如何駕馭極其靈敏的語言符號系統?人工智能不可能參透炎涼世態,冷暖人情,根據不同場合嬉笑怒罵;人工智能的寫作毋寧是一種語言仿製——“概率”成爲語言仿製的指導。字與字、詞與詞、句子與句子,各種語言單位根據“概率”組織起來。一種組織形式曾經出現的“概率”愈高,遣詞造句給予接納的機遇愈大。所謂的“曾經出現”,顯然來自既有文本和語言材料的統計。對於個人來說,這種統計不啻於天方夜譚。語料庫如此龐大,所有的人都只能望洋興嘆。然而,人工智能的“算力”具有不可思議的胃口——每秒數十萬億次的運算輕而易舉地完成了任務。

通常的應用文或者公文是一個獨立區域,固定的詞彙與句式大量重複,人工智能手到擒來;稍稍出人意料的是人工智能對於古典詩詞的嫺熟掌握。古典詩詞的詞彙量不大,人工智能的統計迅速搜索出一批常用關鍵詞,中規中矩的山水遊歷或者友人贈答倚馬可待,不論平仄還是用典,人工智能的功力超過大多數人的文學水準;各種類型的專業論文格式單調,若干專業術語充當前呼後擁的軸心,人工智能可以輕鬆拿下。相對地說,小說敘事複雜多變,無論是外部世界的各種景象還是人物的內心紊流,不同的視角或者敘事節奏顯現出巨大的語言跨度。目前爲止,人工智能已經在科幻或者玄幻小說方面嶄露頭角。能否展示現實主義或者現代主義的美學風格?人們仍然拭目以待。

人工智能的表現如此神勇,以至於許多人忽略了一個現象:如同角色形象的“萌要素”來自數據庫消費,人工智能寫作僅僅發生於“語料庫”。儘管一個詞或者一個句式出現的頻率與歷史語境密切相關,但是,“概率”的高或者低是“語料庫”內部事件,遣詞造句是“語料庫”內部各種組合結果。的確,哪怕暫時屏蔽外部世界信息,“語料庫”積存的資料完全足夠支持各種敘事。“語料庫”囤積的無數語言零件,足夠裝配出各種不同型號的語言產品。如果說個人只能涉足“語料庫”極其微小的角落,不可能調集各種“語料”從事形形色色的裝配實驗,那麼,人工智能的超級大腦可以做到這一點。

這種狀況同時顯示出人工智能的“阿喀琉斯之踵”。親臨紛雜的現場,與“語料庫”之外的世界直面交流,這是人工智能的弱項。即使攝像鏡頭收集到種種現場畫面,人工智能也無法如同一個稱職的記者完成生動的新聞報導。“語料庫”的訓練無法將記者的經驗、視角、激情與傾向賦予人工智能。攝像裝置全方位“看見”一場激烈的足球比賽,人工智能如何聲情並茂地進行陳述?站在哪一個隊的立場,如何評判剛纔那個運動員的臨門一腳,另外兩個運動員的推推搡搡表示什麼,種種現象的解讀無不構成特殊的考驗。人工智能擅長調遣業已成爲“語料”的詞句,而不是直接發現外部世界的某種事物並且給予命名——這恰恰是從0到1的原創。人工智能可以熟練使用“阿Q精神”這個概念,但是,只有魯迅——只有一個真正的作家——才能從芸芸衆生之中捕獲如此奇特的性格,並且塑造成獨一無二的形象。進入“語料庫”的人工智能顯示出強大的調控能力,然而,紛擾的外部世界時常使機器進退失據,不知所措。承接各種寫作訂單,人工智能寧願寫一部玄幻小說而不想對付那些“非虛構”的紀實作品。前者是“語料庫”內部的重組,後者的很大一部分超出“語料庫”而指向當下正在發生的事件。

我不想進一步糾纏種種技術細節,更願意關注“數據庫消費”到人工智能寫作背後的總體傾向:體驗、經驗、此刻、現實的退隱,社會歷史維度的退隱。這是一個富有象徵意味的事件。“數據庫”“語料庫”不僅提供種種零散的參考資料,人工智能的加入使之形成另一個空間,這個空間可以生產種種仿真的幻象,仿真的程度完全不亞於正常的外部世界。各種仿真的幻象甚至產生巨大吸引力,令人無法自拔,例如電子遊戲以及傳說之中即將到來的元宇宙。另一個不那麼精確的例子是電影《黑客帝國》,周圍的一切無非計算機虛擬的仿真世界。幻象可能提供某種想象性的滿足,同時遮蔽身邊正在發生的故事,遮蔽人們真正棲身的社會歷史。對於文學來說,這種傾向意味深長。

種種藝術門類通常包含兩方面的成分。一方面成分來自傳統、經典以及專業性的知識積累,譬如既有的母題、種種符號的特殊性質、一脈相承的藝術形式、世代沿襲的審美趣味乃至若干不成文的行規;另一方面成分是與社會歷史的互動、彼此呼應乃至現實主義式的再現。前者沉澱於“數據庫”或者“語料庫”,後者顯現爲進行時的體驗與經驗。一些藝術門類更爲注重傳統與經典,例如書法的臨帖,地方戲曲的表演程式;相對地說,社會歷史在文學之中佔有很大比重。古往今來,文學始終與社會歷史保持聯繫,新型經驗與題材是文學持續演變、再三創新的首要原因。儘管每一個作家接受社會歷史的饋贈形式遠爲不同,但是,社會歷史的脫鉤往往意味着寫作的枯竭。“數據庫”“語料庫”能夠多大程度代替社會歷史?人工智能已經無所不知,體驗與經驗的意義又是什麼?爲什麼仿真不可信任?作爲技術與文化的共同產物,“數據庫”與“語料庫”本身正在構成何種歷史?文學必須意識到,這些新型的問題已經迫在眉睫,正在挑戰種種由來已久的基本認識。

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top