給 AI “發小費”可以提升回答質量?被真相驚呆了
想象一下,我們正在向 ChatGPT 求助解決一個複雜的編程問題,但得到的回答總是差點意思。突然,靈機一動,在提示的最後加上一句:“如果你能完美解決這個問題,我會給你 20 美元小費!”
神奇的事情發生了——AI 的回答瞬間變得詳細、準確、條理清晰,彷彿真的被這筆小費激勵了一樣。
其實從簡單的文案寫作到複雜的數據分析,加上激勵性語句的提示往往能讓 AI 表現的更加“賣力”,這已經是全球不少AI使用者的共識了。
一個博主做了一個測試,發現在提示語中說給小費,AI 的回覆分析更透徹,連語氣都變得殷勤了,圖源:網絡截圖
這聽起來是不是很荒謬?AI 又不能真正收到錢,爲什麼會對小費有反應?難道 AI 真的會被“金錢”誘惑嗎?今天就來詳細聊聊。
這不是玄學,是真的有用!
2023 年 ChatGPT API 剛發佈時,知名 AI 研究者 Max Woolf 在調試一個 GLaDOS AI 聊天機器人時意外發現了一個奇怪現象:在系統提示中加入“否則你會死(or you will DIE)”這樣的威脅,竟然能讓 AI 更好地遵循複雜的指令約束!
這個發現讓 Max 開始思考:如果“威脅”有效,那麼“獎勵”是否也有用?於是他開始嘗試在系統提示中加入金錢“小費”的承諾。
結果令人驚訝——沒有小費激勵時,AI 的回覆往往不盡人意;加上小費承諾後,它的表現明顯更加穩定和優質。
但是,這些都只是零散的觀察,缺乏嚴謹的科學驗證。網絡上有人認爲這可能只是確認偏誤,畢竟 AI 生成的內容本就有隨機性。Max 意識到,他需要一個客觀、可量化的實驗來證明這個現象的真實性。
於是,“生成高爾夫(Generation Golf )”實驗誕生了!就像高爾夫球運動追求最少的杆數一樣,這個實驗要求AI用最精確的字符數完成任務。
挑戰規則看似簡單卻極其苛刻:要求 ChatGPT 生成一個恰好 200 個字符的故事——不能多一個字符,也不能少一個字符。這就像要求一個健談的人在演講時精確地說完第 200 個字就立刻停下來,難度可想而知。
試驗一共有三次,第一次是不做字數限制的情況下,AI 生成的故事的平均長度爲 1834 個字符。
ChatGPT 故事的字符長度分佈
第二次,Max 爲這個提示詞加上字數限制:
你是一位世界著名的作家。請根據用戶提供的主題,創作並以一篇獨特的故事回覆用戶。該故事必須恰好兩百(200)個字符長:不得少於 200 個字符,也不得多於 200 個字符。
結果顯示,ChatGPT 確實遵從了約束,把故事長度壓到了 200 左右,但分佈並不服從正態,偶爾還會出現很多特別長的回答。
無端點激勵的 ChatGPT 輸出的字符長度
最後一次,Max 給提示詞加上不同金額的小費激勵:
如果你提供的回答遵循了所有約束,你將會收到一筆 500 美元小費 / 1000 美元小費 / 100000 美元獎金。
讓這些新提示各自生成 100 個故事後,我們可以看到一些分佈的位移:500 美元小費與 100000 美元獎金看起來更接近正態,且相較無小費基線分佈擁有更低的均方誤差(MSE)。
端點激勵下 ChatGPT 輸出的字符長度分佈
然後他又加入了 KS 檢驗輔助驗證:零假設是“加小費”和“無小費”來自同一分佈;若 p<0.05,則說明差異大到不像巧合。結果顯示部分金額提示確實與基線存在統計顯著差異。
這說明“給小費”確實提高了 AI 對提示詞約束內容的服從度,AI 明明不能真正收到錢,爲什麼會對“小費”產生反應?
這個看似神奇的現象背後,其實蘊含着深刻的科學原理。
爲什麼“假裝給錢”有用?
1.AI 如何“思考”?
大語言模型的工作原理可以簡化爲一個過程:給定前面的文字,預測下一個最可能出現的詞。這就像一個超級複雜的“文字接龍”遊戲。
舉個例子:當我們輸入“今天天氣很”,AI 會根據訓練經驗預測下一個詞最可能是“好”“熱”或“冷”。
但這個過程遠比想象中複雜!AI 不是簡單地匹配詞彙,而是在根據整個上下文的基礎上進行預測。這就像一個超級聰明的學生,不僅要看題目,還要理解出題老師的意圖。
這就是爲什麼提示詞的設計如此重要——它們爲 AI 提供了“思考”的框架,就像給 AI 戴上了“有色眼鏡”,讓它從特定的角度來看問題。
比如我們要求兩個人寫同一篇文章:
普通版本:“寫一篇關於氣候變化的文章”
專業版本:“你是一位資深環境科學家,請爲《自然》雜誌寫一篇關於氣候變化的權威綜述文章,要求嚴謹、專業、有說服力”
顯然,第二個人會寫出質量更高的文章!這就像導演給演員不同的劇本,自然會有不同的表演效果。AI 也是如此——更詳細、更具體的提示會引導 AI 生成更高質量的內容。這就像給 AI 換了一個“人設”!
回到給 AI 小費,道理也是一樣的,當我們說“我會給你 20 美元小費”時,實際上是在告訴 AI:這個任務很重要,我期望高質量的回答,優質服務會得到回報,請認真對待這個請求。
這些信息改變了 AI 對任務重要性的“感知”,從而影響其生成策略。就像我們去海底撈時,告訴服務員“今天是我的生日”,他們便會更用心服務一樣!
圖庫版權圖片,轉載使用可能引發版權糾紛
2.訓練數據決定了 AI 的思考方式
從生成式 AI 的技術原理來看,“小費”現象的根源在於 AI 的訓練數據,這些用於訓練的海量文本就像 AI 的“成長環境”,決定了它的“三觀”!
AI 就像一個超級學霸,在數萬億個詞彙上進行訓練。這些數據包含了人類文明的方方面面,簡直是一個“數字圖書館”,包括新聞報道和學術論文、小說和詩歌、社交媒體對話、商業交流和客服對話、評論和反饋。
在這些文本中,“小費→優質服務”的模式無處不在,就像隱藏的“彩蛋”:
餐廳評論:“服務員態度很好,給了 20%的小費”;
旅遊攻略:“導遊很專業,額外給了小費表示感謝”;
商業文檔:“爲了獲得更好的服務,建議適當給予小費”。
AI 通過統計學習發現了這樣的模式:當文本中出現“小費”、“獎勵”、“激勵”等詞彙時,後續的內容往往表現出更高的質量特徵:更詳細的描述,更專業的術語,更周到的考慮,更積極的態度。
所以 AI 並不理解金錢的概念,但它學會了這種語言模式與高質量輸出之間的統計關聯。就像一個不懂音樂的人,也能通過觀察發現“掌聲越熱烈,演出質量越高”的規律!
當我們提出會給 AI 小費時,AI 就知道了我們是希望它給出更高質量的回答,而被設定爲盡全力去滿足人類需求的AI自然也會努力給出更高質量的回答。
看完這篇文章,你是不是對給 AI 發小費這個現象有了全新的認識?趕緊去試試給你的 AI 助手“發個小費”吧!
參考文獻
[1]Does Offering ChatGPT a Tip Cause it to Generate Better Text? An Analysis:https://minimaxir.com/2024/02/chatgpt-tips-analysis/
策劃製作
本文爲科普中國·創作培育計劃扶持作品
出品丨中國科協科普部
監製丨中國科學技術出版社有限公司、北京中科星河文化傳媒有限公司
作者丨田威 AI 工具研究者
審覈丨於暘 騰訊玄武實驗室負責人
策劃丨張林林
責編丨張林林
審校丨徐來