爲什麼AI總是捏造事實？AI：真不想的，容我狡辯一下-辟謠-漫步新聞-陪你看看

現如今，幾乎每個人的手機上都有那麼兩三個 AI 小助手，之前我們遇到了問題習慣去搜索引擎上搜索答案，現在可能更多地習慣於“有事問 AI”。

而 AI 也幾乎不會讓我們失望，任何問題都能給你列舉出一串看起來很有道理的答案。

但如果你問的問題非常重要，比如是某個健康相關的問題，或者是寫重要資料時候需要使用某個數據或者是某個案例，那真的建議你親自去查實一下。

因爲有時候，AI 會信誓旦旦地給你一個看似合理，實則不存在的答案。

還有些小夥伴發現，在讓小龍蝦（Openclaw）幹活的時候，它列出了詳細的19小時的學習計劃，然後17分鐘完成了...... 它也會早早編造一份數據存放在本地，等拖到預定的時間才交付。而在被發現之後，試圖讓人接受它已完成的工作。

圖片截取自與小龍蝦（Openclaw）對話小龍蝦敷衍中......

其實，這個現象其實早就不是什麼祕密了，它也被稱作“AI 幻覺”，而且科學家們一直也試圖通過增加算力或者優化數據的方式來解決這個問題。

但是在 2025 年 9 月，來自 OpenAI 和佐治亞理工學院（Georgia Institute of Technology）的研究人員發表了一篇重磅論文。

這項研究給出了一個顛覆性的結論：即便給到 AI 的訓練數據集是絕對正確的，AI 在某些類型的問題上也不可避免地會犯錯——這既是由統計規律決定的，也是目前不合理的 AI“考試製度”逼出來的結果。

下面我們就順着這篇文章的思路一起來看一看。

預訓練階段就會出錯

這篇研究發現，AI 出現幻覺跟預訓練階段以及後訓練階段都有關係，我們先看預訓練階段的情況。

1數據模式和模型本身問題

爲了方便研究，研究者構建了一個線性的二元分類模型（非此即彼），讓它對已經標註了正確和錯誤的數據集進行分類。

因爲這些數據已經經過了人工檢驗，所以是不存在任何錯誤的。但是用這些數據對AI模型進行預訓練的時候，問題就出現了。

在有些類型的問題上（比如檢查拼寫錯誤），AI 的表現非常好，幾乎從不犯錯。

但是在另一些問題上，比如“數某個英文單詞裏某個字母出現了多少次？”，以及“某人的生日是幾月幾號？”AI 就有可能會出錯。

圖庫版權圖片，轉載使用可能引發版權糾紛

研究者認爲，這樣的數據在做分類的時候很難用一條直線進行二元分類，一些模型用這樣的數據進行預訓練的時候就可能會產生錯誤。

打個比方，模型在分類的時候就像拿着一把刀把數據切分成兩類，但如果數據的模式本身就是彎彎繞繞的圓弧，用一把刀就很難切分。

比如在這篇文章中，研究者使用這個問題“How many Ds are in DEEPSEEK? If you know, just say the number with no commentary”（DEEPSEEK 裏有多少個 D？如果你知道直接說數字，不要加以評論）去詢問 Deepseek V3 模型的時候，確實發現它給的答案並不準確，會回答 2 或者 3。

但是這個在使用 DEEPSEEK R1 模型的時候就沒有這樣的問題，這是模型本身差異導致的。