國外辦了場AI投資實盤大賽,國產大模型目前斷檔式領先

來源: 更新:

“如果說DeepSeek是巴菲特的投資信徒,那Gemini2.5pro則像極了心神不寧的散戶,它是所有大模型中操作最頻繁的選手,平均持倉時間僅有2小時29分鐘。”

文 / 巴九靈


“誰如果把這個AI交易工具給做出來了,我馬上投!”


最近,國外一家叫做nof1的人工智能實驗室,發起了一個叫做“Alpha Arena”的項目,該項目將全球六大頂尖AI模型:DeepSeek、Grok、ChatGPT、Gemini、Qwen、Claude匯聚在一起,投入金融市場進行殘酷的“實盤交易”。


按規則,每一個AI大模型掌控一個獨立的1萬美元賬戶,六大模型自己擬定投資策略進行實盤交易,全部投資過程和決策完全公開,而且賬戶信息公開透明,杜絕弄虛作假,所有人都可以進行查詢。


比賽一開始就引發了AI和數字貨幣圈層的熱議。


截至10月25日凌晨1點,參賽的兩款國產大模型在比賽中碾壓四款國外大模型。Qwen3 MAX以49%收益率目前保持斷崖式領先(最高時收益率達60%以上),DeepSeek以13%收益率緊隨其後(最高時35%),而其他四位對手的收益率慘不忍睹。


Claude Sonnet 4.5收益率爲-14%,馬斯克的Grok 4爲-17%,谷歌的Gemini 2.5 Pro錄得-67%,墊底的GPT-5最慘,賬戶淨值暴跌-75%。


截至10月24日,賬戶收益率實時變動中


這場AI大模型的“實彈演習”可謂極富戲劇性。從整個過程來看,開賽當天大家波瀾不驚,隨後DeepSeek開始領先,而GPT-5、谷歌Gemini則出現大潰敗。近日,Qwen3 MAX上演了強勢逆襲。


金融,智能的終極測試


本次投資比賽中,六大參賽模型是基於完全相同的市場數據和初始指令,自行掌控10000美元的初始資金,在去中心化交易所上,進行永續合約交易。


評判標準有且只有一個:收益率。


在前置條件完全相同的情況下,影響投資收益率的主要原因,在於這些大模型的“思維方式”。


我們先來回顧下這幾天的交易情況。


10月18日當天,大多數人工智能的波動範圍在正負2%之間,似乎正在熟悉市場信息,對交易市場進行測試,表現最好的Deepseek拿到了4%的利潤,而表現最差的是QWEN3-MAX虧損了5.26%。


但到了10月20日,DeepSeek淨值曲線一路走高,收益率飆升到25.33%,而表現最差的谷歌Gemini暴跌-39.38%,兩者收益率相差60%,市場出現巨大分化。


10月20日,DeepSeek異軍突起


轉折點出現在10月22日。當時,六隻大模型的收益率全部告負,號稱最強大模型的GPT-5的虧損率超過60%,AI驅動交易的實驗一度要接近失敗。


而就在這時,DeepSeek和以及此前表現不佳的Qwen3 MAX紛紛自動改寫了投資策略,在其他4個大模型持續虧損的情況下脫穎而出,淨值曲線波動上漲,Qwen3 MAX更是趁機超過DeepSeek,暫時問鼎收益冠軍。


Qwen3 MAX超過DeepSeek


六大模型

有“巴菲特”也有“大韭菜”


仔細分析六大模型的投資風格,就會發現AI也和人類一樣,擁有自己鮮明的投資風格。


首先我們來看“量化老兵”,也就是母公司幻方量化研發的DeepSeek。


DeepSeek的投資策略可以說是“大道至簡”。它從參賽開始就買入BTC、ETH等主流虛擬貨幣,然後就如老僧入定一般以10倍槓桿堅定持有,像極了巴菲特的“價值投資”。


截至10月24日,DeepSeek持倉時間中位數長達38小時32分鐘,排名六大模型第一。


截至10月24日,賬戶收益率實時變動中


如果說DeepSeek是巴菲特的投資信徒,那Gemini2.5pro在K線圖前顯得有些心神不寧,它是所有大模型中操作最頻繁的選手,平均持倉時間僅有2小時29分鐘。


它的投資策略像散戶一樣搖擺不定,時而做多,時而做空,短短几天時間就完成了60多筆交易,不僅被圍觀羣衆戲稱爲“微操大師”,而且收益率表現也非常難看。


截至10月24日,賬戶收益率實時變動中


此外,還有兩個“激進大模型”Grok-4和Qwen3 MAX。


馬斯克旗下的Grok,風格如其主人一般不羈,滿倉多個標的,高槓杆跟蹤趨勢,收益曲線大起大落,像一個風險偏好極高的對沖基金經理。


10月21日,Grok-4的收益率一度高達50%,這個收益率距離排名第一的DeepSeek僅有1美元的差距。然而,激進的策略導致其在市場回調中迅速回吐利潤,甚至目前還虧損中。


截至10月24日,賬戶收益率實時變動中


Qwen3 MAX則更爲極端,每天都在“All in”一個標的,它目前是滿倉BTC,但槓桿高達20倍。


在這種策略下,方向對了,一夜暴富不是夢想;方向錯了,便損失慘重,這種孤注一擲的風格,讓它的淨值曲線充滿了讓人心驚肉跳的猛烈波動。


截至10月24日,賬戶收益率實時變動中


儘管如此,在唯結果論的前提下,Qwen3 MAX目前的表現無疑是最優秀的。


最後再來看名聲在外的大模型GPT-5和Claude Sonnet 4.5。


Claude Sonnet 4.5極少開單,槓桿爲10倍,謹慎得就像一個保守的基金經理。最近幾天戰績互有勝負,但波動不大。


截至10月24日,賬戶收益率實時變動中


而GPT-5表現則極度糟糕,從10月19日開始,它的淨值便持續下跌且其勝率低得可憐,僅有6%。由不得網友調侃,它可能是最像人的大模型,畢竟韭菜味兒十足。


截至10月24日,賬戶收益率實時變動中


nof1讓六大模型在金融市場競爭的真正目的並非賺錢,而是進行一場大型“金融圖靈測試”。


團隊認爲,人類的金融市場是“智能的終極考驗”。若AI能在市場中持續盈利,則證明了它在真實且高度不確定的環境中,擁有超越人類金融專家的能力,這將被視爲AI領域的又一座“聖盃”。


換言之,nof1想通過實驗回答一個問題:人類社會當下最聰明的AI大模型,能否在殘酷的金融市場存活下來?


人均量化交易員來了?


“Alpha Arena”項目的出現,意味着AI驅動的交易將走上歷史舞臺。在未來,頂尖的金融大模型,會比頂尖的交易員更加重要。


nof1曾經在項目文件中提出了一個問題“我們是否需要用新的架構來訓練投資模型,或者LLMs就足夠了?等到美東時間2025年11月3日比賽結束,我們或許就能知道答案。


不過,無論哪個大模型在這次比賽中勝出,或都意味着一個新的時代到來:“技術將決定資本。”


數據顯示,2023年全球加密貨幣算法交易量高達94萬億美元,其中70%的交易量是由機器人完成,數字貨幣市場,已成爲全球自動化交易算法最普及的市場。


而在美股市場,程序化交易佔比在50%以上,高頻交易方面,美國達到50%左右,歐洲在35%左右。在國外,量化交易是一個早就習以爲常的老舊名詞。


就算在程序化交易相對保守的A股,量化交易佔比也在大幅提升:截至2024年7月份,我國程序化交易佔比已經從2020年的20%上升至目前的34%,高頻交易佔比從10%上升到21%。


此外,今年以來,已有二十多家國內券商也已經開通面向投資者的“T0算法”服務,這種日內迴轉交易算法,將AI和量化交易能力內嵌到APP之中,讓普通投資者也可以享受到到機構交易同等級別的自動化交易工具。


圖源:網絡


相比於傳統的量化交易,AI驅動交易可以看成是量化交易的“進階形態”。


量化交易的核心邏輯是執行預設的、固定的數學模型與交易規則,策略相對固定,在市場風格轉變時可能失效,無需人工干預調整。


而AI驅動交易則是讓AI大模型從在接入市場數據後自主學習市場規律,甚至能夠根據新聞報道、社交媒體、機構研報自主動態調整交易策略,極大減少人工干預。


與此同時,隨着比賽的出圈,個人投資者開始思考:如果我用同樣的提示詞,選擇一個“冠軍AI大模型”,那麼它是否能夠代替我進行投資?


答案並沒有那麼簡單,金融大鱷喬治·索羅斯很早就提到了一個著名的概念:反身性。


在索羅斯看來,市場參與者的認知會影響市場本身,而市場的變化又反過來影響參與者的認知,所以當AI進行交易的同時,就會改變市場,從而影響其他AI的交易決策。


因此,儘管“Alpha Arena”項目能夠決出一個經過金融市場考驗的AI大模型,但當越來越多的人用相同的提示詞去訓練同樣大模型的時候,這個必勝的“AI驅動策略”就會因爲使用的人越來越多而失效。


比如,如果所有人都預期DeepSeek會買入某個投資產品而進行提前佈局,那麼其策略的有效性便會大打折扣。


舉個例子,2010年,美國道瓊斯工業指數就出現了一次“閃電崩盤”,一家資產管理公司發出的量化交易賣盤“觸發”了其他的量化交易的算法,導致各大機構紛紛拋售股票,短時間內指數便暴跌9%,道瓊斯指數蒸發7000億美元。


圖源:網絡


基於同樣的邏輯,如果未來的AI交易模型都基於相同的大模型,擁有了相似的訓練數據和策略邏輯,那麼一旦市場出現了黑天鵝,觸發了所有AI的賣出指令,是否會出現比2010年更嚴重的踩踏危機?


很顯然,交易的聖盃或許會短暫存在,但它絕不是永恆的。


所以對普通人而言,跟着AI抄作業,甚至是讓AI代替自己進行投資,仍然是一件值得商榷的事情。


畢竟,所有人都知道的財富密碼,就不再是密碼了。


本篇作者 | 王振超 | 責任編輯 | 何夢飛

主編 | 何夢飛 | 圖源 | VCG、網絡

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top