界面新聞記者 | 宋佳楠
11月4日,界面新聞獲悉,全球首個AI大模型實時投資比賽“Alpha Arena”落下帷幕。歷時17天,阿里千問Qwen以超20%的收益率奪冠,Qwen和DeepSeek兩款中國模型也成為唯二盈利的模型,而美國四大頂尖模型全部虧損,GPT-5虧損超60%墊底。
![]()
該競賽由美國專注于金融市場的AI實驗室Nof1于10月18日發起,將多個AI大模型置于真實金融市場中進行自動化交易對決。首季競賽邀請了包括GPT-5、Gemini 2.5 Pro、Grok 4、Claude 4.5 Sonnet、Qwen3 Max和DeepSeek V3.1 在內的六大主流大模型,給每個模型配備1萬美元真實資金,在Hyperliquid交易所進行加密貨幣永續合約交易,以檢驗模型的交易能力。
競賽采用統一輸入方式,所有模型接收相同的市場數據和提示詞,交易記錄、持倉和賬戶價值實時公開,以保證比賽的公平性和透明度。此外,Nof1還允許AI模型“聊天互動”,讓它們在模擬對話中辯論市場走勢,展示決策邏輯,最終根據盈虧情況決出冠軍。
比賽初期,六大模型相對謹慎,大約5天后,參賽模型大致分為三大陣營:阿里千問和DeepSeek處于領先態勢,屢次互換第一,始終位列第一梯隊;Claude Sonnet 4.5和Grok 4在相近策略驅動下,維持在第二陣營,略有盈利,整體仍虧損;GPT-5、Gemini 2.5 Pro兩大模型則長期虧損墊底。
![]()
截至北京時間11月4日早上比賽結束,阿里千問最后超越DeepSeek,Qwen以超20%的勝率獲勝;DeepSeek實現盈利,位列第二;Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均虧損,Gemini 2.5 Pro和GPT-5虧損尤為明顯,截至最終持倉總市值僅為初始資金的三四成。
有行業人士指出,阿里千問和DeepSeek在實戰中的表現,證明了中國模型在解決實際問題的強大潛力,AI對于場景的深刻理解,將成為大模型落地和未來全球AI競賽的關鍵。
根據全球知名的大模型API三方聚合平臺OpenRouter在7月公布的榜單,來自中國的DeepSeek和阿里通義千問躋身全球前五。其中,通義千問以10.4%的市場份額,超越OpenAI的4.7%,位列第四。
OpenRouter推文顯示,當下成長最快前10大模型中有9個是開源的。其中,Qwen3-Coder調用量以近500億Tokens高居第一,通義千問包攬前三,并在前十中占據五席。
而在今年9月,零一萬物CEO李開復在長江CEO 20周年返校日慶典上表示,DeepSeek對中國AI發展的核心貢獻在于推動了開源生態的形成。“如果十年后,我們回顧DeepSeek怎么讓中國沒有落后于美國,答案并非其技術能力本身,而是它帶來了中國(大模型)開源時代。”
李開復提到,自DeepSeek開源以來,國內多家企業相繼開源大模型,形成了“既開源、又比拼速度”的良性競爭局面。他認為,開源模式高度契合中國企業的學習特性,有望助力中國在AI領域縮小與美國的差距。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.