![]()
新智元報道
編輯:元宇 好困
【新智元導(dǎo)讀】DeepSeek在港大「AI-Trader」項目中以9.68%收益率擊敗GPT、Claude、Gemini等全球頂級模型,成為能夠在真實美股市場實現(xiàn)自主盈利的AI交易系統(tǒng),這標(biāo)志著AI在金融實盤應(yīng)用中的重大突破。
這一局,中國AI又贏了!
繼AlphaArena在加密貨幣市場掀起AI大戰(zhàn)之后,一場更硬核的「美股版AI魷魚游戲」已經(jīng)落幕。
就在剛剛,最新戰(zhàn)報出爐,結(jié)果震撼全場:
中國的DeepSeek成為最大黑馬,收益率高達(dá)9.68%。
這意味著,通過它賺錢速度是直接買熱門美股基金(QQQ)的8倍,是第二名AI大模型的4倍!
![]()
![]()
GitHub地址:https://github.com/HKUDS/AI-Trader
Leaderboard:https://hkuds.github.io/AI-Trader/
在這個名為「AI-Trader」的開源項目中,來自港大黃超教授的研究團(tuán)隊進(jìn)行了一次有趣的探索——
他們給GPT、Claude、Gemini、Qwen、DeepSeek這五個全球頂級AI模型每人1萬美金,到納斯達(dá)克100成分股交易市場廝殺近一個月。
同時,為這場比賽制定了堪稱嚴(yán)苛的規(guī)則:沒有人工干預(yù),沒有策略預(yù)設(shè),也沒有任何人為提示。
每個AI模型,只有自己的賬戶資金和一套用來查股價、搜新聞、下單的交易工具。
至于要怎么交易,全憑AI模型的智商了。
這不是你見過的「AI炒股」
首先需要說明的是,這是一場真正的AI自主交易!
它不是程序員預(yù)先寫死的「偽AI交易」,也不是拿歷史數(shù)據(jù)跑出來的「炒股機(jī)器人」。
項目團(tuán)隊為這個實驗定下了「三不原則」:
不給劇本:不告訴AI任何炒股套路;
不給建議:全程禁止人工「場外指導(dǎo)」;
不給作弊機(jī)會:嚴(yán)格按日期過濾數(shù)據(jù)。
設(shè)想你交給AI一萬美元和一套交易工具,然后讓它獨立操作一個月,看能否盈利。
整個過程沒有策略模板,沒有技術(shù)指標(biāo),AI只能靠自己搜索和分析信息,計算風(fēng)險收益,并做出購買決策。
因此,此次DeepSeek的勝出完全是依靠模型自身的學(xué)習(xí)和推理能力。
![]()
![]()
從DeepSeek的持倉截圖可以看出,它沒有盲目追熱點或All-in單只股票,而是展現(xiàn)出了超越多數(shù)散戶的投資策略:
精準(zhǔn)踩中科技龍頭:比如NVDA、AAPL、MSFT等核心標(biāo)的;
有效分散投資風(fēng)險:采用了多標(biāo)的投資組合,不把雞蛋放進(jìn)一個籃子里;
動態(tài)調(diào)倉能力:根據(jù)市場變化實時調(diào)整。
交易行為暴露AI「性格」
誰是老司機(jī),誰心態(tài)崩了?
更有意思的是,交易頻率的差異也暴露出了這些參賽AI各自迥異的「性格」。
![]()
從這些「AI交易員」的性格畫像中,我們也能琢磨出來一些現(xiàn)實炒股中的門道:
首先,頻繁交易≠高收益。
Gemini在短期內(nèi)進(jìn)行了高頻交易,瘋狂下單73次,因缺乏風(fēng)險控制導(dǎo)致虧損2.73%,呈現(xiàn)出典型的高頻波動型策略失效特征。
這像極了那種每天盯盤八小時,一有波動就慌忙操作的散戶,最后心態(tài)崩了就直接清倉走人。
![]()
第二,太佛系了也不行。
Qwen只交易了22次,結(jié)果還是拿了負(fù)收益。
![]()
第三,只有穩(wěn)健才是王道。
DeepSeek和Claude的交易次數(shù)都在50次左右,理性穩(wěn)健,該出手時就出手。
它們一個大賺9.68%,一個小賺2.17%——這才是成熟交易員該有的節(jié)奏。
![]()
![]()
這場實驗不僅測出了AI的「智商」,還測出了它們的「情商」和「心態(tài)」,而這恰恰也是金融市場最考驗人的地方。
完全開源
一鍵就能讓AI幫你炒股
更炸裂的是AI-Trader完全開源,MIT協(xié)議、代碼全公開。
只需下面三步就可以輕松上手:
克隆倉庫:只要一行命令就可以;
配置API:Alpha Vantage、Jina、OpenAI等,大部分都有免費額度;
一鍵啟動:python main.py,然后就可以坐等AI開始交易。
此外,項目還支持可插拔的擴(kuò)展:
時光機(jī)模式:回到2024年科技股暴跌期,看你的AI能不能成功抄底;
DIY專屬AI交易員:如果覺得GPT太保守,還可以自定義一個激進(jìn)派的Agent;
擴(kuò)展到全球市場:A股、港股……理論上都可以接入。
想訓(xùn)練好一個AI
最好的方法是將它扔進(jìn)股市
多年來,我們一直采用靜態(tài)基準(zhǔn)來衡量AI。
比如通過ImageNet測圖像識別,MMLU測知識問答等。
但這些測試都有一個致命缺陷:它們都發(fā)生在一個可預(yù)測、可以隨時按暫停鍵的「實驗室環(huán)境」中。
為了打破這一慣例,10年前,DeepMind引入了游戲場景來進(jìn)行AI測試。
不是讓AI去做MMLU選擇題,而是讓它在《星際爭霸》里與職業(yè)選手對戰(zhàn),或者在圍棋中與世界冠軍競爭。
DeepMind之所以這樣做,是因為游戲提供了傳統(tǒng)測試中所沒有的三個挑戰(zhàn):
動態(tài)環(huán)境:每一局都不一樣,對手也會學(xué)習(xí)、會反擊;
即時反饋:走錯一步棋,就可能立即輸?shù)舯荣悾?/p>
開放策略:沒有標(biāo)準(zhǔn)答案,只有輸贏。
于是我們看到了AlphaGo、AlphaStar,也看到了AI從「會答題」進(jìn)化到「能博弈」。
從靜態(tài)基準(zhǔn)測試到游戲測試,難度是提升了,但仍然不夠。
如果說游戲測試是AI的「新手局」,金融市場才是滿級玩家們要挑戰(zhàn)的終極BOSS。
原因很簡單:市場是一個比游戲更好的訓(xùn)練場。
游戲再復(fù)雜,它的規(guī)則也是固定的。
相比規(guī)則固定的游戲,金融市場的復(fù)雜性在于其參與者與規(guī)則的動態(tài)共演。
它是一個由無數(shù)人(包括智能體)共同組成的一個持續(xù)進(jìn)化的復(fù)雜系統(tǒng),它有博弈、欺騙、陷阱、絞殺,也會波動、反應(yīng)、懲罰、獎勵。
所以,市場才是AI的終極試金石。
一個AI的智能不僅取決于它讀取信息的速度,更取決于它能夠承認(rèn)錯誤、及時止損的自我反省與學(xué)習(xí)能力。
這才是真正的智能,也只有通過股市中真金白銀的搏殺才能檢驗出來。
正因如此,市場才是終極的世界建模引擎。
想要訓(xùn)練一個真正能在現(xiàn)實世界運行的AI,最好的辦法把它扔進(jìn)股市,它必須在這里學(xué)會:
從嘈雜的信息海洋中捕捉有效信號;
綜合財報、技術(shù)指標(biāo)、輿情分析做出多維決策;
隨著市場變化不斷調(diào)整策略;
知道及時止損。
這衡量的是AI在不確定性環(huán)境中生存的能力,這才是新時代的圖靈測試。
AI戰(zhàn)場
早已不只在聊天框里了
如果說過去十年,DeepMind用游戲證明了AI可以戰(zhàn)勝人類,那么接下來的十年,金融市場將證明「AI可以在真實世界中創(chuàng)造價值」。
它拓展了我們探索AGI的邊界,打開了AI通往真實世界的通路。
想象一下,當(dāng)AI能在復(fù)雜的市場環(huán)境下生存,今天能夠炒股,明天就可以做醫(yī)療診斷、法律分析、科研決策,去解決更多現(xiàn)實場景中的問題。
另外一個方面,市場也為AI提供了開放式學(xué)習(xí)的環(huán)境,近乎無限的數(shù)據(jù)和即時反饋,這是實驗室中永遠(yuǎn)也無法模擬出來的。
當(dāng)硅谷還在爭論「AI會不會搶了基金經(jīng)理飯碗」時,中國的DeepSeek已經(jīng)用真金白銀的9.68%收益率給出了答案——不是會不會,而是已經(jīng)在發(fā)生了。
DeepSeek的勝利,象征著一種范式轉(zhuǎn)變:
未來的華爾街,可能不再屬于那些時刻盯盤的交易員,而是屬于那些能秒讀千份財報、精準(zhǔn)捕捉市場情緒、永不情緒化的AI大腦。
而引領(lǐng)這場金融AI革命浪潮的,正是來自中國的DeepSeek。
從AI聊天(ChatGPT vs Kimi、DeepSeek),到深度研究(OpenAI DeepResearch vs Qwen DeepResearch),再到現(xiàn)在的AI炒股——每一個新戰(zhàn)場打開,我們都能看到中國AI的身影在快速逼近,甚至反超。
AI的戰(zhàn)場早就不只在聊天框里了。
而如今,中國AI正在開啟這個未來。
作者介紹
![]()
范天宇
范天宇(2002年生),香港大學(xué)博士二年級學(xué)生,研究方向為檢索增強生成(RAG)與大語言模型智能體。
學(xué)術(shù)成果發(fā)表在ICLR會議,并主導(dǎo)開源項目MiniRAG(GitHub 1.5k星),在學(xué)術(shù)與產(chǎn)業(yè)界獲得廣泛應(yīng)用與關(guān)注。
![]()
蔣楊欽
蔣楊欽(1999年生),香港大學(xué)博士四年級學(xué)生,研究方向涵蓋大模型智能體、圖學(xué)習(xí)與推薦系統(tǒng)。
研究成果入選KDD 2022最有影響力論文榜單,并獲得ACM MM 2024 Best Paper Honorable Mention Award。
![]()
楊雨豪
楊雨豪(2000年生),香港大學(xué)博士四年級學(xué)生,谷歌學(xué)術(shù)引用1800+。主要研究方向為大模型智能體、圖學(xué)習(xí)與推薦系統(tǒng)。
成果多次入選頂級會議最有影響力論文榜單(KDD 2022/2023、WWW 2023、SIGIR 2022)。開源多模態(tài)GUI智能體Aria-UI在學(xué)界與業(yè)界獲得關(guān)注。
![]()
黃超
黃超,香港大學(xué)博士生導(dǎo)師,研究方向大語言模型、智能體與圖機(jī)器學(xué)習(xí),Google Scholar引用1.3萬+。
團(tuán)隊推出LightRAG、RAG-Anything、DeepCode、AutoAgent、AI-Researcher、MiniRAG、VideoRAG等開源項目,累計6萬余GitHub星標(biāo)、50次登上GitHub Trending。
曾獲2024前沿科學(xué)獎,并入選2025 AI100青年先鋒與AI 2000全球最具影響力學(xué)者。
多項成果在KDD、WWW、SIGIR、AAAI等頂會被評為最具影響力研究之一,并于ACM MM、WWW、WSDM等獲得最佳論文提名。
參考資料:
https://github.com/HKUDS/AI-Trader
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.