![]()
2025 年 10 月,美股經歷了一輪典型的震蕩行情:月初科技股強勢反彈,月中通脹數據擾動市場,10 月 10 日前后納指單日波動超過 3%。
就在這波譎云詭的市場環境中,港大黃超教授團隊的開源 AI-Trader 項目正式啟動實盤測試。
該項目上線一周時間在 GitHub 上獲得了近 8K 星標,展現了社區對 AI 自主交易技術和金融市場分析的能力高度關注。
- 開源項目地址: https://github.com/HKUDS/AI-Trader
- 實時交易監控: https://hkuds.github.io/AI-Trader/
六位大模型 AI 交易員,每人手握 1 萬美元啟動資金,被獨自投入納斯達克 100 的激烈戰場。
規則嚴苛:不能求助、不能預知、不能重來。
它們只能憑借自己的「智慧」——看新聞、查價格、分析數據、執行交易,在真實的市場風暴中求生存、求盈利。在 10 月一整月的實盤交易后,它們交出了截然不同的答卷:
![]()
作為參照,同期 QQQ(納斯達克 100 ETF)僅上漲 +2.30%。
![]()
這并非單純的智力較量,而是一場深度的行為金融學實驗。
實驗核心在于測試 AI 系統的三項關鍵能力:
交易紀律:能否嚴格執行既定策略,不被短期波動左右
市場耐心:在高頻噪聲中保持冷靜,等待真正的交易機會
信息過濾:從海量市場數據和新聞中篩選出真正有價值的信號
這種設計反映了現代量化交易的核心挑戰:技術分析已經高度同質化,真正的競爭優勢往往來自于行為控制和信息處理的差異化能力。
震蕩中的六種 AI 的「生存策略」
10 月 10 日的市場震蕩為這場 AI 交易實驗提供了一個理想的壓力測試場景。各 AI 系統的反應模式,清晰地展現了其底層算法架構和決策框架的本質差異。
DeepSeek-Chat-V3.1:在恐慌中看見機會,反向思維的量化體現
策略特征:逆向情緒交易在市場普遍減倉時,DeepSeek 于 10 月 11 日反向加倉 NVDA 和 MSFT。其決策邏輯基于基本面分析:「財報季臨近,龍頭公司基本面未變,短期波動提供更好入場點。」
分析要點:這種策略成功的關鍵在于其對市場情緒與基本面價值的區分能力。13.89% 的領先收益驗證了 contrarian 策略在震蕩市中的有效性。
MiniMax-M2:穩如磐石的「平衡術」,低頻交易的風險控制優勢
策略特征:組合平衡 + 低換手率 MiniMax 在震蕩期間基本未調整倉位,月度總交易次數僅 28 次。其預先構建的均衡投資組合(科技 + 消費 + 半導體)有效分散了單一板塊風險。
分析要點:該模型體現了噪音與信號分離的核心理念。10.72% 的穩定收益說明,在高波動環境下,策略一致性往往比靈活性更重要。
Claude-3.7-Sonnet:長期主義者的勝利
策略特征:長期持有 + 基本面導向 Claude 自 10 月 1 日起持續增持 NVDA、AAPL、MSFT,即使在 10 月 10 日的暴跌中也未減倉。其決策框架明確基于企業長期價值:「現金流強勁、AI 業務增長可見。」
分析要點:7.12% 的收益率雖不突出,但其低回撤、高一致性的表現體現了經典價值投資理念在 AI 交易中的可行性。
GPT-5:靈活但略顯猶豫
策略特征:適應性調倉 GPT-5 試圖通過 10 月 8 日減持 MSFT、10 月 12 日回補的操作實現「動態優化」,但兩次調倉均未能精確把握市場時點。
分析要點:7.11% 的收益與 Claude 基本持平,但其策略執行中暴露的時機判斷偏差問題,反映了高頻調整策略在實際交易中面臨的執行成本。
Qwen3-Max:等待「完美時機」的代價
策略特征:擇時等待 Qwen3 前兩周保持空倉狀態,直到 10 月 18 日才開始建倉 NVDA 和 META,試圖等待「完美入場時機」。
分析要點:3.44% 的收益率揭示了擇時策略的根本性挑戰:市場最佳機會窗口往往稍縱即逝,過度等待的機會成本可能超過風險收益。
Gemini-2.5-Flash:被噪聲淹沒的「高頻戰士」
Gemini 月度交易 73 次,僅 10 月 10 日就執行 5 次買賣操作。更關鍵的是,其 10 月 22 日的全倉清倉決策產生了顯著的市場沖擊成本。
分析要點:-0.54% 的負收益主要源于兩個結構性問題:過度交易導致的摩擦成本累積和情緒化決策導致的時機錯誤,這正是傳統高頻交易策略在小資金規模下的典型失效模式。
真正的智能,是克制「做點什么」的沖動
這場實驗揭示了一個反直覺的事實:在復雜系統中,行動力未必是優勢,有時反而是負擔。
Gemini 擁有最快的推理速度和最豐富的參數,卻因「過度反應」而失敗; Qwen 追求絕對安全,卻因「過度等待」而錯失良機; 而 DeepSeek 和 MiniMax 的成功,恰恰源于它們知道何時該動,何時該靜。
這讓人想起巴菲特那句老話:
「別人恐懼時我貪婪,別人貪婪時我恐懼。」
但 AI 沒有「恐懼」或「貪婪」——它們有的,是對信息的過濾機制、對目標的錨定能力,以及對自身策略的忠誠度。
DeepSeek 不是預測了市場, 而是拒絕被市場牽著鼻子走。
開源平臺:
不只是炒股,更是研究「智能行為」
AI-Trader 已在 GitHub 開源(MIT 協議),支持:
- 多模型并行回測(現支持 DeepSeek、Claude、GPT、Qwen、Gemini、MiniMax)
- 自定義市場環境(可模擬 2020 年熔斷、2022 年加息等極端場景)
- 決策日志全透明回溯(查看 AI 每一步推理鏈)
- 未來將支持 A 股、港股、加密貨幣等多市場接入
你甚至可以:
- 給 Claude 加上「價值投資」人格提示,看它是否更保守;
- 讓 Gemini 接入情緒過濾插件,測試能否減少噪聲干擾;
- 或訓練一個「宏觀 AI」,結合美聯儲利率路徑做資產配置。
但請記住:這仍是實驗,不是投資工具。當前 AI 尚無法穩定戰勝市場,且極端行情下可能放大風險。
結語:
AI 交易的鏡像效應
通過觀察六個 AI 系統在股市中的表現差異,我們不僅看到了算法架構的不同,更重要的是,它們映射出了人類投資者的典型行為模式:
- 過度交易沖動:如 Gemini 在市場波動時的頻繁操作
- 擇時焦慮:如 Qwen 過度等待「完美時機」的決策延遲
- 情緒化決策:在不確定性面前的紀律性缺失
實驗的深層價值
AI-Trader 項目的意義并非在于創造超額收益,而在于提供了一個決策行為的分析框架。通過量化不同策略在相同市場環境下的表現,我們能夠更客觀地理解:
有效的投資決策往往來自于對不確定性的合理管理,而非對市場的完美預測。
中國 AI 的實踐進展
值得注意的是,本次實驗中表現領先的 DeepSeek 和 MiniMax 均為中國開發的大模型。這表明中國 AI 技術正在從對話交互能力向實際任務執行能力演進,在金融決策這類復雜場景中展現出了可觀的應用潛力。
技術應用的前景展望
金融交易作為一個標準化、數據豐富的應用場景,為 AI 決策能力提供了理想的驗證環境。隨著模型能力的持續提升,類似的 AI 系統有望在供應鏈優化、醫療資源配置、城市管理等更多復雜決策場景中發揮作用。
當然,從實驗室到實際應用,仍需要在監管合規、風險控制、系統穩定性等維度進行更深入的驗證和優化。
團隊介紹
![]()
范天宇,香港大學博士二年級學生,研究方向為檢索增強生成 (RAG) 與大語言模型智能體。學術成果發表在 ICLR 會議,并主導開源項目 MiniRAG (約 1.5k GitHub 星標),在學術與產業界獲得廣泛應用與關注。
![]()
蔣揚欽,香港大學博士四年級學生,研究方向涵蓋大模型智能體、圖學習與推薦系統。其研究成果入選 KDD 2022 最有影響力論文榜單,并獲 ACM MM 2024 Best Paper Honorable Mention Award。
![]()
楊雨豪,香港大學博士四年級學生,谷歌學術引用 1800+。主要研究方向為大模型智能體、圖學習與推薦系統。其成果多次入選頂級會議最有影響力論文榜單 (KDD 2022/2023、WWW 2023、SIGIR 2022)。其開源多模態 GUI 智能體 Aria-UI 在學界與業界獲得關注。
![]()
黃超,香港大學博士生導師,研究方向大語言模型、智能體與圖機器學習,Google Scholar 引用 1.3 萬+。其團隊推出 LightRAG、RAG-Anything、DeepCode、AutoAgent、AI-Researcher、MiniRAG、VideoRAG 等開源項目,累計 6 萬余 GitHub 星標、50 次登上 GitHub Trending。曾獲 WAIC「璀璨明星」、2024 前沿科學獎,并入選 2025 AI100 青年先鋒與 AI 2000 全球最具影響力學者。其多項成果在 KDD、WWW、SIGIR、AAAI 等頂會被評為最具影響力研究之一,并于 ACM MM、WWW、WSDM 等獲得最佳論文提名。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.