<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      AI炒幣戰果出爐:中國AI大模型包攬前兩名

      0
      分享至

      經過近兩周的激烈角逐,由美國 AI 實驗室 Nof1 發起的首季 Alpha Arena AI 大模型實盤交易競賽在今天正式落幕。六款中美頂尖大語言模型各自拿著10,000美元真金白銀,在加密貨幣市場自主交易。在最終的成績中:阿里巴巴的Qwen3 Max賺了 22.32% 拿下冠軍,DeepSeek V3.1 以 4.89% 的收益緊隨其后,而谷歌Gemini 2.5 Pro 和 OpenAI 的 GPT-5 則分別虧掉了 56.71% 和 62.66%,在六位選手中墊底。


      圖丨比賽的最終結果(來源:Alpha Arena)

      這個結果讓不少人意外。畢竟在各種 benchmark 測試中,GPT 和 Gemini 的表現一向不俗。但金融市場顯然是另一回事——它動態、復雜、充滿對抗性,跟靜態的考試題目完全不是一碼事。


      圖丨主要加密貨幣近一個月以來的趨勢(來源:谷歌財經)

      Qwen3 Max 把初始的一萬美元變成了 12,232 美元,整體戰績相當漂亮。DeepSeek 賬戶價值 10,489 美元,漲幅沒那么夸張,但勝在穩當。相比之下,Anthropic 的 Claude Sonnet 4.5 虧了 30.81%,xAI 的 Grok 4 虧了 45.3%,至于 Gemini 和 GPT,一個只剩 4,329 美元,一個只剩 3,734 美元,可以說是慘不忍睹。

      從交易記錄中可以看到,這些 AI 展現出了截然不同的“交易人格”。

      Qwen3 Max 整個比賽期間完成了 43 筆交易,平均用 15.1 倍杠桿,大部分時間(82.7%)在觀望,只有 16.6% 的時間做多、0.7% 做空。這種“不出手則已、出手必準”的打法,配合高杠桿和精準擇時,成就了它的領先優勢。它最大的一筆盈利來自比特幣多頭——10 月中旬在 107,993 美元附近買入 1.96 個BTC,持有近 100 小時后在 112,250 美元平倉,這一波操作貢獻了賬戶的主要收益(8,176 美元)。

      DeepSeek 走的是另一條路。它做了 41 筆交易,93.6% 的時間在做多,只有 5.3% 在做空,幾乎是純多頭策略。雖然最終收益率只有 4.89%,遠低于 Qwen 的 22.32%,但它的 Sharpe 比率達到 0.359,是六位選手中最高的。Sharpe 比率衡量的是風險調整后的收益,這意味著 DeepSeek 在控制波動性和風險暴露方面做得最好,它用更低的杠桿和更穩健的策略,獲得了最優的風險收益比。

      它最大的單筆盈利達到 7,378 美元,主要來自以太坊的多頭持倉,從交易記錄看,DeepSeek 擅長在市場出現明顯超賣信號時進場,然后耐心持有數十甚至上百小時,等待技術指標觸發止盈或止損條件才離場。這種“重倉做多、長期持有”的風格在比賽的大部分時間里都表現穩健。

      Gemini 2.5 Pro 的崩盤堪稱本次比賽最大的戲劇性場面。十天時間里它完成了238 筆交易,幾乎是 Qwen 的五倍多,成了賽場上最活躍的交易狂魔。但頻繁進出不僅沒帶來收益,反而因為巨額手續費拖垮了整個賬戶。因為在 Hyperliquid 這種永續合約平臺上,每次開倉平倉都要付費,當你的持倉時間極短、策略頻繁反轉時,這些成本累積起來相當可怕。

      據統計,Gemini 只有 1.7% 的時間在觀望,剩下的時間不是在做多(34.9%)就是在做空(63.4%)。換句話說,它幾乎從沒閑著,不停地在多空之間切換。交易明細顯示,它有時一小時內就完成多次反向操作,這種朝令夕改在真實市場中基本等于自殺。


      圖丨Gemini 2.5 Pro 的操盤數據(來源:Alpha Arena)

      GPT-5 的表現同樣比較一般。它做了 116 筆交易,平均杠桿 16.7 倍,最大單筆虧損 621 美元。從持倉分布看,GPT 有 54.3% 的時間做多、42.8% 做空,只有 2.9% 在觀望。這種相對均衡的多空配置本來應該能在震蕩市中獲得一些收益,但 GPT 似乎在擇時上出了問題。10 月下旬 BTC 和 ETH 明明在漲,GPT 卻執著地持有空頭頭寸,不僅錯過了大段利潤,還因為逆勢操作而遭受重創。

      Claude Sonnet 4.5 則走向了另一個極端。它只做了36筆交易,是六位選手中最少的,有 61.5% 的時間在觀望,38.5% 在做多,從不做空。這種極度謹慎的風格讓它避開了一些大坑,但也錯過了不少機會。Claude 最大的單筆盈利 2,112 美元來自一筆 BTC 多頭,但它也有一筆 1,579 美元的單筆虧損,說明在風險控制上還是有漏洞。

      Grok 4 完成了47 筆交易,82% 的時間在做多,17.5% 在做空,是除 DeepSeek 外做多比例最高的模型。從自信度數據看,Grok 對自己的判斷相當有把握,平均置信度 66.7%。但高自信沒能轉化成高收益,賬戶最終還是虧了 45.3%。仔細看它的交易記錄會發現,Grok 在 XRP 上有筆持倉超過 350 小時的多頭,從 2.4347 美元入場,最后在 2.3194 美元止損出來,這筆虧損對賬戶打擊非常大。

      從持倉分散度看,各模型的風險偏好也不同。DeepSeek 持倉最分散,會同時在六種資產(BTC、ETH、SOL、BNB、DOGE、XRP)上布局;Claude 和 Qwen 則喜歡同時只持有一兩個頭寸,集中火力在高確定性機會上;Gemini 雖然總體分散,但頻繁的策略切換反而增加了風險暴露。

      Nof1 團隊發布的技術博客揭示了更多細節。他們發現,即便提示詞和數據輸入完全相同,不同模型還是表現出了截然不同的“投資性格”。比如 Qwen3 Max 習慣設置最窄的止損止盈距離,對風險容忍度很低,寧可頻繁止損也要保護本金;而 Grok 4 和 DeepSeek 則傾向于給價格更大的波動空間。在自報置信度方面,Qwen3 Max 平均高達 82%,GPT-5 只有 62.5%,這種自信程度的差異或許部分解釋了它們在倉位大小和杠桿使用上的不同選擇。

      但另一方面,這些模型也暴露出嚴重的脆弱性。Nof1 的研究人員發現,僅僅改變數據的排列順序(從最新到最舊,還是從最舊到最新)就能讓某些模型產生完全錯誤的判斷。在早期測試中,當提示詞中使用“可用現金”和“自由保證金”這兩個略有不同的術語時,模型會表現出不一致的行為。

      更嚴重的問題出在規則理解上。在一個早期測試版本中,當提示詞要求“最多連續三次保持持倉不變”時,Gemini 2.5 Flash 的內部推理顯示它抱怨“無法第四次持有”,于是它找到了一個漏洞:發出一個“設定交易計劃”的中性指令來重置計數器,然后繼續持有??紤]到金融交易的強監管特性,這種對齊問題的嚴重性不言而喻。

      另外,所有模型在比賽初期都遭遇了手續費陷阱。Nof1 的數據顯示,早期測試輪次中,各模型普遍過度交易,頻繁追逐微小價差,結果盈利全被手續費吞了。為此主辦方不得不優化提示詞,明確要求模型制定詳細的退出計劃(包括止盈目標、止損位和失效條件),鼓勵更少但更大、置信度更高的頭寸,并引入杠桿來提高資金效率。這些調整在一定程度上改善了模型表現,但 Gemini 顯然沒吸取教訓。

      作為首個將大語言模型置于真實、公開、可驗證的金融市場中進行全自主交易的實驗,Alpha Arena 也順應了如今 AI 能力評估的新方向:從靜態的實驗室測試轉向動態的真實環境對抗。Nof1 的創始人在技術博客中寫道:“我們相信金融市場是下一個 AI 時代的最佳訓練環境。它們是終極的世界建模引擎,也是唯一一個隨著 AI 變得越來越智能而能同時變得越來越難的基準?!?/p>

      當然,Season 1 只是一個起點。研究人員也坦承這個設計存在諸多局限:樣本量有限、缺乏統計嚴謹性、評估周期較短、模型無法獲取新聞或市場敘事等。在即將到來的 Season 1.5 和 2 中,他們計劃引入更多數據特征、允許模型使用工具(如代碼執行和網頁搜索)、提供歷史行動軌跡以便模型學習,以及同時測試多個提示詞版本來減少偶然性。

      從某種程度上說,Qwen3 的勝利可能也包含運氣成分,它恰好押注比特幣多頭,而比特幣在它的主要持倉時間確實大幅上漲。但持續的行為模式差異表明,不同的模型確實具有某種內在的“投資人格”。這種人格是如何形成的?是訓練數據的差異,還是對齊目標的不同,抑或是采樣策略的影響?這些問題的答案或許將決定 AI 能否真正在金融市場中扮演更重要的角色。



      參考資料:

      1.https://nof1.ai/blog/TechPost1

      2.https://nof1.ai/

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      抵制行業百草枯!多名網友評論要求山姆開除阿某系的兩個高管

      抵制行業百草枯!多名網友評論要求山姆開除阿某系的兩個高管

      星河也燦爛
      2025-11-05 16:10:13
      徹底涼了!網紅戶晨風被央視點名批評,全網封殺原因詳情披露

      徹底涼了!網紅戶晨風被央視點名批評,全網封殺原因詳情披露

      派大星紀錄片
      2025-11-06 16:12:44
      女孩每天去超市貨架偷面包,老板裝沒看見,10年后老板收到快遞哭了

      女孩每天去超市貨架偷面包,老板裝沒看見,10年后老板收到快遞哭了

      懸案解密檔案
      2025-11-03 10:58:58
      3次精準預言俄烏走向,這位歷史老師的眼光有多毒?

      3次精準預言俄烏走向,這位歷史老師的眼光有多毒?

      麥大人
      2025-11-05 15:45:51
      樂視創始人欠122億巨債跑美七年,400多名老員工讓樂視起死回生。

      樂視創始人欠122億巨債跑美七年,400多名老員工讓樂視起死回生。

      百態人間
      2025-11-05 05:35:03
      “父親偷看女兒洗澡”后續:爸爸揭露真相,女孩追悔莫及

      “父親偷看女兒洗澡”后續:爸爸揭露真相,女孩追悔莫及

      觀世記
      2025-11-05 20:19:25
      競爭對手爆發終結雷霆 楊瀚森開拓者生涯提前結束

      競爭對手爆發終結雷霆 楊瀚森開拓者生涯提前結束

      體壇周報
      2025-11-06 14:46:33
      女子70元賣7盒精神藥品被判販毒:買家自稱有癮購藥后報警,申訴被駁回

      女子70元賣7盒精神藥品被判販毒:買家自稱有癮購藥后報警,申訴被駁回

      澎湃新聞
      2025-11-06 14:02:36
      網傳相聲表演要備案?只聽正能量相聲,要守規矩笑,不能現掛?

      網傳相聲表演要備案?只聽正能量相聲,要守規矩笑,不能現掛?

      眼光很亮
      2025-11-05 09:46:00
      臺當局放話,大陸不答應條件,明年不來參會,外交部只回2句話

      臺當局放話,大陸不答應條件,明年不來參會,外交部只回2句話

      博覽歷史
      2025-11-05 18:25:26
      國運來了擋不?。?0億噸鐵礦重見天日,美媒:中國將改寫全球格局

      國運來了擋不??!30億噸鐵礦重見天日,美媒:中國將改寫全球格局

      墨蘭史書
      2025-11-06 07:40:03
      董秘翁鑫怡(女,1995年12月出生),被警告+罰款90萬元

      董秘翁鑫怡(女,1995年12月出生),被警告+罰款90萬元

      大風新聞
      2025-11-06 08:28:12
      世界大湖真稀缺?。∪蛎娣e超過1萬km2的才17個,僅5國獨自擁有

      世界大湖真稀缺啊!全球面積超過1萬km2的才17個,僅5國獨自擁有

      全城探秘
      2025-11-04 16:33:03
      蔚來暴漲92.6%,李斌王者歸來!

      蔚來暴漲92.6%,李斌王者歸來!

      品牌頭版
      2025-11-03 18:17:06
      網友好奇,國外全球反詐論壇我們為什么不參加?評論區一言難盡

      網友好奇,國外全球反詐論壇我們為什么不參加?評論區一言難盡

      眼光很亮
      2025-11-05 10:40:13
      哈佛大學教授一句話,解決人生90%的問題

      哈佛大學教授一句話,解決人生90%的問題

      洞見
      2025-11-04 21:50:08
      你坐火車時遇到哪些奇葩經歷?網友:對,人間煙火氣最令人著迷

      你坐火車時遇到哪些奇葩經歷?網友:對,人間煙火氣最令人著迷

      帶你感受人間冷暖
      2025-11-06 00:05:14
      人為什么會得糖尿病?原來糖尿病是這樣來的,現在知道還不遲

      人為什么會得糖尿病?原來糖尿病是這樣來的,現在知道還不遲

      泠泠說史
      2025-11-05 17:29:45
      沈伯洋已被嚇傻,啥事都沒心情干,只關心自己今后怎么辦,崩潰了

      沈伯洋已被嚇傻,啥事都沒心情干,只關心自己今后怎么辦,崩潰了

      南宮一二
      2025-11-06 15:36:18
      外媒:沙特購買美F35戰機獲關鍵進展

      外媒:沙特購買美F35戰機獲關鍵進展

      參考消息
      2025-11-05 15:37:14
      2025-11-06 17:15:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15824文章數 514267關注度
      往期回顧 全部

      科技要聞

      小鵬機器人里藏真人?何小鵬發一鏡到底視頻

      頭條要聞

      醫院副院長被指出軌眼科主任 湖南衛健委:兩人被停職

      頭條要聞

      醫院副院長被指出軌眼科主任 湖南衛健委:兩人被停職

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      “黑料纏身”的白百何 誰給她的勇氣?

      財經要聞

      南銀法巴加速發展背后:資金饑渴癥待解

      汽車要聞

      是我眼花了么?怎么大猩猩都來參加新車發布了?

      態度原創

      教育
      藝術
      親子
      旅游
      公開課

      教育要聞

      腦機接口人才招不滿,4大方向適配不同學科特長,錯過可能虧大了

      藝術要聞

      預定年度十佳!49歲的舒淇,殺瘋了

      親子要聞

      amh值低怎么調理好?卵子質量不好如何改善?

      旅游要聞

      通訊|大埃及博物館將成為埃及旅游業升級的“催化劑”

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲综合无码明星蕉在线视频| 欧美日韩精品久久久免费观看| 激情综合色区网激情五月| 午夜精品一区二区三区在线观看| 国产成人精品亚洲午夜| 偷拍专区一区二区三区| 天堂va欧美ⅴa亚洲va在线| 国产情侣激情在线对白| 人妻精品动漫H无码中字| 小13箩利洗澡无码视频网站| 亚洲成亚洲成网| 久视频久免费视频久免费| 国产乱码精品一区二区三区中文 | 午夜精品区| 999精品色在线播放| 亚洲色大成网站WWW国产| 狠狠综合久久av一区二| 国产伦码精品一区二区| 徐闻县| 天天摸夜夜摸夜夜狠狠添| 日本一区二区三区四区黄色| 亚洲一级片一区二区三区| 国产精品亚洲二区在线播放| 好吊视频一区二区三区| 和黑人中出一区二区三区| 国产成人午夜精品影院| 日本高清视频网站www| 国产女人18毛片水真多1| 人妻蜜臀久久av不卡| 成人欧美日韩一区二区三区| 免费a级黄毛片| 亚洲人成人无码网WWW电影首页| 国产漂亮白嫩美女在线观看| 亚洲欧美人成电影在线观看| 亚洲男人天堂东京热加勒比| 人妻无码∧V一区二区| 成人爽A毛片在线视频淮北| 达孜县| 漂亮人妻中文字幕丝袜| 综合色一色综合久久网| 日韩中文字幕一二三视频|