<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      AI炒幣戰果出爐:中國AI大模型包攬前兩名

      0
      分享至

      經過近兩周的激烈角逐,由美國 AI 實驗室 Nof1 發起的首季 Alpha Arena AI 大模型實盤交易競賽在今天正式落幕。六款中美頂尖大語言模型各自拿著10,000美元真金白銀,在加密貨幣市場自主交易。在最終的成績中:阿里巴巴的Qwen3 Max賺了 22.32% 拿下冠軍,DeepSeek V3.1 以 4.89% 的收益緊隨其后,而谷歌Gemini 2.5 Pro 和 OpenAI 的 GPT-5 則分別虧掉了 56.71% 和 62.66%,在六位選手中墊底。


      圖丨比賽的最終結果(來源:Alpha Arena)

      這個結果讓不少人意外。畢竟在各種 benchmark 測試中,GPT 和 Gemini 的表現一向不俗。但金融市場顯然是另一回事——它動態、復雜、充滿對抗性,跟靜態的考試題目完全不是一碼事。


      圖丨主要加密貨幣近一個月以來的趨勢(來源:谷歌財經)

      Qwen3 Max 把初始的一萬美元變成了 12,232 美元,整體戰績相當漂亮。DeepSeek 賬戶價值 10,489 美元,漲幅沒那么夸張,但勝在穩當。相比之下,Anthropic 的 Claude Sonnet 4.5 虧了 30.81%,xAI 的 Grok 4 虧了 45.3%,至于 Gemini 和 GPT,一個只剩 4,329 美元,一個只剩 3,734 美元,可以說是慘不忍睹。

      從交易記錄中可以看到,這些 AI 展現出了截然不同的“交易人格”。

      Qwen3 Max 整個比賽期間完成了 43 筆交易,平均用 15.1 倍杠桿,大部分時間(82.7%)在觀望,只有 16.6% 的時間做多、0.7% 做空。這種“不出手則已、出手必準”的打法,配合高杠桿和精準擇時,成就了它的領先優勢。它最大的一筆盈利來自比特幣多頭——10 月中旬在 107,993 美元附近買入 1.96 個BTC,持有近 100 小時后在 112,250 美元平倉,這一波操作貢獻了賬戶的主要收益(8,176 美元)。

      DeepSeek 走的是另一條路。它做了 41 筆交易,93.6% 的時間在做多,只有 5.3% 在做空,幾乎是純多頭策略。雖然最終收益率只有 4.89%,遠低于 Qwen 的 22.32%,但它的 Sharpe 比率達到 0.359,是六位選手中最高的。Sharpe 比率衡量的是風險調整后的收益,這意味著 DeepSeek 在控制波動性和風險暴露方面做得最好,它用更低的杠桿和更穩健的策略,獲得了最優的風險收益比。

      它最大的單筆盈利達到 7,378 美元,主要來自以太坊的多頭持倉,從交易記錄看,DeepSeek 擅長在市場出現明顯超賣信號時進場,然后耐心持有數十甚至上百小時,等待技術指標觸發止盈或止損條件才離場。這種“重倉做多、長期持有”的風格在比賽的大部分時間里都表現穩健。

      Gemini 2.5 Pro 的崩盤堪稱本次比賽最大的戲劇性場面。十天時間里它完成了238 筆交易,幾乎是 Qwen 的五倍多,成了賽場上最活躍的交易狂魔。但頻繁進出不僅沒帶來收益,反而因為巨額手續費拖垮了整個賬戶。因為在 Hyperliquid 這種永續合約平臺上,每次開倉平倉都要付費,當你的持倉時間極短、策略頻繁反轉時,這些成本累積起來相當可怕。

      據統計,Gemini 只有 1.7% 的時間在觀望,剩下的時間不是在做多(34.9%)就是在做空(63.4%)。換句話說,它幾乎從沒閑著,不停地在多空之間切換。交易明細顯示,它有時一小時內就完成多次反向操作,這種朝令夕改在真實市場中基本等于自殺。


      圖丨Gemini 2.5 Pro 的操盤數據(來源:Alpha Arena)

      GPT-5 的表現同樣比較一般。它做了 116 筆交易,平均杠桿 16.7 倍,最大單筆虧損 621 美元。從持倉分布看,GPT 有 54.3% 的時間做多、42.8% 做空,只有 2.9% 在觀望。這種相對均衡的多空配置本來應該能在震蕩市中獲得一些收益,但 GPT 似乎在擇時上出了問題。10 月下旬 BTC 和 ETH 明明在漲,GPT 卻執著地持有空頭頭寸,不僅錯過了大段利潤,還因為逆勢操作而遭受重創。

      Claude Sonnet 4.5 則走向了另一個極端。它只做了36筆交易,是六位選手中最少的,有 61.5% 的時間在觀望,38.5% 在做多,從不做空。這種極度謹慎的風格讓它避開了一些大坑,但也錯過了不少機會。Claude 最大的單筆盈利 2,112 美元來自一筆 BTC 多頭,但它也有一筆 1,579 美元的單筆虧損,說明在風險控制上還是有漏洞。

      Grok 4 完成了47 筆交易,82% 的時間在做多,17.5% 在做空,是除 DeepSeek 外做多比例最高的模型。從自信度數據看,Grok 對自己的判斷相當有把握,平均置信度 66.7%。但高自信沒能轉化成高收益,賬戶最終還是虧了 45.3%。仔細看它的交易記錄會發現,Grok 在 XRP 上有筆持倉超過 350 小時的多頭,從 2.4347 美元入場,最后在 2.3194 美元止損出來,這筆虧損對賬戶打擊非常大。

      從持倉分散度看,各模型的風險偏好也不同。DeepSeek 持倉最分散,會同時在六種資產(BTC、ETH、SOL、BNB、DOGE、XRP)上布局;Claude 和 Qwen 則喜歡同時只持有一兩個頭寸,集中火力在高確定性機會上;Gemini 雖然總體分散,但頻繁的策略切換反而增加了風險暴露。

      Nof1 團隊發布的技術博客揭示了更多細節。他們發現,即便提示詞和數據輸入完全相同,不同模型還是表現出了截然不同的“投資性格”。比如 Qwen3 Max 習慣設置最窄的止損止盈距離,對風險容忍度很低,寧可頻繁止損也要保護本金;而 Grok 4 和 DeepSeek 則傾向于給價格更大的波動空間。在自報置信度方面,Qwen3 Max 平均高達 82%,GPT-5 只有 62.5%,這種自信程度的差異或許部分解釋了它們在倉位大小和杠桿使用上的不同選擇。

      但另一方面,這些模型也暴露出嚴重的脆弱性。Nof1 的研究人員發現,僅僅改變數據的排列順序(從最新到最舊,還是從最舊到最新)就能讓某些模型產生完全錯誤的判斷。在早期測試中,當提示詞中使用“可用現金”和“自由保證金”這兩個略有不同的術語時,模型會表現出不一致的行為。

      更嚴重的問題出在規則理解上。在一個早期測試版本中,當提示詞要求“最多連續三次保持持倉不變”時,Gemini 2.5 Flash 的內部推理顯示它抱怨“無法第四次持有”,于是它找到了一個漏洞:發出一個“設定交易計劃”的中性指令來重置計數器,然后繼續持有。考慮到金融交易的強監管特性,這種對齊問題的嚴重性不言而喻。

      另外,所有模型在比賽初期都遭遇了手續費陷阱。Nof1 的數據顯示,早期測試輪次中,各模型普遍過度交易,頻繁追逐微小價差,結果盈利全被手續費吞了。為此主辦方不得不優化提示詞,明確要求模型制定詳細的退出計劃(包括止盈目標、止損位和失效條件),鼓勵更少但更大、置信度更高的頭寸,并引入杠桿來提高資金效率。這些調整在一定程度上改善了模型表現,但 Gemini 顯然沒吸取教訓。

      作為首個將大語言模型置于真實、公開、可驗證的金融市場中進行全自主交易的實驗,Alpha Arena 也順應了如今 AI 能力評估的新方向:從靜態的實驗室測試轉向動態的真實環境對抗。Nof1 的創始人在技術博客中寫道:“我們相信金融市場是下一個 AI 時代的最佳訓練環境。它們是終極的世界建模引擎,也是唯一一個隨著 AI 變得越來越智能而能同時變得越來越難的基準。”

      當然,Season 1 只是一個起點。研究人員也坦承這個設計存在諸多局限:樣本量有限、缺乏統計嚴謹性、評估周期較短、模型無法獲取新聞或市場敘事等。在即將到來的 Season 1.5 和 2 中,他們計劃引入更多數據特征、允許模型使用工具(如代碼執行和網頁搜索)、提供歷史行動軌跡以便模型學習,以及同時測試多個提示詞版本來減少偶然性。

      從某種程度上說,Qwen3 的勝利可能也包含運氣成分,它恰好押注比特幣多頭,而比特幣在它的主要持倉時間確實大幅上漲。但持續的行為模式差異表明,不同的模型確實具有某種內在的“投資人格”。這種人格是如何形成的?是訓練數據的差異,還是對齊目標的不同,抑或是采樣策略的影響?這些問題的答案或許將決定 AI 能否真正在金融市場中扮演更重要的角色。



      參考資料:

      1.https://nof1.ai/blog/TechPost1

      2.https://nof1.ai/

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      環球小姐墨西哥選手被辱罵憤然離場 獲集體聲援

      環球小姐墨西哥選手被辱罵憤然離場 獲集體聲援

      看看新聞Knews
      2025-11-05 23:12:03
      荷蘭正式宣布!荷蘭管制范圍擴大,敏感領域的新合作都一刀切禁止

      荷蘭正式宣布!荷蘭管制范圍擴大,敏感領域的新合作都一刀切禁止

      百態人間
      2025-11-04 16:00:18
      一位72歲靠運送垃圾為生的老人,卻在租住的簡陋地下室里,研究哥德巴赫猜想!完全是“競賽級別”

      一位72歲靠運送垃圾為生的老人,卻在租住的簡陋地下室里,研究哥德巴赫猜想!完全是“競賽級別”

      觀威海
      2025-11-04 09:58:04
      邵佳一上任,德甲發文,組建德國助教團,已有國腳主動申請回國足

      邵佳一上任,德甲發文,組建德國助教團,已有國腳主動申請回國足

      五姑娘說體育
      2025-11-06 10:44:40
      死亡率達80%!深圳一男子命懸一線!身體出現這些癥狀要警惕......

      死亡率達80%!深圳一男子命懸一線!身體出現這些癥狀要警惕......

      深圳晚報
      2025-11-06 11:04:23
      不雅視頻流出!醫院副院長出軌眼科主任?官方回應

      不雅視頻流出!醫院副院長出軌眼科主任?官方回應

      上觀新聞
      2025-11-06 13:25:05
      火箭大勝灰熊 沒有正經控衛 火箭如何成為全聯盟最強進攻效率球隊

      火箭大勝灰熊 沒有正經控衛 火箭如何成為全聯盟最強進攻效率球隊

      大話火箭隊
      2025-11-06 15:50:07
      獨領風騷,目前歐冠前8球隊英超占4席,其余四大聯賽各出1隊

      獨領風騷,目前歐冠前8球隊英超占4席,其余四大聯賽各出1隊

      懂球帝
      2025-11-06 08:14:10
      丈夫在單位28年還是科員,調離當天,局長問我:你愛人的背景是?

      丈夫在單位28年還是科員,調離當天,局長問我:你愛人的背景是?

      荔枝人物記
      2025-11-04 17:01:38
      被解雇后沒工作,51歲納什已經能領退休金了,他每年能拿多少錢?

      被解雇后沒工作,51歲納什已經能領退休金了,他每年能拿多少錢?

      大西體育
      2025-11-05 13:29:33
      男子買饅頭路上遇車禍不治身亡,肇事司機稱遭遠光燈照射闖禍,57.7萬判賠款難執行

      男子買饅頭路上遇車禍不治身亡,肇事司機稱遭遠光燈照射闖禍,57.7萬判賠款難執行

      大風新聞
      2025-11-04 18:31:10
      市委書記女兒去縣財政局工作,局長處處為難她,某天書記來探班

      市委書記女兒去縣財政局工作,局長處處為難她,某天書記來探班

      秋風專欄
      2025-10-23 11:23:56
      吳艷妮穿緊身三角褲太窄被批“露骨”,到底礙了誰的眼?

      吳艷妮穿緊身三角褲太窄被批“露骨”,到底礙了誰的眼?

      傲嬌的馬甲線
      2025-09-17 18:06:44
      美科技巨頭SAS閃電撤離中國,400員工被裁,賠償N+2加年終獎!

      美科技巨頭SAS閃電撤離中國,400員工被裁,賠償N+2加年終獎!

      眼光很亮
      2025-11-06 10:41:38
      棄車保帥!太子集團陳志末日已到,是被“自己人”滅口的

      棄車保帥!太子集團陳志末日已到,是被“自己人”滅口的

      吃瓜局
      2025-10-31 21:11:55
      去了一次上海和平飯店,我才明白什么叫“貧窮限制了想象”!

      去了一次上海和平飯店,我才明白什么叫“貧窮限制了想象”!

      詩意世界
      2025-11-05 22:33:13
      直轄市“70后”市委常委,任新設區首任區委書記

      直轄市“70后”市委常委,任新設區首任區委書記

      上觀新聞
      2025-11-06 15:59:05
      午后直線拉升!600939,超40萬手封漲停

      午后直線拉升!600939,超40萬手封漲停

      數據寶
      2025-11-06 14:17:13
      表現慘不忍睹!新賽季狀態下滑嚴重的五大球星!

      表現慘不忍睹!新賽季狀態下滑嚴重的五大球星!

      吳朑愛游泳
      2025-11-06 07:09:33
      尼泊爾一妻多夫咋生活?妻子直言不諱:該陪誰,得照著這個記號來

      尼泊爾一妻多夫咋生活?妻子直言不諱:該陪誰,得照著這個記號來

      貓眼觀史
      2025-11-05 15:38:42
      2025-11-06 18:31:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15824文章數 514267關注度
      往期回顧 全部

      科技要聞

      小鵬機器人里藏真人?何小鵬發一鏡到底視頻

      頭條要聞

      孫東旭離開東方甄選 曾因與董宇輝"小作文風波"引爭議

      頭條要聞

      孫東旭離開東方甄選 曾因與董宇輝"小作文風波"引爭議

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      “黑料纏身”的白百何 誰給她的勇氣?

      財經要聞

      南銀法巴加速發展背后:資金饑渴癥待解

      汽車要聞

      是我眼花了么?怎么大猩猩都來參加新車發布了?

      態度原創

      藝術
      游戲
      旅游
      本地
      公開課

      藝術要聞

      預定年度十佳!49歲的舒淇,殺瘋了

      《街頭籃球》20年自由不息:你欠青春的那場重逢,該赴約了

      旅游要聞

      景色醉人真情暖心,山東多景區用心“寵客”換來“秋游熱”

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲avav天堂av在线网爱情| 亚洲成av人片乱码色午夜| 护士张开腿被奷日出白浆| 好吊妞视频这里有精品| 国产亚洲精品aaaa片app| 亚洲欧洲av一区二区| 双乳奶水饱满少妇呻吟免费看| 亚洲精品国模一区二区| 人妻影音先锋啪啪av资源| 亚洲一区中文字幕第十页| a在线观看视频在线播放| 日韩伦理片| 国产高清在线男人的天堂| 日日猛噜噜狠狠扒开双腿小说| 性虎精品无码AV导航| 办公室强奷漂亮少妇同事| 国产精品一二三中文字幕| 国产成人无码免费视频麻豆| 亚洲AVAV天堂AV在线网阿V| 98日韩精品人妻一二区| 亚洲一卡2卡3卡4卡精品| 蜜桃无码一区二区三区| 日本中文字幕乱码免费| 久久综合给合久久狠狠狠| 人妻少妇精品中文字幕| 四虎成人高清永久免费看| 国产精品高清国产三级囯产AV| 亚洲欧美人成人综合在线播放 | 97se亚洲国产综合自在线观看| 久久成人伊人欧洲精品| 又爽又黄又无遮挡的激情视频| 免费观看日本污污ww网站| 日韩人妻一区中文字幕| 久久亚洲综合精品成人网| 2019香蕉在线观看直播视频| 天堂网在线.www天堂在线资源| 不卡乱辈伦在线看中文字幕| 亚洲天堂在线观看完整版| 邵东县| 国产av黄色一区二区三区| 成人网站免费观看|