<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      國產AI路由系統開源逆襲!僅用19%成本達到Gemini-2.5-Pro同性能

      0
      分享至

      Avengers-Pro團隊 投稿
      量子位 | 公眾號 QbitAI

      頂級大模型性能確實很強,但對于預算不高的用戶來說就是:

      你很好但我不配。

      雖然大模型的優越表現令人矚目,但動輒高昂的使用成本也讓不少用戶望而卻步。

      為平衡性能與成本,上海人工智能實驗室科研團隊基于前期技術積累,開源推出了Avengers-Pro多模型調度路由方案。



      該方案集成了8個行業領先的大模型,并在Human Last Exam、GPQA-diamond、ARC-AGI等6個挑戰性數據集上取得了優秀成績:

      1. 性能新高:Avengers-Pro的最高性能超越GPT-5-medium 7%,超越Gemini-2.5-Pro 19%。
      2. 極致性價比:Avengers-Pro能以降低27%成本的方式,達到與GPT-5-medium同等的頂級性能;更能以僅19%的成本,獲得Gemini-2.5-Pro同等的性能水平。
      3. 帕累托最優:相比單個模型,Avengers-Pro在任何給定成本水平下都能實現最高準確率;反之,針對任何指定的準確率目標,也能將成本降至最低,實現了性能-成本平衡的帕累托最優解。



      來看看是如何做到的。

      比GPT-5更強,更便宜

      研究背景:大模型的智能調度路由

      如何平衡大模型的性能表現和推理成本是大模型領域的關鍵問題。

      在已經被優化到極致的大模型系統的基礎上進一步提升性價比的挑戰性不言而喻。

      為解決這一問題,大模型智能調度路由應運而生。其核心思想是將不同任務分配給最適合的大模型,以提升模型回復質量,同時避免”大炮打蚊子“而產生的資源浪費。

      OpenAI在最新推出的GPT-5中,首次在商業模型中引入的多模型調度路由機制:

      在推理階段,系統會根據任務特性和用戶需求,動態切換低成本低性能模型與高成本強推理模型,實現性能與成本的靈活平衡。

      這表明GPT-5會通過一個實時的路由器(Router)來動態決策,可以在保證絕大多數問題得到高效解答的同時,將復雜、困難的推理任務交給能力更強的模型處理,從而在系統層面實現性能與陳本的最佳平衡。

      Avengers-Pro多模型調度路由方案則是對GPT-5多模型調度路由機制的進一步拓展。

      Avengers-Pro: 兼顧性能與成本,推動降本增效

      Avengers-Pro實現了對不同性能與成本的大模型進行統一集成與調度路由,為性能與成本的權衡提供了一站式解決方案,有效推動了大模型的降本增效。

      其核心機制是通過對用戶請求進行嵌入(embedding)和聚類(clustering)分析,動態匹配并分配最適合的模型來處理不同任務

      只需依靠少量用戶請求-答案標簽數據,Avengers-Pro框架主要包括以下三個核心步驟:

      1. 嵌入 (Embedding): 首先,該框架使用文本嵌入模型將用戶請求轉換成高維向量,捕捉其深層語義信息。
      2. 聚類 (Clustering): 接著,該框架將這些語義向量進行聚類,將相似的問題或任務歸為一個團簇。這使得系統能夠理解不同類型任務的共性,例如“物理知識問答”、“網頁制作代碼生成”等。
      3. 評分(Scoring): 該框架會預先在每個聚類所得到的團簇(即每類任務)上評估模型池中所有模型的性能和成本。基于一個可調節的性能-成本權衡參數α,系統為每個模型在個團簇上計算一個性能-成本綜合評分。

      推理時,Avengers-Pro框架會首先將其歸類到最相關的聚類中,并結合各模型在該聚類上的性能-成本綜合評分,將請求動態分配給得分最高的模型。

      通過調整參數α(范圍在0到1之間),系統可以在追求極致性能(α=1)與極致性價比(α=0)之間靈活切換,滿足不同應用場景下對性能與成本的多樣化需求。

      實驗表現:Avengers-Pro比GPT-5更強,更便宜

      在實驗中,Avengers-Pro集成了來自4個廠家的8個業界頂尖模型:

      1. OpenAI:GPT-5-chat, GPT-5-medium;
      2. Anthropic:Claude-4.1-opus, Claude-4-sonnet;
      3. Google:Gemini-2.5-pro, Gemini-2.5-flash;
      4. 阿里: Qwen3-235B-A22B-thinking-2507, Qwen3-235B-A22B-2507。

      評測場景由6個極具挑戰性的數據集組成: GPQA-Diamond, Human’s Last Exam, ARC-AGI, SimpleQA, LiveCodeBench, τ2-bench,覆蓋了代碼生成、科學推理、智能體應用等。

      Avengers-Pro的整體性能優于任意單一模型。當權衡系數傾向于追求性能時,Avengers-Pro的平均正確率為0.66。

      相比之下,模型池中最強的單一模型GPT-5-medium的平均正確率為0.62。也就是說,Avengers-Pro即使與當前性能最強的單模型對比,仍然實現了7%的性能提升。

      Avengers-Pro實現了性能-成本平衡,形成了帕累托前沿。通過靈活調整性能-成本權衡系數,當Avengers-Pro與GPT-5-medium性能持平時,能夠節省高達27%的成本。

      如果僅需達到GPT-5-medium 90%的性能,成本更是可降至僅37%。

      而在追求與Gemini-2.5-Pro相當的性能時,Avengers-Pro甚至只需19%的超低成本即可實現。

      并且,Avengers-Pro在任何給定的成本水平上,都能提供最高的準確率;反之,對于任何給定的準確率目標,都能將成本控制在最低。



      性能-成本權衡系數的影響:

      對性能-成本平衡系數的分析顯示,隨著系數從0逐漸提升到1(追求性能),模型的性能和成本均逐步上升。



      模型選擇:

      在不同的性能-成本權衡系數下,Avengers-Pro能夠根據不同模型的性能成本靈活進行任務分配。

      當系數更傾向于成本時,Qwen族的模型由于其較低的成本會被更多選擇。

      而當系數更傾向于性能時,GPT-5-medium這一性能相對較強的模型會被更多選擇。

      在集成了多個大模型后,調度路由能實現大模型的降本增效:在性能上超越了模型池中最強的單一模型,并且在保證相同性能的情況下,能顯著降低成本。

      此外,面對不同的性能與成本權衡需求,可針對不同任務,靈活自動選擇最合適的模型,全面滿足多樣化的應用場景。

      Avergers-Pro證明了在當前大模型生態下,智能調度路由方案的突出表現和巨大潛力。

      智能路由理念也將在未來大模型應用中帶來更多突破與驚喜。

      論文地址:https://arxiv.org/abs/2508.12631
      GitHub地址:https://github.com/ZhangYiqun018/AvengersPro

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      朱元璋御審貪官幼女,女孩卻指著龍椅問了一句,滿朝文武瞬間死寂

      朱元璋御審貪官幼女,女孩卻指著龍椅問了一句,滿朝文武瞬間死寂

      凱裕說故事
      2025-10-28 11:34:31
      超60人報名競選國足主帥,半數來自西班牙,10人進面試僅3名中方教練

      超60人報名競選國足主帥,半數來自西班牙,10人進面試僅3名中方教練

      齊魯壹點
      2025-11-05 21:03:18
      利潤暴降45%,“非洲手機之王”為何突然不“香”了?

      利潤暴降45%,“非洲手機之王”為何突然不“香”了?

      鳳凰網財經
      2025-11-05 09:42:39
      歐冠狂歡夜:拜仁2-1贏巴黎登頂 利物浦送皇馬首敗 阿森納10連勝

      歐冠狂歡夜:拜仁2-1贏巴黎登頂 利物浦送皇馬首敗 阿森納10連勝

      侃球熊弟
      2025-11-05 05:09:46
      42歲《驚天魔盜團》男星杰西·艾森伯格,無償捐腎給陌生人!

      42歲《驚天魔盜團》男星杰西·艾森伯格,無償捐腎給陌生人!

      ChicMyGeek
      2025-11-05 18:54:05
      痛心!38歲江蘇美女教師梁嬌去世,丈夫去世不到百天,女兒才7歲

      痛心!38歲江蘇美女教師梁嬌去世,丈夫去世不到百天,女兒才7歲

      云舟史策
      2025-06-23 09:35:09
      天吶!鞏俐這身材太驚艷了,胸圍幾乎到肚臍,狀態卻依舊十分亮眼

      天吶!鞏俐這身材太驚艷了,胸圍幾乎到肚臍,狀態卻依舊十分亮眼

      TVB的四小花
      2025-10-22 02:25:03
      馬斯克預言:5年后不再有手機和App,AI將在1-2年內大規模取代編程和內容創作類工作【附人工智能行業市場分析】

      馬斯克預言:5年后不再有手機和App,AI將在1-2年內大規模取代編程和內容創作類工作【附人工智能行業市場分析】

      前瞻網
      2025-11-04 15:15:19
      坑慘全家!沈伯洋搞臺獨,兒子求學被拒生意要黃

      坑慘全家!沈伯洋搞臺獨,兒子求學被拒生意要黃

      易昂楊
      2025-11-05 15:42:25
      山姆APP已將商品頭圖改為實拍圖

      山姆APP已將商品頭圖改為實拍圖

      大象新聞
      2025-11-04 18:48:02
      完了完了!突然一級拉傷!這可是NBA大年狀元郎

      完了完了!突然一級拉傷!這可是NBA大年狀元郎

      籃球實戰寶典
      2025-11-05 20:24:28
      蘋果因忘記禁用一個關鍵設置,新版App Store前端代碼被完整扒下

      蘋果因忘記禁用一個關鍵設置,新版App Store前端代碼被完整扒下

      IT之家
      2025-11-05 08:21:08
      吳京《鏢人》官宣,謝霆鋒李連杰甘愿作配,票房能否破50億?

      吳京《鏢人》官宣,謝霆鋒李連杰甘愿作配,票房能否破50億?

      娛樂圈筆娛君
      2025-11-05 14:27:27
      憤怒的川普

      憤怒的川普

      西樓飲月
      2025-11-05 19:14:33
      這位護理師的身材讓人無法抵擋,竟是超辣的桃里れあ!

      這位護理師的身材讓人無法抵擋,竟是超辣的桃里れあ!

      大為看點丶
      2025-11-05 17:20:08
      貂皮大衣水洗退貨后續:店主驅車300公里,買家身份流出 警方回應

      貂皮大衣水洗退貨后續:店主驅車300公里,買家身份流出 警方回應

      不寫散文詩
      2025-11-05 17:35:10
      樓市大跌30%后,銀行擠滿了瘋狂換日元的香港人

      樓市大跌30%后,銀行擠滿了瘋狂換日元的香港人

      掘金日本房產
      2025-11-04 19:28:57
      狂送7連敗!聯盟唯一全敗隊伍,一手好牌打稀爛,還不如趁早散伙

      狂送7連敗!聯盟唯一全敗隊伍,一手好牌打稀爛,還不如趁早散伙

      陌識
      2025-11-06 00:37:43
      記者:當初是佩普要國足跟越南打對攻,還開小會不讓陳洋參加

      記者:當初是佩普要國足跟越南打對攻,還開小會不讓陳洋參加

      懂球帝
      2025-11-05 14:43:13
      醫生警告:一旦吃上他汀藥,這6種食物必須戒掉,再吃有肝損風險

      醫生警告:一旦吃上他汀藥,這6種食物必須戒掉,再吃有肝損風險

      朗威游戲說
      2025-11-05 14:24:47
      2025-11-06 03:48:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11633文章數 176326關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      俄士兵連遭烏軍7架無人機襲擊奇跡生還 視頻披露

      頭條要聞

      俄士兵連遭烏軍7架無人機襲擊奇跡生還 視頻披露

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      事關加快建設金融強國 中央金融辦發聲

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      房產
      數碼
      本地
      公開課
      軍事航空

      房產要聞

      最新!海南樓市10月熱銷榜單出爐!

      數碼要聞

      小米POCO X1平板現身Geekbench 搭載驍龍7+ Gen 3

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美國“福特”號航母駛往加勒比海

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 免费无码午夜理论电影| 97欧美精品系列一区二区| 人妻人人做人碰人人添| 久久伊99综合婷婷久久伊| 国产精品熟女一区二区三区| 国产男女猛烈无遮挡免费视频网站| 国产精品亚洲а∨天堂2021| 老王亚洲AV综合在线观看| 宣化县| 美女黄网站人色视频免费国产| 2020国产欧洲精品网站| 日韩精品有码中文字幕| 国产在线精品一区二区三区| 人妻无码久久久久久久久久久| 亚洲国产精品日韩专区av| 亚洲 制服 丝袜 无码 | 国产69精品久久久久人妻刘玥| 成av人电影在线观看| 国产成人永久免费av在线| 97久久人人超碰国产精品| 色悠久久网国产精品99| 偷自拍另类亚洲清纯唯美| 成年女人免费视频播放体验区 | 国产老熟女无套内射不卡| 熟妇激情一区二区三区| 欧美最猛性xxxxx大叫| 精品熟女少妇免费久久| 产综合无码一区| 2020国产成人精品视频| gogogo高清在线观看视频中文| 国产资源精品中文字幕| 在线看av一区二区三区| 蜜臀av黑人亚洲精品| 亚洲精品一区二区18禁| 国产偷国产偷亚洲清高| 免费 黄 色 人成 视频 在 线| 精品午夜福利无人区乱码| 国产特级毛片aaaaaa毛片| 亚洲精品成人综合色在线| 国产乱人激情H在线观看| 99在线视频免费观看|