<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      我MiniMax,用實習生處理數據,照樣屠榜開源大模型

      0
      分享至

      • 克雷西 發自 凹非寺
        量子位 | 公眾號 QbitAI

      屠榜開源大模型的MiniMax M2是怎樣煉成的?

      為啥M1用了Linear Attention,到了M2又換成更傳統的Full Attention了?

      現在的大模型社區,可謂是被M2的橫空出世搞得好不熱鬧。

      面對現實任務,M2表現得非??复?,在香港大學的AI-Trader模擬A股大賽中拿下了第一名,20天用10萬本金賺了將近三千元。



      而之所以能夠站在聚光燈下,還有一個原因是M2身上著實有不少奇招。

      除了注意力機制“回歸傳統”,M2在數據處理、思考模式上也是另辟蹊徑,給開源社區帶來了不一樣的技術路徑。

      而且MiniMax還公開了這些招數背后的“棋譜”,接連發布三篇技術博客,將M2的技術細節娓娓道來。

      博客一發布,本已討論得熱火朝天的大模型社區變得更熱鬧了,不乏有大佬給出自己的分析。

      其中也包括質疑的聲音,比如Thinking Machine Lab技術人員Songlin Yang就表示——

      MiniMax團隊敢于揭露Linear Attention的不足這點值得肯定,但他們的測試有問題,低估了Linear Attention的實力。



      實際上,注意力機制的選擇,也確實是M2相關問題當中最熱門的一個。

      M2團隊選擇的理由究竟是什么?三篇技術報告揭開了哪些秘密?

      快搬起小板凳,我們一點點往下看。

      5202年了,還有人用Full Attention?

      就從網友們最好奇的Full Attention機制開始說起。

      畢竟現在算力十分稀缺,MiniMax卻沒有選擇更省算力的Linear和Hybrid等機制。

      加上M2的上一代M1用的就是Linear Attention,這次卻換了方案,更是給這個選擇添上了幾分神秘色彩。

      這個問題看似復雜,但MiniMax的理由卻非常簡單有力——試出來的。

      M2團隊希望構建的是一個真正可用于商業部署的通用模型,所以穩定性和可靠性就成了優先考量。

      一開始,他們確實也試了Efficient Attention,結果發現,用了這些機制之后的模型,雖然在小任務上表現尚可,但隨著上下文長度的拉長,性能就大幅下降了。

      一番折騰之后,團隊最終決定放棄Efficient路徑,轉而回歸穩定可靠的Full Attention。

      而且團隊試過的路比想象中多得多,Blog下方有網友追問,是否嘗試更多的Linear Attention變體,比如GDN或Mamba2。



      而團隊成員表示,這些方法也都嘗試過,但結果只有一個——這些方法的實際表現都不及Full Attention。



      也就是說,Efficient Attention看似是命運的饋贈,實際上早已在暗中標好了價格。

      M2的當頭一棒,讓人們開始意識到,所謂的“免費午餐”根本就不存在。

      比如這位網友過去就認為,Lightning Attention與Full Attention混合起來效果和純Full Attention是一樣的,但他現在發現,對于復雜任務而言根本不是這么回事。



      不過MiniMax也并沒有把其他Attention一棒子打死,M2團隊探討了這些Attention未來的改進方向。

      但問題不是出在Attention本身,而是人們缺乏有效的評估系統。

      M2團隊指出,現在的模型評測系統不完善,很多常用榜單根本拉不開差距,造成了Efficient Attention表現能與Full Attention持平的假象。

      可只要一遇到多跳推理或長鏈邏輯過程這種高端局,Efficient Attention就立馬現原形。

      推理基礎設施也需要進一步提升——如何將理論計算復雜度優勢轉化為應用層面的速度和價格優勢,是目前業界仍在攻克的方向。

      總之,要想轉化為實際生產力,需要提前構建更豐富的長文數據、更完善的評測體系、更貼近部署場景的實驗范式,以及更穩定的訓練與推理基建。

      但隨著Context Length越來越長,尤其是在Pretrain和Posttrain階段都面臨長上下文挑戰的背景下,未來某個階段GPU的增長速度可能趕不上數據長度增長帶來的壓力,那時Linear或Sparse結構的優勢將會逐漸釋放。

      想讓模型做好推理,還得從數據開始

      現在骨架(模型)搭好了,該往里面填肉(數據)了,有意思的是,這件事,M2團隊雇了一幫實習生來干,還把這個細節寫到了博客里。

      網友看了就很納悶,直言自己get不到M2團隊強調這個細節的目的。



      面對這樣犀利的提問,作者也是絲毫不賣關子。

      之所以強調實習生呢,是想反襯出M2用的數據處理流程非常成熟,成熟到讓沒有經驗的人來操作,一樣可以達到預期效果。



      說到底,M2團隊是咋處理數據的?咱們接著往下看。

      他們希望模型能夠具有更強的泛化能力,也就是能夠適應更多的任務類型。

      確定了這個目標之后,篩選數據的標準自然也就有了。

      M2團隊把數據質量的衡量標準拆解成了思維鏈(CoT)和Response這兩個關鍵維度。

      CoT部分的標準很容易理解,邏輯完整、表述簡潔,就是優質數據,符合我們的常識。

      Response部分就更能體現M2團隊的巧思了。

      前面說過,團隊的目的是想讓模型適應更多場景,而在他們看來,Response數據,剛好就是癥結所在——

      過去的Response數據,對榜單格式的依賴已經達到過擬合了,導致換個環境就秒變戰五渣。

      所以,M2在數據合成時刻意引入了格式多樣性。

      當然只靠形式是不夠的,數據內容本身,也要盡可能多地涉獵不同領域的任務。

      好的數據要廣泛吸納,不好的數據則要及時剔除——

      M2團隊發現,模型表現出的所有問題,包括幻覺、指令未遵循等等,幾乎都能從數據上找到根源。

      所以在處理數據時,他們專門整理了一批典型的bad case,基于規則和大模型判斷,構建了數據清洗流程,從而消滅這些“壞數據”。

      數據范圍更加廣泛,質量也有了保障之后,接下來的事,就是擴大數據規模了。

      交叉思考,讓模型不再“高分低能”

      在M2團隊的實踐過程中,有一個“高分低能”的問題貫穿始終——模型一考試成績都很高,但到了真實場景就被虐得渣也不剩。

      這個問題在Agent場景中也是如此,甚至同一個模型,在不同的Agent系統里體驗差異也會非常大。

      問題出在了哪里呢?M2團隊對Agent執行任務的流程進行了拆解。

      Agent在執行任務時,會分析用戶的意圖,然后做出任務規劃,之后付諸執行,中間過程還會涉及外部工具的調用。

      在傳統的模型當中,Agent會在規劃階段進行思考,但到了執行環節,就變成了既沒有思維也沒有感情的機器。

      但實際工作并不是能夠完全依照原始規劃進行的,如果不根據執行過程中遇到的實際情況對規劃進行調整,那便是刻舟求劍,任務做不好就不是什么怪事了。

      而要想根據每步的執行結果進行動態調整,就需要把原先只在開頭進行的思考過程,復制到每一個關鍵節點。

      所以,M2團隊提出了“Interleaved Thinking”(交錯式思維鏈)的策略。

      這種策略讓思考在顯式推理與工具調用之間交替進行,并把推理結果持續帶入后續步驟,這樣一來原本冗長、重度依賴工具的任務,就變成了穩定的“計劃→行動→反思”循環。

      Interleaved Thinking保持了思維鏈的連貫性,使其在多輪交互中不斷累積,更加接近人類的任務執行方式,也減少了狀態漂移與重復性錯誤的產生。

      實際應用當中效果也是立竿見影,不僅提升了模型在長鏈任務中的容錯率,也顯著增強了對環境擾動的適應能力。

      除了新的思考模式,泛化也是M2團隊自始至終在強調的一個關鍵指標。

      他們發現,即便模型的工具調用能力得到大幅提升,但只要換個框架,模型依然容易失控。

      怎么辦呢?簡單說,菜就多練——M2團隊選擇從訓練數據下手。

      他們設計了一整套覆蓋全軌跡擾動的數據鏈路,在構建訓練樣本時,他們不僅模擬了工具本身的變化,還覆蓋了系統提示語、環境參數變化、用戶反復提問、工具返回異常等多種情況。

      看上去指標很復雜,但簡單概括就是,讓這些訓練數據盡可能多地去模擬真實使用場景,在訓練中就學會如何在不確定性中完成任務。

      能實現落地,才是好選擇

      回看M2的結構選擇,MiniMax并不是為了“回歸傳統”而選擇Full Attention。

      相反,在Efficient Attention廣受追捧的當下,堅持使用Full Attention恰恰體現了團隊更偏工程理性的判斷——優先考慮模型在真實任務中的穩定性與可用性,而非盲目追求資源的節省。

      這并非首次類似決策,例如早在MoE架構尚未成為行業主流前,MiniMax就已投入探索,并取得階段性成果。

      彼時,選擇MoE的廠商寥寥,MiniMax卻憑借自身理解做出了不同判斷,并最終驗證了可行性。

      可以看出,MiniMax不僅擁有深刻的技術洞察,更突出以實用性為導向,在M2上,這種思路也表現得尤為明確——

      它不是一個為參數堆疊而生的“炫技模型”,而是為開發者準備的落地工具,強調解釋邏輯、兼顧系統性,并不斷通過社區反饋與真實使用場景持續迭代。

      在今天這個“結構百花齊放”的階段,MiniMax展示的,不只是模型能力本身,更是一套面向復雜現實問題的思考方式。

      比起搶占某個風口,擁有一套穩定可用、被理解并認可的工程體系,也許更具意義。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      手機狀態欄變“廣告位”?網友炸鍋,運營商回應情況屬實

      手機狀態欄變“廣告位”?網友炸鍋,運營商回應情況屬實

      雷科技
      2025-11-05 16:49:49
      事業單位最閑的崗位是啥?網友:氣象局的人看到這個真是笑了

      事業單位最閑的崗位是啥?網友:氣象局的人看到這個真是笑了

      解讀熱點事件
      2025-10-08 00:20:03
      所有人不許吃肉?準大一素食女生發文求助,網友:誰做她室友誰倒霉

      所有人不許吃肉?準大一素食女生發文求助,網友:誰做她室友誰倒霉

      趣筆談
      2025-08-18 15:51:25
      79年調整領導班子,陳云提議讓汪東興退位,汪回復8個字擲地有聲

      79年調整領導班子,陳云提議讓汪東興退位,汪回復8個字擲地有聲

      大運河時空
      2025-10-23 17:46:21
      定檔開播!今晚到8號將播5部王炸大劇,眾星云集,你想追哪部?

      定檔開播!今晚到8號將播5部王炸大劇,眾星云集,你想追哪部?

      失寵的小野豬
      2025-11-06 14:01:25
      穆帥:我對結果極度失望,但對球隊的成長和整體表現非常滿意

      穆帥:我對結果極度失望,但對球隊的成長和整體表現非常滿意

      懂球帝
      2025-11-06 07:00:09
      貝克漢姆授爵后全家餐廳慶功,維多利亞優雅領銜、小七顯成熟韻味

      貝克漢姆授爵后全家餐廳慶功,維多利亞優雅領銜、小七顯成熟韻味

      述家娛記
      2025-11-06 10:17:41
      吳婉芳受寵30年,與霍啟剛結緣,育有子女

      吳婉芳受寵30年,與霍啟剛結緣,育有子女

      仙味少女心
      2025-11-05 19:02:03
      蔡孝乾叛變吳石暴露,李克農派出的潛臺小組,不辱使命絕境立功

      蔡孝乾叛變吳石暴露,李克農派出的潛臺小組,不辱使命絕境立功

      黑句本
      2025-11-03 10:45:13
      歐冠狂歡夜:曼城4-1多特 切爾西2-2+巴薩3-3 穆里尼奧開局4連敗

      歐冠狂歡夜:曼城4-1多特 切爾西2-2+巴薩3-3 穆里尼奧開局4連敗

      侃球熊弟
      2025-11-06 05:06:12
      普京下死命令,他明白:中俄關系再好,他也必須為俄羅斯未來考慮

      普京下死命令,他明白:中俄關系再好,他也必須為俄羅斯未來考慮

      動漫里的童話
      2025-11-06 14:08:28
      風向變了?央視公開點名趙麗穎,釋放3大信號,寧靜的話有人信了

      風向變了?央視公開點名趙麗穎,釋放3大信號,寧靜的話有人信了

      瓜汁橘長Dr
      2025-11-06 15:31:50
      身患重病?特朗普突然入院做核磁,美國政壇震動:萬斯與魯比奧接班機會浮現?

      身患重病?特朗普突然入院做核磁,美國政壇震動:萬斯與魯比奧接班機會浮現?

      阿天愛旅行
      2025-11-06 10:44:03
      斯諾克賽程:趙心童PK塞爾比,半決賽或迎中國德比,7冠王戰黑馬

      斯諾克賽程:趙心童PK塞爾比,半決賽或迎中國德比,7冠王戰黑馬

      劉姚堯的文字城堡
      2025-11-06 08:03:26
      僅得11+4+5!請不要怪杜蘭特,申京賽后發出請求,阿門也把話挑明

      僅得11+4+5!請不要怪杜蘭特,申京賽后發出請求,阿門也把話挑明

      巴叔GO聊體育
      2025-11-06 15:34:10
      遲遲等不來中方簽字,特朗普政府準備再加稅,釜山峰會白談一場?

      遲遲等不來中方簽字,特朗普政府準備再加稅,釜山峰會白談一場?

      絕對軍評
      2025-11-06 15:42:36
      重慶134平米“兇宅”191萬元起拍,法院提醒屋內有人非正常死亡,公司:尚無人預約看房

      重慶134平米“兇宅”191萬元起拍,法院提醒屋內有人非正常死亡,公司:尚無人預約看房

      極目新聞
      2025-11-06 11:10:57
      華為Mate 70 Air開售首日溢價300元

      華為Mate 70 Air開售首日溢價300元

      界面新聞
      2025-11-06 13:00:13
      24歲時迪巴拉身價高達1.1億!但如今僅剩800萬,原因真的太扎心!

      24歲時迪巴拉身價高達1.1億!但如今僅剩800萬,原因真的太扎心!

      田先生籃球
      2025-11-04 12:16:13
      停牌!603216,重大資產重組

      停牌!603216,重大資產重組

      中國基金報
      2025-11-06 07:47:43
      2025-11-06 17:11:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11634文章數 176326關注度
      往期回顧 全部

      科技要聞

      小鵬機器人里藏真人?何小鵬發一鏡到底視頻

      頭條要聞

      醫院副院長被指出軌眼科主任 湖南衛健委:兩人被停職

      頭條要聞

      醫院副院長被指出軌眼科主任 湖南衛健委:兩人被停職

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      “黑料纏身”的白百何 誰給她的勇氣?

      財經要聞

      南銀法巴加速發展背后:資金饑渴癥待解

      汽車要聞

      是我眼花了么?怎么大猩猩都來參加新車發布了?

      態度原創

      藝術
      旅游
      本地
      健康
      公開課

      藝術要聞

      預定年度十佳!49歲的舒淇,殺瘋了

      旅游要聞

      通訊|大埃及博物館將成為埃及旅游業升級的“催化劑”

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      超聲探頭會加重受傷情況嗎?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99久久亚洲综合精品成人| 一亚洲一区二区中文字幕| 国产精品亚洲综合色区丝瓜| 亚洲日本精品一区二区| 欧美国产精品不卡在线观看| 中文无码乱人伦中文视频在线| аⅴ天堂中文在线网| 亚洲色成人网站www永久下载| 最新精品国偷自产在线| 日本无遮挡真人祼交视频| 99精品人妻少妇一区| 久久精品中文字幕少妇| 萨迦县| 免费观看全黄做爰大片| 久久夜色精品国产亚洲av| 国产亚洲精品自在久久vr| 一区二区三区四区高清自拍| 久久香蕉国产线看观看亚洲片| 一 级做人爱全视频在线看| 亚洲熟妇无码另类久久久| 亚洲精品三区二区一区一| 国产中文字幕精品在线| 秋霞电影院午夜无码免费视频| 国产精品自拍视频免费看| 精品国内自产拍在线观看| 久久精品国产久精国产| 大伊香蕉在线精品视频75| 亚洲国产成人综合自在线| 亚洲国产欧美一区二区好看电影| 精品国产AV最大网站| 亚洲精品一区二区18禁| 国产精品一区中文字幕| 日韩精品在线观看一二区| 99RE8这里有精品热视频| 东京热一精品无码av| 亚洲国产一区二区三区| 8av国产精品爽爽ⅴa在线观看| 日韩伦理片| 亚洲人ⅴsaⅴ国产精品| 天天躁日日躁狠狠躁2018| 国产一区二区av天堂热|