![]()
還記得半年前 DeepSeek 橫空出世時的震撼嗎?那個用不到 OpenAI 1/20 的成本就訓練出頂級模型的"神話",不僅讓整個硅谷為之側目,更是給國內的 AI 創業公司上了生動的一課——原來,大模型可以這樣玩。
DeepSeek 沖擊波下的轉型之路
對于被稱為"AI 六小龍"的 MINIMAX 來說,DeepSeek 的出現無異于一記當頭棒喝。過去的劇本突然就講不下去了:瘋狂燒錢買算力,追著 OpenAI 的腳步跑,今天發個大模型,明天搞個視頻生成...看起來很忙,但總感覺在原地打轉。
投資人開始問:"既然 DeepSeek 能用這么少的錢做出這么好的效果,你們之前燒的那些錢都去哪了?"用戶開始問:"既然有免費的 DeepSeek,我為什么還要付費用你們的 API?"
但 MINIMAX 的反應出人意料地迅速和果斷。他們沒有選擇繼續講老故事,而是徹底換了劇本:從追逐熱點轉向硬核技術突破,從商業化優先轉向開源優先,從模仿 OpenAI 轉向對標 DeepSeek。
實際上,MiniMax 在今年 1 月份就推出了開源模型 Minimax-01,其中包括語言模型和視覺模型,但似乎反向平平。
半年的蟄伏與沉淀后,他們暫停了所有非核心項目,把最優秀的工程師都調到了一個神秘的項目上。
MiniMax-M1:半年磨一劍的技術突破
昨天,MINIMAX 終于交出了答卷——MiniMax-M1,他們宣稱這是世界上第一個開源的大規模混合架構的推理模型。這不是一個匆忙的應景之作,而是一次深思熟慮的技術革新。
![]()
突破一:Lightning Attention - 超長文本處理
M1 原生支持100 萬字符的超長文本處理,處理 10 萬字文本時只需要其他模型 25% 的計算資源。這意味著可以一次性分析整本小說或研究報告,而不需要拆分處理。
? 突破二:CISPO 算法 - 更聰明的學習方式
傳統訓練方法會忽略"不尋常"的學習過程,但 CISPO 算法不再丟棄任何"思考片段",充分利用每個思維火花。實驗顯示,這種方法比傳統方法快 2 倍,效果還更好。
突破三:超低成本訓練
僅用 53.74 萬美元就完成了整個強化訓練,相比 GPT-4 超過 1 億美元的成本,M1 幾乎是同等能力模型中最便宜的。這不是簡單的"省錢",而是技術效率的革命性提升。
需要說明的是,53.74 萬美元并非模型的全部訓練成本,而僅僅是強化學習階段的費用。MINIMAX 表示他們僅用 512 塊 H800 GPU 訓練了三周就完成了這一階段,這一效率比行業預期至少提升了一個數量級。
不過,與 DeepSeek 不同的是,MINIMAX 并未公布模型從預訓練到最終完成的完整訓練成本(不包括實驗費用)。因此,53.74 萬美元這個數字雖然令人印象深刻,但可能只是冰山一角。
實戰表現:數據說話的硬實力
經過半年的技術沉淀,MiniMax-M1 在各個關鍵領域的表現如何?我們用一張完整的對比表來看看它與頂級模型的真實差距:
![]()
雖然 M1 把訓練成本又下調了一個數量級,但在常見的指標測試中,這個模型并無一項能到最優。比較亮眼的是長文本能力,在 MRCR(128K) 測試中得分 73.4,僅次于 Gemini 2.5 Pro 的 76.8,在 LongBench-v2 中更是達到 61.5 的第二名成績,可見 Lightning Attention 確實非常有效。
值得一提的是,M1 有兩項指標超越了 DeepSeek R1,即數學方面的 AIME 2025(76.9 vs 70.0)以及編程能力方面的 LiveCodeBench(65.0 vs 55.9)。這表明 MINIMAX 在核心技術突破上確實有所建樹。
盡管綜合來看,這些指標并不算最亮眼,但作為第一款開源模型,在成本控制以及長文本處理方面有這么突出的創新,已經非常難能可貴了。
從跟隨者到引領者的華麗轉身
MINIMAX 的轉型反映了 AI 行業的變化趨勢。從追逐商業化到選擇開源路線,從高成本訓練到技術效率優化,這種策略調整與當前行業對成本控制和技術創新的重視相符。
開源模式正在 AI 領域獲得更多關注。DeepSeek 的成功為行業提供了新的發展思路,而 MiniMax-M1 的發布進一步驗證了這一方向的可行性。隨著更多公司選擇開源策略,行業競爭重心可能會從資本投入轉向技術創新。
從追逐者到開拓者,MINIMAX 用半年時間完成了一次完美的轉身。這一轉變表明"AI 六小龍"已經開始探索新的發展路徑。
算力泡沫破滅:一場正在發生的行業洗牌
從 1 億美金到 50 萬美金,訓練成本在短短的 1 年時間內的暴跌,正在引發整個算力市場的劇烈震蕩。這不僅僅是數字的變化,更是一場顛覆性的行業重構。
那些曾經瘋狂囤積算力的公司,如今面臨著尷尬的現實:昂貴的 GPU 集群突然變成了"負資產"。據業內消息,已有大批公司開始大量退卡,試圖減少損失。
而一些專門提供算力租賃服務的供應商,更是直接面臨破產危機——當客戶發現用更少的錢就能獲得更好的效果時,誰還會為過時的"算力迷信"買單?
這場技術革命告訴我們:真正的護城河從來不是資源的堆砌,而是效率的突破。 在 AI 的下半場,拼的不再是誰燒錢更多,而是誰的技術更聰明。
本文由「AI 范兒」出品
我每天都在更新,如果你覺得這些內容對你有用,
那我們就加個關注、交個朋友。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.