![]()
- 這是一場停不下來的豪賭。
Grok4真的很強
![]()
近期馬斯克發布了“世界上最強的AI模型”,有人直言道AGI在這里已經實現了。xAI 發布了兩個版本,分別是 Grok 4 和 Grok 4 Heavy。兩者都是推理模型,前者是單代理版本,Grok-4 Heavy 則是多代理版本,支持四個代理同時工作。
“Grok 4 是在所有學科里都達到研究生水平的,甚至比大多數 PhD 都強。”直播晚點 1 小時后,馬斯克首先給 Grok 最新一代的水平如此定位。
除了在 SAT、GRE 考試中取得近乎完美的成績,在「人類終極考試(HLE)」測試里,Grok 4 現在的得分比 Gemini 2.5 Pro、o3 都高,Grok 4 Heavy 版本更是突破了 40%。相比Kimi(以中文處理見長),Grok4的多語言支持更全面,尤其在英語和編碼混合任務中領先。Kimi雖快,但Grok4的深度思考能力讓它在科研場景中更可靠。
![]()
在編碼與軟件工程方面:SWE-Bench基準:Grok4約60%以上,高于GPT-4.5的54.6%、Gemini 2.5 Pro的類似分數。Claude 4雖達72.7%,但Grok4在代碼分析和bug修復上更高效,識別準確率達89%。與Kimi比較,Grok4的工具使用原生集成,讓它在編程自動化上更流暢,適合開發者。
xAI團隊在直播中透露,Grok 4的訓練量是Grok 2的100倍,在強化學習(RL)階段投入的算力,是市面上其他任何模型的10倍以上。發布會介紹,Grok 4 的訂閱費為 30 美元/月,更強大的Grok 4 Heavy 版本的費用為300 美元/月,Grok 3 維持免費開放。
馬斯克認為,Grok4的更新目標是“成為盡可能追求真相的AI”。 他還設想通過該模型與類人機器人結合,在今年年底或明年發現新技術,甚至新物理定律。“這讓人既興奮又緊張,我希望自己能活著見證它的誕生。”馬斯克說。
但是從目前體驗過的博主評價來看,評價也是非常兩極分化。有網友認為多代理投票當然準,只是又慢又燒錢。Grok 4 也并非無敵,它在圖像理解和生成上仍遜于 OpenAI、Anthropic 等對手。也有人認為目前階段AI貴才能好,像DeepseeK R1那樣在后續推廣之后可以實現,眼下最要緊的是推出更強的AI占領市場。
xAI大力出奇跡但維持不易
01 燒錢,馬斯克是專業的
過去有一個說法如果創業者沒有10億美元就不要參與大模型創業,過去國內外總有些創業者不服,但幾年下來我們看到“六小龍”的說法不再熱門,國外除了OpenAI就是大廠的模型。而現如今這一門檻已經被馬斯克最高拉到“月銷10億美元”。
上月外媒披露,因xAI研發尖端AI模型、構建數據中心及采購專用芯片,每月支出高達10億美元。財務預測顯示:2024年總支出預計達130億美元,營收僅5億美元;2026年營收或增至20億美元,但仍難覆蓋成本缺口。
![]()
xAI的財務需求主要源于其激進的硬件戰略。與依賴租賃算力的競爭對手不同,xAI堅持自建基礎設施。馬斯克甚至宣布計劃打造一臺配備100萬個英偉達Blackwell GPU的超級計算機,預計耗資50億至625億美元(約合人民幣4500億元),有望成為史上最昂貴的AI基礎設施項目。
有分析師認為,馬斯克正采取“燒錢換領先”的戰略,試圖通過大規模融資、硬件投資和快速迭代,在AI軍備競賽中超越OpenAI、Anthropic和Google DeepMind。然而,能否在資金耗盡前實現技術突破,仍是未知數。
硬件成本高企只是一方面,xAI在數據訓練方面也是與眾不同,采用了合成數據訓練這一辦法,先用AI生產數據,再用于模型訓練,其成本遠高于同行。其訓練數據集總量約 4 萬億 tokens,使用新 MinHash-GPU 管道去重,近似重復率 <1%。
合成數據雖好但也會出現幻覺過高,數據反復利用之后會出現“以訛傳訛”導致更大的錯誤。或許跟合成數據有關,現在Grok上面詢問很多問題的時候會優先考慮馬斯克的觀點。大量 X 用戶發布的實測結果也顯示確實存在這一傾向,比如在數據科學家 Jeremy Howard 發布的一段視頻中,Grok 在思維鏈中明確表示,正在考慮馬斯克的觀點。馬斯克誠然是一位頂尖牛人,但在這幾年也發表了不少“涉政爭議言論”,以至于出現了“抵制馬斯克”的活動。在大模型中過多偏向某一位人物顯然會給平臺帶來不小競爭問題。
此外,還有一點是為多數人所忽視的。xAI負擔有馬斯克收購推特時產生的一些銀行債務,年初xAI以全股票交易的方式收購了X(推特),對X的估值為330億美元。同時xAI也承擔了X之前的債務。
馬斯克一方面已經置換了部分銀行的高息債,一方面希望推過推高估值來緩解資金壓力。有媒體報道xAI即將啟動第三次大規模融資,目標估值直指2000億美元。
據悉,此次融資談判已進入初步階段,最快將于下月啟動。這將是xAI在不到兩個月內的第三次大規模融資:今年6月,通過二級股票發行籌集300億美元;7月,通過貸款和現金投資獲得100億美元資金。
當然從更大的層面來看,馬斯克眼中對標的是OpenAI,既然OpenAI都能估值3000億美元,那么xAI估值2000億美元是只低不高。更何況馬斯克一向認為xAI才是能實現真正AGI的企業,至于能值多少那就要看馬斯克的吆喝了。
02 長期領先異常困難
上半年大模型發展整體上在從“規模競賽”轉向“效率與場景深耕”,涌現出來了不少在架構創新。訓練效率、以及多模態能力方面具有突破性表現的模型。比如Claude4代碼生成能力領先行業,支持20萬token輸入,成為開發者首選。Gemini2.5Pro擁有業內最長處理能力最高支持200萬token上下文,當然還有DeepSeek R1在全世界旋起一陣旋風讓低成本和高質量成為可能。
相反今年2月份發布的Grok3剛開始也只是各種跑分“屠榜”,但最終留下來的印象卻只有大尺度的聊天內容,也并沒有如馬斯克所愿推動Grok用戶大幅增長。所以馬斯克需要整個大的,證明xAI不是明日黃花已經跟不上了。
馬斯克此前在X上頻頻為Grok模型預熱,但Grok 3.5模型最終跳票,一度引發對模型能力的懷疑。4 月底,馬斯克就在 X上預告,Grok 3.5Beta版下周將上線,主打專業問答能力,特別是工程、編程類問題。但直到5月中旬,馬斯克才出來回應稱,“還有點粗糙,再打磨一周。”馬斯克在6月27日再次提到Grok,表示在和xAI團隊通宵打磨模型,進展不錯,即將發布的模型被命名為Grok 4。也就是說馬斯克和團隊選擇跳過Grok 3.5,“端”出更高的迭代版本,針對模型跳票后外界的質疑,看起來是一個很好的挽救方案。
今年新發布的模型幾乎都是至少有一項或者多項跑分超過GPT模型的,這背后的道理也不難理解,那就是現如今的模型差異只有數量級沒有指數級。也就是說OpenAI的大模型雖然有先發優勢,但是其它幾家大模型也是各有所長,你追我趕,OpenAI的 ChatGPT大模型并沒有形成絕對的優勢。
馬化騰曾表示,AI技術和應用是條非常長的賽道,各個公司的競爭和發展更像是一場馬拉松,而非短跑。暫時的領先和落后都說明不了太多的問題。
![]()
馬斯克所謂的真正的完全體的AI或者AGI,更像是一種爭奪AI定義權的話術。微軟眼中的AGI是指能夠產生1000億美元以上的利潤,并對行業產生重塑性革命。馬斯克認為Grok 可能會在今年年底發現新的可用技術,明年發現新的物理學,可以深度參與特斯拉制造和擎天柱機器人的大腦設計。
但真正的AGI是什么尚有爭議,何談實現真正AGI?xAI的現狀有點像馬斯克過去所有創業的“復刻”版:前期瘋狂燒錢、瘋狂拉融資、大膽畫餅,然后看能否賭中未來。然而,在當今AI戰場,光有熱血和資金遠遠不夠,還得有真正過硬的產品和落地能力。
03 馬斯克打算怎么做
雖然此次Grok 4短暫領先了,但今年夏天OpenAI也將發布其最新旗艦模型GPT-5,這一領先優勢能保持多久并不確定。海外大廠對于AI模型也是勢在必得,微軟、亞馬遜、谷歌和Meta四大巨頭去年的總資本支出為2300億美元,2025年這些公司的投資計劃則高達3200億美元,在財報中管理層紛紛表示,計劃增加對AI技術和數據中心建設的投資。
那么就要考慮馬斯克的優勢是什么了,是有錢嗎?當然不是,幾家大廠也不遑多讓,馬斯克的優勢在于由特斯拉和X構建起來的商業帝國。上次收購X為xAI帶來兩大核心優勢:數據資源,X平臺的海量用戶帖子和機器人生成內容,可直接用于訓練Grok,省去高昂的外部數據采購成本;算力共享,X此前采購的AI芯片集群,現由xAI調配使用,進一步降低硬件投入。
![]()
xAI向投資者承諾,公司將于2027年實現盈利。摩根士丹利預測,其2029年收入或突破130億美元。若成真,xAI將比競爭對手OpenAI提前兩年邁入盈利階段——后者預計最早2029年才能實現正現金流。
不過,這一樂觀預測建立在多重假設之上:Grok快速普及并深度集成至X平臺;成功開拓企業級AI工具市場;與特斯拉的自動駕駛等業務協同落地。目前,xAI的營收幾乎全部依賴X Premium訂閱服務,2024年預期收入僅5億美元,遠不足以覆蓋運營成本。相比之下:OpenAI 2024年預計營收127億美元,ChatGPT用戶超1億,并深度嵌入微軟生態,而Grok活躍用戶只有兩千萬人;Anthropic等對手也在加速商業化。
寫在最后
馬斯克又像過去一樣開啟新一場豪賭,高杠桿、高風險、高回報。xAI如果按照基本面來分析那無疑是慘淡的,應該停止瘋狂燒錢,但誰讓它是馬斯克的xAI,關于未來的宏大構想似乎又可信了。
參考資料:
馬斯克發布“地球最強AI模型” 來源:CSDN
xAI每月狂燒10億美金? 來源:深網騰訊新聞
馬斯克曝光的Grok 4,學會了第一性原理 來源:極客公園
馬斯克新發布全球最強模型含金量如何 來源:第一財經
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.