網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

最新外國「自研」大模型，都是套殼國產(chǎn)？

外國想漲價就漲如今成功國產(chǎn)

2025-11-03 10:38:10　來源: 機(jī)器之心Pro

北京舉報

分享至

機(jī)器之心報道

編輯：澤南、楊文

外國開發(fā)者：我們該開始學(xué)習(xí)中文了嗎？

繃不住了，美國科技公司最新發(fā)布的大模型，思考時怎么一直在說中文？

本周，知名 AI 代碼工具 Cursor 發(fā)布了 2.0 版重大更新，推出了首個自家的代碼模型 Composer，以及用于并行協(xié)作多個智能體的新界面。

新模型一發(fā)布，大家在祝賀 Cursor 終于「揚(yáng)眉吐氣」、用上自家模型的同時，也發(fā)現(xiàn)這個大模型在思考的時候一直講中文，而且行為和國產(chǎn)模型極其相似

Composer 是 Cursor 使用強(qiáng)化學(xué)習(xí)訓(xùn)練的一個大型 MoE 模型，能夠出色地處理實(shí)際代碼，并且速度非常快。

內(nèi)部基準(zhǔn)測試中該模型在編碼任務(wù)上達(dá)到行業(yè)前沿水準(zhǔn)，生成速度比同類模型快四倍

據(jù)官方博客介紹，在研發(fā)過程中，他們試驗(yàn)了一個代號為 Cheetah 的原型智能體模型，以更好地理解更高速智能體模型的影響。Composer 是該模型的更智能升級版，憑借足夠的速度支撐交互式體驗(yàn)，讓編碼始終絲滑。

不過在看到模型輸出了這么多中文之后，人們紛紛開始猜測它背后的「基礎(chǔ)」是哪家大模型，難道是 Qwen Code？

無獨(dú)有偶。

AI 編程獨(dú)角獸 Cognition 近期也推出了他們最新 AI 模型 SWE-1.5。這是一款快速智能體模型，參數(shù)量達(dá)到了數(shù)千億，在編碼性能上接近 SOTA，并顯著提升了速度—— 比 Haiku 4.5 快 6 倍，比 Sonnet 4.5 快 13 倍。

目前該模型已在他們的 IDE 平臺 Windsurf 上開放使用。

不過，模型發(fā)布出來之后很快就被人們仔細(xì)分析了一通，有網(wǎng)友認(rèn)為 Cognition 的新模型背后也是基于中國的 AI 模型進(jìn)行開發(fā)和改進(jìn)的。

有人對 SWE 1.5 進(jìn)行了大模型「越獄」，結(jié)果模型直接回答自己是智譜 AI 開發(fā)的 GLM 大模型。

智譜的官推也來轉(zhuǎn)推祝賀。

業(yè)界大佬：證據(jù)指向中國開源模型

X 博主 @deedydas 認(rèn)為，Cognition 的 SWE-1.5 是基于中國公司智譜的 GLM 4.6 模型進(jìn)行定制（精調(diào) / 強(qiáng)化學(xué)習(xí)），并運(yùn)行在 Cerebras 的硬件上；Cursor 的 Composer 模型也帶有中國式推理痕跡。

最新消息，cerebras 發(fā)郵件官宣，11 月 5 日推出 zai-glm-4.6 作為新編碼模型，這是給實(shí)錘了？

系統(tǒng)架構(gòu)師 Daniel Jeffries 也發(fā)帖表示，有很多證據(jù)表明 WindSurf 和 Cursor 這些新模型都是經(jīng)過微調(diào)，而不是從零開始訓(xùn)練的，這對于開源社區(qū)來說是一個勝利。

Jeffries 進(jìn)一步指出，從頭開始訓(xùn)練一個基礎(chǔ)模型的成本極其高昂，許多資金和計算資源更雄厚的公司都未能成功。因此，WindSurf 和 Cursor 團(tuán)隊(duì)選擇在后期訓(xùn)練階段投資強(qiáng)化學(xué)習(xí)是非常合邏輯的，尤其是他們已經(jīng)擁有強(qiáng)大的數(shù)據(jù)集和大量用戶編碼數(shù)據(jù)，這些數(shù)據(jù)更容易進(jìn)行處理。

他還認(rèn)為，Cursor 和 WindSurf 的團(tuán)隊(duì)并沒有足夠的資金來建設(shè)一個龐大的訓(xùn)練集群，也沒有足夠的數(shù)據(jù)和團(tuán)隊(duì)支持從零開始建立一個大模型。在當(dāng)前，許多大型實(shí)驗(yàn)室已經(jīng)在這一領(lǐng)域建立了強(qiáng)大的規(guī)模，單靠獨(dú)立開發(fā)是無法成功的。

此外，他還指出，一些反對開源的公司和個人阻礙了開源模型的發(fā)展，影響了現(xiàn)代軟件開發(fā)和創(chuàng)新的進(jìn)程。他呼吁美國公司意識到開源的重要性，回歸開源理念，而不是發(fā)布功能受限的專有模型。

目前，Jeffries 發(fā)布的這篇帖子已被 LeCun 轉(zhuǎn)發(fā)，進(jìn)一步引發(fā)了討論。

網(wǎng)友們紛紛表示，中國的開源基礎(chǔ)模型已經(jīng)具備了足夠的能力來支持西方產(chǎn)品的開發(fā)，這意味著全球 AI 正進(jìn)入多極化競爭的新格局。

有網(wǎng)友幽默評論道：是不是該開始學(xué)中文了？

國產(chǎn)開源模型，已成為 AI 領(lǐng)域主流

10 月 29 日，英偉達(dá) CEO 黃仁勛在華盛頓的 GTC 大會上，除了發(fā)布新 GPU，也說了一番對目前 AI 行業(yè)現(xiàn)狀的觀察。他表示開源模型已變得非常強(qiáng)大，大大加速了 AI 應(yīng)用的進(jìn)程，開發(fā)者、研究者、全球的公司都需要開源。

在老黃展示的全球開源模型的下載及采用情況圖中可以看到，2025 年以來，阿里的通義千問模型（Qwen）已占據(jù)開源模型的大部分市場份額，并且領(lǐng)先優(yōu)勢還在持續(xù)擴(kuò)大中，衍生模型數(shù)量也是全球第一

隨著開源模型的推理能力、多模態(tài)能力、專業(yè)領(lǐng)域能力的提升，它們不僅僅在幫助開發(fā)者，甚至已成為初創(chuàng)公司的命脈。或許對于 Cursor 和 Cognition 來說就是這樣。

除此之外，在 AI 社區(qū) HuggingFace 的趨勢榜上，排行前列的模型都出自國內(nèi)公司，有 MiniMax、DeepSeek、Kimi、百度、混元、千問，還有美團(tuán)的 LongCat。

在第三方的基準(zhǔn)平臺 ArtificialAnalysis 上比較和分析模型質(zhì)量、性能、推理速度、上下文窗口、參數(shù)數(shù)量和許可詳情等性能指標(biāo)，排行前列的也大多數(shù)是國產(chǎn)模型

看起來不論是在模型技術(shù)水平與能力，還是全球開發(fā)者、科技公司的接受度上，國內(nèi)開源大模型都已經(jīng)確立了領(lǐng)先的地位，正在改變著全球 AI 領(lǐng)域的競爭格局。

這場大模型技術(shù)競賽中，追趕者和領(lǐng)先者的身位，正在慢慢發(fā)生變化。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.