![]()
機(jī)器之心報道
編輯:澤南、楊文
外國開發(fā)者:我們該開始學(xué)習(xí)中文了嗎?
繃不住了,美國科技公司最新發(fā)布的大模型,思考時怎么一直在說中文?
![]()
本周,知名 AI 代碼工具 Cursor 發(fā)布了 2.0 版重大更新,推出了首個自家的代碼模型 Composer,以及用于并行協(xié)作多個智能體的新界面。
新模型一發(fā)布,大家在祝賀 Cursor 終于「揚(yáng)眉吐氣」、用上自家模型的同時,也發(fā)現(xiàn)這個大模型在思考的時候一直講中文,而且行為和國產(chǎn)模型極其相似
Composer 是 Cursor 使用強(qiáng)化學(xué)習(xí)訓(xùn)練的一個大型 MoE 模型,能夠出色地處理實(shí)際代碼,并且速度非常快。
![]()
內(nèi)部基準(zhǔn)測試中該模型在編碼任務(wù)上達(dá)到行業(yè)前沿水準(zhǔn),生成速度比同類模型快四倍
![]()
據(jù)官方博客介紹,在研發(fā)過程中,他們試驗(yàn)了一個代號為 Cheetah 的原型智能體模型,以更好地理解更高速智能體模型的影響。Composer 是該模型的更智能升級版,憑借足夠的速度支撐交互式體驗(yàn),讓編碼始終絲滑。
不過在看到模型輸出了這么多中文之后,人們紛紛開始猜測它背后的「基礎(chǔ)」是哪家大模型,難道是 Qwen Code?
![]()
無獨(dú)有偶。
AI 編程獨(dú)角獸 Cognition 近期也推出了他們最新 AI 模型 SWE-1.5。這是一款快速智能體模型,參數(shù)量達(dá)到了數(shù)千億,在編碼性能上接近 SOTA,并顯著提升了速度—— 比 Haiku 4.5 快 6 倍,比 Sonnet 4.5 快 13 倍。
![]()
目前該模型已在他們的 IDE 平臺 Windsurf 上開放使用。
![]()
不過,模型發(fā)布出來之后很快就被人們仔細(xì)分析了一通,有網(wǎng)友認(rèn)為 Cognition 的新模型背后也是基于中國的 AI 模型進(jìn)行開發(fā)和改進(jìn)的。
有人對 SWE 1.5 進(jìn)行了大模型「越獄」,結(jié)果模型直接回答自己是智譜 AI 開發(fā)的 GLM 大模型。
![]()
智譜的官推也來轉(zhuǎn)推祝賀。
![]()
業(yè)界大佬:證據(jù)指向中國開源模型
X 博主 @deedydas 認(rèn)為,Cognition 的 SWE-1.5 是基于中國公司智譜的 GLM 4.6 模型進(jìn)行定制(精調(diào) / 強(qiáng)化學(xué)習(xí)),并運(yùn)行在 Cerebras 的硬件上;Cursor 的 Composer 模型也帶有中國式推理痕跡。
![]()
最新消息,cerebras 發(fā)郵件官宣,11 月 5 日推出 zai-glm-4.6 作為新編碼模型,這是給實(shí)錘了?
系統(tǒng)架構(gòu)師 Daniel Jeffries 也發(fā)帖表示,有很多證據(jù)表明 WindSurf 和 Cursor 這些新模型都是經(jīng)過微調(diào),而不是從零開始訓(xùn)練的,這對于開源社區(qū)來說是一個勝利。
Jeffries 進(jìn)一步指出,從頭開始訓(xùn)練一個基礎(chǔ)模型的成本極其高昂,許多資金和計算資源更雄厚的公司都未能成功。因此,WindSurf 和 Cursor 團(tuán)隊(duì)選擇在后期訓(xùn)練階段投資強(qiáng)化學(xué)習(xí)是非常合邏輯的,尤其是他們已經(jīng)擁有強(qiáng)大的數(shù)據(jù)集和大量用戶編碼數(shù)據(jù),這些數(shù)據(jù)更容易進(jìn)行處理。
![]()
他還認(rèn)為,Cursor 和 WindSurf 的團(tuán)隊(duì)并沒有足夠的資金來建設(shè)一個龐大的訓(xùn)練集群,也沒有足夠的數(shù)據(jù)和團(tuán)隊(duì)支持從零開始建立一個大模型。在當(dāng)前,許多大型實(shí)驗(yàn)室已經(jīng)在這一領(lǐng)域建立了強(qiáng)大的規(guī)模,單靠獨(dú)立開發(fā)是無法成功的。
![]()
此外,他還指出,一些反對開源的公司和個人阻礙了開源模型的發(fā)展,影響了現(xiàn)代軟件開發(fā)和創(chuàng)新的進(jìn)程。他呼吁美國公司意識到開源的重要性,回歸開源理念,而不是發(fā)布功能受限的專有模型。
![]()
目前,Jeffries 發(fā)布的這篇帖子已被 LeCun 轉(zhuǎn)發(fā),進(jìn)一步引發(fā)了討論。
網(wǎng)友們紛紛表示,中國的開源基礎(chǔ)模型已經(jīng)具備了足夠的能力來支持西方產(chǎn)品的開發(fā),這意味著全球 AI 正進(jìn)入多極化競爭的新格局。
![]()
有網(wǎng)友幽默評論道:是不是該開始學(xué)中文了?
![]()
國產(chǎn)開源模型,已成為 AI 領(lǐng)域主流
10 月 29 日,英偉達(dá) CEO 黃仁勛在華盛頓的 GTC 大會上,除了發(fā)布新 GPU,也說了一番對目前 AI 行業(yè)現(xiàn)狀的觀察。他表示開源模型已變得非常強(qiáng)大,大大加速了 AI 應(yīng)用的進(jìn)程,開發(fā)者、研究者、全球的公司都需要開源。
在老黃展示的全球開源模型的下載及采用情況圖中可以看到,2025 年以來,阿里的通義千問模型(Qwen)已占據(jù)開源模型的大部分市場份額,并且領(lǐng)先優(yōu)勢還在持續(xù)擴(kuò)大中,衍生模型數(shù)量也是全球第一

隨著開源模型的推理能力、多模態(tài)能力、專業(yè)領(lǐng)域能力的提升,它們不僅僅在幫助開發(fā)者,甚至已成為初創(chuàng)公司的命脈。或許對于 Cursor 和 Cognition 來說就是這樣。
除此之外,在 AI 社區(qū) HuggingFace 的趨勢榜上,排行前列的模型都出自國內(nèi)公司,有 MiniMax、DeepSeek、Kimi、百度、混元、千問,還有美團(tuán)的 LongCat。
![]()
在第三方的基準(zhǔn)平臺 ArtificialAnalysis 上比較和分析模型質(zhì)量、性能、推理速度、上下文窗口、參數(shù)數(shù)量和許可詳情等性能指標(biāo),排行前列的也大多數(shù)是國產(chǎn)模型
![]()
看起來不論是在模型技術(shù)水平與能力,還是全球開發(fā)者、科技公司的接受度上,國內(nèi)開源大模型都已經(jīng)確立了領(lǐng)先的地位,正在改變著全球 AI 領(lǐng)域的競爭格局。
這場大模型技術(shù)競賽中,追趕者和領(lǐng)先者的身位,正在慢慢發(fā)生變化。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.