Jay 發(fā)自 凹非寺量子位 | 公眾號 QbitAI
Cursor的首個(gè)編碼模型,剛剛發(fā)布了!
最新進(jìn)展,Cursor 2.0正式發(fā)布,并且首次搭載了「內(nèi)部」大模型。
沒錯(cuò),不是GPT、不是Claude,如今模型欄多了個(gè)新名字——Composer
實(shí)力相當(dāng)炸裂:
據(jù)官方說法,Composer僅需30秒就能完成復(fù)雜任務(wù),比同行快400%
基于模型升級,Cursor 2.0帶來了不少新玩意兒——
原生瀏覽器工具:模型可以自己動手測試代碼、調(diào)錯(cuò)、迭代,直到結(jié)果完全正確。
語音生成代碼:不用敲鍵盤,張嘴就行,直接把思路變成代碼。
全新界面邏輯:從「以文件為中心」切換為「以Agent為中心」,多個(gè)Agent可以同時(shí)運(yùn)行、互不干擾。
讓多個(gè)Agent同時(shí)嘗試同一問題并擇優(yōu)采用,能顯著提升最終結(jié)果。
![]()
太多了太多了,根本看不完。
400%效率飛躍
當(dāng)然,其他的都是小菜,最炸裂的依然是——Cursor居然有了自己的基座模型
要知道,以前的Cursor雖然火,但本質(zhì)上還只是套殼GPT或Claude,再厲害也不是Cursor的功勞。
而這次不一樣,Composer正式登場,Cursor終于能挺直腰板了。
難怪這回官網(wǎng)介紹語氣都硬氣了不少。(doge)
Cursor表示,這款模型是專為低延遲編碼打造的,可以在 30秒內(nèi)完成大多數(shù)交互任務(wù)。
即便面對體量龐大、結(jié)構(gòu)復(fù)雜的代碼庫,也能保持高水準(zhǔn)的推理與理解能力。
除了酷炫的Demo,當(dāng)然還要用Benchmark秀秀肌肉。
![]()
Composer的性能全部通過內(nèi)部測試套件 「Cursor Bench」 測得——這是一個(gè)根據(jù)真實(shí)開發(fā)者使用場景打造的評估系統(tǒng)。
該Benchmark不僅看代碼是否正確,還評估模型是否能遵守抽象層次、風(fēng)格規(guī)范和工程實(shí)踐。
結(jié)果顯示:Composer能以每秒250個(gè)tokens的速度生成代碼。
這速度比當(dāng)前最快的推理模型(GPT-5、Claude Sonnet 4.5)快約兩倍,比其其他模型更是快四倍。
速度快了,但腦子依然靈活,Composer顯著提高了推理能力和任務(wù)泛化能力,水準(zhǔn)可媲美中等前沿模型,
基于強(qiáng)化學(xué)習(xí)的MoE自研模型
這么驚艷的表現(xiàn),究竟是怎么煉成的?
Cursor研究科學(xué)家Sasha Rush透露了答案——關(guān)鍵在于強(qiáng)化學(xué)習(xí)。
- 我們用強(qiáng)化學(xué)習(xí)訓(xùn)練了一個(gè)大型MoE模型,讓它更貼近真實(shí)的編程任務(wù),而且速度也非常快。
![]()
同時(shí),為了和強(qiáng)化學(xué)習(xí)打配合,Cursor把自己在產(chǎn)品上的優(yōu)勢發(fā)揮到了極致。
- 和其他機(jī)器學(xué)習(xí)方法不同,強(qiáng)化學(xué)習(xí)幾乎無法從完整系統(tǒng)里抽象出太多內(nèi)容。所以我們讓Composer和Cursor一同設(shè)計(jì),確保它能在真實(shí)規(guī)模下順暢運(yùn)行。
![]()
強(qiáng)化學(xué)習(xí)最大的特點(diǎn)是:它得在真實(shí)環(huán)境里「干活」,才能學(xué)到真本事。
如果Composer只在虛擬數(shù)據(jù)集里改改代碼,它根本不知道這些代碼有沒有bug、測試能不能過。
所以,Cursor干脆讓模型直接進(jìn)「上戰(zhàn)場」。在完整的 Cursor 環(huán)境 中運(yùn)行、調(diào)用工具、執(zhí)行命令,通過一次次真實(shí)交互,拿到最有效的反饋信號。
具體來說,Composer的訓(xùn)練不是喂靜態(tài)數(shù)據(jù)集,而是基于真實(shí)的軟件工程任務(wù)完成的。
訓(xùn)練時(shí),模型直接在完整代碼庫里動手,用上整套生產(chǎn)級工具:文件編輯、語義搜索、終端命令……
面對復(fù)雜工程問題,它必須自己寫、自己測、自己修。
每一輪訓(xùn)練都對應(yīng)一個(gè)具體任務(wù),比如寫一段改動、擬一份方案,或者解釋某個(gè)代碼邏輯。
事實(shí)證明,強(qiáng)化學(xué)習(xí)確實(shí)讓Composer的表現(xiàn)上了一個(gè)臺階。
它學(xué)會了如何聰明地選工具、靈活地做并行處理,不再會一拍腦袋給用戶抽張廢卡。
隨著訓(xùn)練深入,模型甚至出現(xiàn)了涌現(xiàn)行為——能自動運(yùn)行單元測試、修復(fù)代碼格式錯(cuò)誤,甚至可以自主完成多步代碼搜索與調(diào)試流程。
而Cursor 2.0這次為多Agent協(xié)作提供的基礎(chǔ)架構(gòu),正式建立在Composer這些底層能力的基礎(chǔ)之上。
![]()
值得注意的是,這次Cursor帶來的不只是一個(gè)更快的模型,而是一個(gè)真正面向?qū)崙?zhàn)的AI系統(tǒng)。
相比一味去和那些頭部基座模型硬剛,Cursor這次更聰明地發(fā)揮了自己在應(yīng)用端的產(chǎn)品優(yōu)勢——
讓Composer直接在與用戶相同的環(huán)境中運(yùn)行,真正做到貼合開發(fā)者的日常工作流程。
Cursor,你真的是自研嗎?
話說回來,Composer的效果確實(shí)很驚艷,但Cursor似乎在故意回避一個(gè)問題——
強(qiáng)化學(xué)習(xí)沒問題,但模型底子你倒是說清楚啊。
- Composer的透明度缺失簡直離譜。他們提到用了強(qiáng)化學(xué)習(xí),但沒交代模型的其他訓(xùn)練過程——
到底是自己預(yù)訓(xùn)練的,還是拿現(xiàn)成模型改的?
在他們公開更多細(xì)節(jié)、或有人能獨(dú)立復(fù)現(xiàn)結(jié)果之前,我對這些說法都持保留態(tài)度。
![]()
Cursor研究員Sasha Rush這些天也一直在 Hacker News 上親自答疑,但對于「基礎(chǔ)模型來源」這個(gè)問題,她始終沒正面回應(yīng)。
當(dāng)被直接問到 「Composer是不是微調(diào)自某個(gè)開源模型?」 時(shí),Rush的回答是:
- 我們的主要關(guān)注點(diǎn)在于強(qiáng)化學(xué)習(xí)的后訓(xùn)練階段,我們認(rèn)為這是使模型成為強(qiáng)大的交互式智能體的最佳途徑。
不過可以確定的是,Cursor過去確實(shí)有自己的內(nèi)部模型。
據(jù)悉,Cheetah是Composer的早期原型,團(tuán)隊(duì)曾用它來測試生成速度與系統(tǒng)集成效果。
不過嘛,正式版Composer到底是基于Cheetah,還是從開源模型的骨架上改的……
還需要讓子彈再飛一會兒~
[1]https://news.ycombinator.com/item?id=45748725
[2]https://simonwillison.net/2025/Oct/29/cursor-composer/
[3]https://venturebeat.com/ai/vibe-coding-platform-cursor-releases-first-in-house-llm-composer-promising
[4]https://cursor.com/cn/blog/2-0
[5]https://x.com/srush_nlp/status/1983572683355725869
[6]https://x.com/cursor_ai/status/1983567619946147967
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.