網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Cursor發(fā)布首個(gè)編程大模型！代碼生成250tokens/秒，強(qiáng)化學(xué)習(xí)+MoE

2025-10-30 09:31:26　來源: 量子位

北京舉報(bào)

分享至

Jay 發(fā)自凹非寺量子位 | 公眾號 QbitAI

Cursor的首個(gè)編碼模型，剛剛發(fā)布了！

最新進(jìn)展，Cursor 2.0正式發(fā)布，并且首次搭載了「內(nèi)部」大模型。

沒錯(cuò)，不是GPT、不是Claude，如今模型欄多了個(gè)新名字——Composer

實(shí)力相當(dāng)炸裂：

據(jù)官方說法，Composer僅需30秒就能完成復(fù)雜任務(wù)，比同行快400%

基于模型升級，Cursor 2.0帶來了不少新玩意兒——

原生瀏覽器工具：模型可以自己動手測試代碼、調(diào)錯(cuò)、迭代，直到結(jié)果完全正確。

語音生成代碼：不用敲鍵盤，張嘴就行，直接把思路變成代碼。

全新界面邏輯：從「以文件為中心」切換為「以Agent為中心」，多個(gè)Agent可以同時(shí)運(yùn)行、互不干擾。

讓多個(gè)Agent同時(shí)嘗試同一問題并擇優(yōu)采用，能顯著提升最終結(jié)果。

太多了太多了，根本看不完。

400%效率飛躍

當(dāng)然，其他的都是小菜，最炸裂的依然是——Cursor居然有了自己的基座模型

要知道，以前的Cursor雖然火，但本質(zhì)上還只是套殼GPT或Claude，再厲害也不是Cursor的功勞。

而這次不一樣，Composer正式登場，Cursor終于能挺直腰板了。

難怪這回官網(wǎng)介紹語氣都硬氣了不少。（doge）

Cursor表示，這款模型是專為低延遲編碼打造的，可以在 30秒內(nèi)完成大多數(shù)交互任務(wù)。

即便面對體量龐大、結(jié)構(gòu)復(fù)雜的代碼庫，也能保持高水準(zhǔn)的推理與理解能力。

除了酷炫的Demo，當(dāng)然還要用Benchmark秀秀肌肉。

Composer的性能全部通過內(nèi)部測試套件「Cursor Bench」測得——這是一個(gè)根據(jù)真實(shí)開發(fā)者使用場景打造的評估系統(tǒng)。

該Benchmark不僅看代碼是否正確，還評估模型是否能遵守抽象層次、風(fēng)格規(guī)范和工程實(shí)踐。

結(jié)果顯示：Composer能以每秒250個(gè)tokens的速度生成代碼。

這速度比當(dāng)前最快的推理模型（GPT-5、Claude Sonnet 4.5）快約兩倍，比其其他模型更是快四倍。

速度快了，但腦子依然靈活，Composer顯著提高了推理能力和任務(wù)泛化能力，水準(zhǔn)可媲美中等前沿模型，

基于強(qiáng)化學(xué)習(xí)的MoE自研模型

這么驚艷的表現(xiàn)，究竟是怎么煉成的？

Cursor研究科學(xué)家Sasha Rush透露了答案——關(guān)鍵在于強(qiáng)化學(xué)習(xí)。

我們用強(qiáng)化學(xué)習(xí)訓(xùn)練了一個(gè)大型MoE模型，讓它更貼近真實(shí)的編程任務(wù)，而且速度也非常快。

同時(shí)，為了和強(qiáng)化學(xué)習(xí)打配合，Cursor把自己在產(chǎn)品上的優(yōu)勢發(fā)揮到了極致。

和其他機(jī)器學(xué)習(xí)方法不同，強(qiáng)化學(xué)習(xí)幾乎無法從完整系統(tǒng)里抽象出太多內(nèi)容。所以我們讓Composer和Cursor一同設(shè)計(jì)，確保它能在真實(shí)規(guī)模下順暢運(yùn)行。

強(qiáng)化學(xué)習(xí)最大的特點(diǎn)是：它得在真實(shí)環(huán)境里「干活」，才能學(xué)到真本事。

如果Composer只在虛擬數(shù)據(jù)集里改改代碼，它根本不知道這些代碼有沒有bug、測試能不能過。

所以，Cursor干脆讓模型直接進(jìn)「上戰(zhàn)場」。在完整的 Cursor 環(huán)境中運(yùn)行、調(diào)用工具、執(zhí)行命令，通過一次次真實(shí)交互，拿到最有效的反饋信號。

具體來說，Composer的訓(xùn)練不是喂靜態(tài)數(shù)據(jù)集，而是基于真實(shí)的軟件工程任務(wù)完成的。

訓(xùn)練時(shí)，模型直接在完整代碼庫里動手，用上整套生產(chǎn)級工具：文件編輯、語義搜索、終端命令……

面對復(fù)雜工程問題，它必須自己寫、自己測、自己修。

每一輪訓(xùn)練都對應(yīng)一個(gè)具體任務(wù)，比如寫一段改動、擬一份方案，或者解釋某個(gè)代碼邏輯。

事實(shí)證明，強(qiáng)化學(xué)習(xí)確實(shí)讓Composer的表現(xiàn)上了一個(gè)臺階。

它學(xué)會了如何聰明地選工具、靈活地做并行處理，不再會一拍腦袋給用戶抽張廢卡。

隨著訓(xùn)練深入，模型甚至出現(xiàn)了涌現(xiàn)行為——能自動運(yùn)行單元測試、修復(fù)代碼格式錯(cuò)誤，甚至可以自主完成多步代碼搜索與調(diào)試流程。

而Cursor 2.0這次為多Agent協(xié)作提供的基礎(chǔ)架構(gòu)，正式建立在Composer這些底層能力的基礎(chǔ)之上。

值得注意的是，這次Cursor帶來的不只是一個(gè)更快的模型，而是一個(gè)真正面向?qū)崙?zhàn)的AI系統(tǒng)。

相比一味去和那些頭部基座模型硬剛，Cursor這次更聰明地發(fā)揮了自己在應(yīng)用端的產(chǎn)品優(yōu)勢——

讓Composer直接在與用戶相同的環(huán)境中運(yùn)行，真正做到貼合開發(fā)者的日常工作流程。

Cursor，你真的是自研嗎？

話說回來，Composer的效果確實(shí)很驚艷，但Cursor似乎在故意回避一個(gè)問題——

強(qiáng)化學(xué)習(xí)沒問題，但模型底子你倒是說清楚啊。

Composer的透明度缺失簡直離譜。他們提到用了強(qiáng)化學(xué)習(xí)，但沒交代模型的其他訓(xùn)練過程——
到底是自己預(yù)訓(xùn)練的，還是拿現(xiàn)成模型改的？
在他們公開更多細(xì)節(jié)、或有人能獨(dú)立復(fù)現(xiàn)結(jié)果之前，我對這些說法都持保留態(tài)度。

Cursor研究員Sasha Rush這些天也一直在 Hacker News 上親自答疑，但對于「基礎(chǔ)模型來源」這個(gè)問題，她始終沒正面回應(yīng)。

當(dāng)被直接問到「Composer是不是微調(diào)自某個(gè)開源模型？」時(shí)，Rush的回答是：

我們的主要關(guān)注點(diǎn)在于強(qiáng)化學(xué)習(xí)的后訓(xùn)練階段，我們認(rèn)為這是使模型成為強(qiáng)大的交互式智能體的最佳途徑。

不過可以確定的是，Cursor過去確實(shí)有自己的內(nèi)部模型。

據(jù)悉，Cheetah是Composer的早期原型，團(tuán)隊(duì)曾用它來測試生成速度與系統(tǒng)集成效果。

不過嘛，正式版Composer到底是基于Cheetah，還是從開源模型的骨架上改的……

還需要讓子彈再飛一會兒～

[1]https://news.ycombinator.com/item?id=45748725
[2]https://simonwillison.net/2025/Oct/29/cursor-composer/
[3]https://venturebeat.com/ai/vibe-coding-platform-cursor-releases-first-in-house-llm-composer-promising
[4]https://cursor.com/cn/blog/2-0
[5]https://x.com/srush_nlp/status/1983572683355725869
[6]https://x.com/cursor_ai/status/1983567619946147967

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.