網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛，Cursor 2.0攜自研模型Composer強(qiáng)勢(shì)登場，不再只做「殼」

2025-10-30 10:20:41　來源: 機(jī)器之心Pro

北京舉報(bào)

分享至

機(jī)器之心報(bào)道

機(jī)器之心編輯部

終于，Cursor 還是走上了自己訓(xùn)練大型語言模型的路。

Cursor 2.0 終于來了！

剛剛，Cursor 發(fā)布了兩項(xiàng)重大更新：首個(gè)編碼模型 Composer，以及用于并行協(xié)作多個(gè)智能體的新界面。

此舉意義非凡。一直以來，Cursor 雖然廣受歡迎，但終究免不了「AI 時(shí)代的 VS Code」的帽子，因?yàn)樗饲爸荒苁褂?Claude、GPT 等第三方模型。這既是 Cursor 的起點(diǎn)，也成了它的瓶頸。

Composer 的發(fā)布，堪稱是 Cursor 打破這個(gè)瓶頸的「獨(dú)立宣言」，這也標(biāo)志著 Cursor 正式從「AI 外殼」向「AI 原生平臺(tái)」進(jìn)化。

自研模型 Composer

Composer 是一款前沿模型，雖然智能程度不敵 GPT-5 等最佳前沿模型，但速度確實(shí)遙遙領(lǐng)先，達(dá)到了同等智能模型的 4 倍。

在基準(zhǔn)測(cè)試中，Composer 實(shí)現(xiàn)了前沿水平的編碼智能，同時(shí)生成速度達(dá)到每秒 250 個(gè) token—— 大約是領(lǐng)先的快速推理模型的兩倍，是同類前沿系統(tǒng)的四倍。（注：Cursor 發(fā)布的對(duì)比將模型分為幾個(gè)類別：「最佳開源」（例如，Qwen Coder、GLM 4.6）、「快速前沿」（Haiku 4.5、Gemini Flash 2.5）、「2025 年 7 月前沿」（年中可用的最強(qiáng)模型）以及「最佳前沿」（包括 GPT-5 和 Claude Sonnet 4.5）。Composer 在匹敵中端前沿系統(tǒng)智能水平的同時(shí)，還在所有測(cè)試類別中實(shí)現(xiàn)了有記錄以來的最高生成速度。）

該模型專為在 Cursor 中進(jìn)行低延遲的智能體式編碼而打造，大多數(shù)回合在 30 秒內(nèi)完成。早期測(cè)試者認(rèn)為其快速迭代的能力非常順手，并愿意信任它處理多步驟編碼任務(wù)。

官方表示，Composer 通過一組強(qiáng)大的工具進(jìn)行訓(xùn)練，包括覆蓋整個(gè)代碼庫的語義搜索，因此在理解與處理大型代碼庫方面顯著更強(qiáng)。

具體來說，在訓(xùn)練過程中，Composer 可使用一套生產(chǎn)級(jí)的搜索與編輯工具，并被要求高效解決各類棘手問題。

該模型的研發(fā)動(dòng)力源于 Cursor 團(tuán)隊(duì)在開發(fā) Cursor Tab（自研的補(bǔ)全模型）時(shí)的經(jīng)驗(yàn)。

他們發(fā)現(xiàn)，開發(fā)者往往希望使用既足夠智能又能支持交互式使用的模型，以保持編碼的專注與流暢。在研發(fā)過程中，他們?cè)囼?yàn)了一個(gè)代號(hào)為 Cheetah 的原型智能體模型，以更好地理解更高速智能體模型的影響。Composer 是該模型的更智能升級(jí)版，憑借足夠的速度支撐交互式體驗(yàn)，讓編碼始終愉快順滑。

從架構(gòu)上來看，Composer 是一種混合專家（MoE）模型，支持長上下文的生成與理解。它通過在多樣化的開發(fā)環(huán)境中進(jìn)行強(qiáng)化學(xué)習(xí)，針對(duì)軟件工程進(jìn)行了專項(xiàng)優(yōu)化。每次訓(xùn)練迭代中，模型都會(huì)接收問題描述，并被指示產(chǎn)出最佳響應(yīng)，無論是代碼修改、方案規(guī)劃，還是信息性回答。模型既能使用讀取與編輯文件等簡單工具，也能調(diào)用更強(qiáng)大的能力，例如終端命令和面向整個(gè)代碼庫的語義搜索。

為衡量進(jìn)展，他們構(gòu)建了一套盡可能貼近軟件開發(fā)者實(shí)際使用價(jià)值的評(píng)測(cè)。新基準(zhǔn)測(cè)試 Cursor Bench 由 Cursor 的工程師和研究人員提交的真實(shí)智能體請(qǐng)求組成，并配有人工精心整理的最佳解決方案。該評(píng)測(cè)不僅考察智能體的正確性，還評(píng)估其對(duì)代碼庫既有抽象與軟件工程實(shí)踐的遵循程度。

強(qiáng)化學(xué)習(xí)使他們能夠有針對(duì)性地優(yōu)化模型，以更好地服務(wù)高效的軟件工程。鑒于響應(yīng)速度是交互式開發(fā)的關(guān)鍵，他們鼓勵(lì)模型在工具使用上做出高效選擇，并在可能的情況下最大化并行處理。此外，他們通過減少不必要的回復(fù)、避免無依據(jù)的陳述來訓(xùn)練模型。他們還發(fā)現(xiàn)，在 RL 過程中，模型會(huì)自發(fā)習(xí)得一些有用的能力，例如執(zhí)行復(fù)雜搜索、修復(fù) linter 錯(cuò)誤，以及編寫并運(yùn)行單元測(cè)試。

Composer 已經(jīng)被 Cursor 自己的工程團(tuán)隊(duì)在日常開發(fā)中使用 —— 這表明其成熟度和穩(wěn)定性。

目前，Composer 已完全集成到 Cursor 2.0 中，這是該公司智能開發(fā)環(huán)境的一次重大更新。

多智能體界面

Cursor 的界面設(shè)計(jì)也進(jìn)行了更換。

其博客介紹說，這一版本更加聚焦，徹底以「智能體」為中心，而非傳統(tǒng)的文件結(jié)構(gòu)。這樣用戶就能專注于想要的結(jié)果，而讓智能體處理繁瑣的細(xì)節(jié)。當(dāng)需要深入代碼時(shí)，用戶也可以輕松在新布局中打開文件，或切換回經(jīng)典的 IDE 界面。

Cursor 2.0 能夠輕松并行運(yùn)行多個(gè)智能體，它們之間互不干擾。這得益于 git worktree 或遠(yuǎn)程機(jī)器的支持。Cursor 表示：「我們甚至發(fā)現(xiàn)，讓多個(gè)模型同時(shí)嘗試同一問題并擇優(yōu)采用，能顯著提升最終結(jié)果，尤其是在更難的任務(wù)上。」

every.to 博客分享了一些測(cè)試示例，比如在下面的示例中，在頂部欄中，可以看到三個(gè)不同的模型上運(yùn)行了相同的任務(wù)：Composer 1 Alpha 運(yùn)行了兩次，Grok Code 運(yùn)行了一次：

該博客寫到：「現(xiàn)在，開發(fā)者可以同時(shí)運(yùn)行多個(gè) AI 智能體，每個(gè)智能體負(fù)責(zé)項(xiàng)目的不同部分，每個(gè)部分被稱為一個(gè)工作樹（work tree）。這相當(dāng)于一群實(shí)習(xí)生各自負(fù)責(zé)這篇文章的不同章節(jié)，并同時(shí)向我匯報(bào)工作。」

另外，Cursor 官方還提到，隨著他們更多地使用智能體進(jìn)行編碼，出現(xiàn)了兩個(gè)新的瓶頸：代碼評(píng)審與變更測(cè)試。

Cursor 2.0 也開始解決這兩個(gè)問題。支持更快速地審閱智能體的變更，并在需要時(shí)深入代碼。

同時(shí)，他們還構(gòu)建了原生瀏覽器工具，使 Cursor 可以測(cè)試其工作并持續(xù)迭代，直到產(chǎn)出正確的最終結(jié)果。

基礎(chǔ)設(shè)施

高效訓(xùn)練大型 MoE 模型需要在基礎(chǔ)設(shè)施與系統(tǒng)研究方面進(jìn)行大量投入。團(tuán)隊(duì)基于 PyTorch 和 Ray 構(gòu)建了定制化訓(xùn)練基礎(chǔ)設(shè)施，以在大規(guī)模環(huán)境下支持異步強(qiáng)化學(xué)習(xí)。他們通過將 MXFP8 MoE kernels 與專家并行和混合分片數(shù)據(jù)并行相結(jié)合，在原生低精度下訓(xùn)練模型，從而以極低的通信開銷將訓(xùn)練擴(kuò)展到數(shù)千張 NVIDIA GPU。此外，采用 MXFP8 訓(xùn)練還能在無需訓(xùn)練后量化的情況下實(shí)現(xiàn)更快的推理速度。

在進(jìn)行 RL 時(shí)，團(tuán)隊(duì)希望模型能夠調(diào)用 Cursor Agent 框架中的任意工具。這些工具可用于編輯代碼、進(jìn)行語義搜索、使用 grep 查找字符串，以及運(yùn)行終端命令。以 Cursor 的規(guī)模，要讓模型高效調(diào)用這些工具，需要在云端并發(fā)運(yùn)行數(shù)十萬份隔離的沙盒編碼環(huán)境。為了承載這類工作負(fù)載，團(tuán)隊(duì)對(duì)既有的 Background Agents 基礎(chǔ)設(shè)施進(jìn)行了改造，重寫了虛擬機(jī)調(diào)度器，以適配訓(xùn)練運(yùn)行的突發(fā)性與規(guī)模。由此，他們將 RL 環(huán)境與生產(chǎn)環(huán)境實(shí)現(xiàn)了無縫統(tǒng)一。

網(wǎng)友點(diǎn)評(píng)

作為明星級(jí) AI 編程工具，Cursor 的這次大版本更新自然也收獲了無數(shù)眼球。

參與過早期體驗(yàn)的開發(fā)者紛紛給出好評(píng)。比如 every.to 博客就收集整理了多位開發(fā)者的意見反饋，其中有好有壞：

X 上也有不少網(wǎng)友分享自己的體驗(yàn)。

已經(jīng)有人玩笑式讓 Cursor 2.0 來構(gòu)建 AGI 了：

https://x.com/cursor_ai/status/1983567619946147967

https://cursor.com/blog/2-0

https://every.to/vibe-check/vibe-check-cursor-2-0-and-composer-1-alpha

https://cursor.com/cn/changelog/2-0

文中視頻鏈接：https://mp.weixin.qq.com/s/SOYp-wIq3YE_DbgppqhALg

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.