![]()
機(jī)器之心報(bào)道
機(jī)器之心編輯部
終于,Cursor 還是走上了自己訓(xùn)練大型語言模型的路。
Cursor 2.0 終于來了!
剛剛,Cursor 發(fā)布了兩項(xiàng)重大更新:首個(gè)編碼模型 Composer,以及用于并行協(xié)作多個(gè)智能體的新界面。
![]()
![]()
此舉意義非凡。一直以來,Cursor 雖然廣受歡迎,但終究免不了「AI 時(shí)代的 VS Code」的帽子,因?yàn)樗饲爸荒苁褂?Claude、GPT 等第三方模型。這既是 Cursor 的起點(diǎn),也成了它的瓶頸。
Composer 的發(fā)布,堪稱是 Cursor 打破這個(gè)瓶頸的「獨(dú)立宣言」,這也標(biāo)志著 Cursor 正式從「AI 外殼」向「AI 原生平臺(tái)」進(jìn)化。
自研模型 Composer
Composer 是一款前沿模型,雖然智能程度不敵 GPT-5 等最佳前沿模型,但速度確實(shí)遙遙領(lǐng)先,達(dá)到了同等智能模型的 4 倍。
![]()
在基準(zhǔn)測(cè)試中,Composer 實(shí)現(xiàn)了前沿水平的編碼智能,同時(shí)生成速度達(dá)到每秒 250 個(gè) token—— 大約是領(lǐng)先的快速推理模型的兩倍,是同類前沿系統(tǒng)的四倍。(注:Cursor 發(fā)布的對(duì)比將模型分為幾個(gè)類別:「最佳開源」(例如,Qwen Coder、GLM 4.6)、「快速前沿」(Haiku 4.5、Gemini Flash 2.5)、「2025 年 7 月前沿」(年中可用的最強(qiáng)模型)以及「最佳前沿」(包括 GPT-5 和 Claude Sonnet 4.5)。Composer 在匹敵中端前沿系統(tǒng)智能水平的同時(shí),還在所有測(cè)試類別中實(shí)現(xiàn)了有記錄以來的最高生成速度。)
![]()
該模型專為在 Cursor 中進(jìn)行低延遲的智能體式編碼而打造,大多數(shù)回合在 30 秒內(nèi)完成。早期測(cè)試者認(rèn)為其快速迭代的能力非常順手,并愿意信任它處理多步驟編碼任務(wù)。
官方表示,Composer 通過一組強(qiáng)大的工具進(jìn)行訓(xùn)練,包括覆蓋整個(gè)代碼庫的語義搜索,因此在理解與處理大型代碼庫方面顯著更強(qiáng)。
![]()
![]()
具體來說,在訓(xùn)練過程中,Composer 可使用一套生產(chǎn)級(jí)的搜索與編輯工具,并被要求高效解決各類棘手問題。
該模型的研發(fā)動(dòng)力源于 Cursor 團(tuán)隊(duì)在開發(fā) Cursor Tab(自研的補(bǔ)全模型)時(shí)的經(jīng)驗(yàn)。
他們發(fā)現(xiàn),開發(fā)者往往希望使用既足夠智能又能支持交互式使用的模型,以保持編碼的專注與流暢。在研發(fā)過程中,他們?cè)囼?yàn)了一個(gè)代號(hào)為 Cheetah 的原型智能體模型,以更好地理解更高速智能體模型的影響。Composer 是該模型的更智能升級(jí)版,憑借足夠的速度支撐交互式體驗(yàn),讓編碼始終愉快順滑。
![]()
從架構(gòu)上來看,Composer 是一種混合專家(MoE)模型,支持長上下文的生成與理解。它通過在多樣化的開發(fā)環(huán)境中進(jìn)行強(qiáng)化學(xué)習(xí),針對(duì)軟件工程進(jìn)行了專項(xiàng)優(yōu)化。每次訓(xùn)練迭代中,模型都會(huì)接收問題描述,并被指示產(chǎn)出最佳響應(yīng),無論是代碼修改、方案規(guī)劃,還是信息性回答。模型既能使用讀取與編輯文件等簡單工具,也能調(diào)用更強(qiáng)大的能力,例如終端命令和面向整個(gè)代碼庫的語義搜索。
為衡量進(jìn)展,他們構(gòu)建了一套盡可能貼近軟件開發(fā)者實(shí)際使用價(jià)值的評(píng)測(cè)。新基準(zhǔn)測(cè)試 Cursor Bench 由 Cursor 的工程師和研究人員提交的真實(shí)智能體請(qǐng)求組成,并配有人工精心整理的最佳解決方案。該評(píng)測(cè)不僅考察智能體的正確性,還評(píng)估其對(duì)代碼庫既有抽象與軟件工程實(shí)踐的遵循程度。
![]()
強(qiáng)化學(xué)習(xí)使他們能夠有針對(duì)性地優(yōu)化模型,以更好地服務(wù)高效的軟件工程。鑒于響應(yīng)速度是交互式開發(fā)的關(guān)鍵,他們鼓勵(lì)模型在工具使用上做出高效選擇,并在可能的情況下最大化并行處理。此外,他們通過減少不必要的回復(fù)、避免無依據(jù)的陳述來訓(xùn)練模型。他們還發(fā)現(xiàn),在 RL 過程中,模型會(huì)自發(fā)習(xí)得一些有用的能力,例如執(zhí)行復(fù)雜搜索、修復(fù) linter 錯(cuò)誤,以及編寫并運(yùn)行單元測(cè)試。
![]()
Composer 已經(jīng)被 Cursor 自己的工程團(tuán)隊(duì)在日常開發(fā)中使用 —— 這表明其成熟度和穩(wěn)定性。
目前,Composer 已完全集成到 Cursor 2.0 中,這是該公司智能開發(fā)環(huán)境的一次重大更新。
多智能體界面
Cursor 的界面設(shè)計(jì)也進(jìn)行了更換。
其博客介紹說,這一版本更加聚焦,徹底以「智能體」為中心,而非傳統(tǒng)的文件結(jié)構(gòu)。這樣用戶就能專注于想要的結(jié)果,而讓智能體處理繁瑣的細(xì)節(jié)。當(dāng)需要深入代碼時(shí),用戶也可以輕松在新布局中打開文件,或切換回經(jīng)典的 IDE 界面。
![]()
Cursor 2.0 能夠輕松并行運(yùn)行多個(gè)智能體,它們之間互不干擾。這得益于 git worktree 或遠(yuǎn)程機(jī)器的支持。Cursor 表示:「我們甚至發(fā)現(xiàn),讓多個(gè)模型同時(shí)嘗試同一問題并擇優(yōu)采用,能顯著提升最終結(jié)果,尤其是在更難的任務(wù)上。」
![]()
every.to 博客分享了一些測(cè)試示例,比如在下面的示例中,在頂部欄中,可以看到三個(gè)不同的模型上運(yùn)行了相同的任務(wù):Composer 1 Alpha 運(yùn)行了兩次,Grok Code 運(yùn)行了一次:
![]()
該博客寫到:「現(xiàn)在,開發(fā)者可以同時(shí)運(yùn)行多個(gè) AI 智能體,每個(gè)智能體負(fù)責(zé)項(xiàng)目的不同部分,每個(gè)部分被稱為一個(gè)工作樹(work tree)。這相當(dāng)于一群實(shí)習(xí)生各自負(fù)責(zé)這篇文章的不同章節(jié),并同時(shí)向我匯報(bào)工作。」
另外,Cursor 官方還提到,隨著他們更多地使用智能體進(jìn)行編碼,出現(xiàn)了兩個(gè)新的瓶頸:代碼評(píng)審與變更測(cè)試。
Cursor 2.0 也開始解決這兩個(gè)問題。支持更快速地審閱智能體的變更,并在需要時(shí)深入代碼。
同時(shí),他們還構(gòu)建了原生瀏覽器工具,使 Cursor 可以測(cè)試其工作并持續(xù)迭代,直到產(chǎn)出正確的最終結(jié)果。
![]()
基礎(chǔ)設(shè)施
高效訓(xùn)練大型 MoE 模型需要在基礎(chǔ)設(shè)施與系統(tǒng)研究方面進(jìn)行大量投入。團(tuán)隊(duì)基于 PyTorch 和 Ray 構(gòu)建了定制化訓(xùn)練基礎(chǔ)設(shè)施,以在大規(guī)模環(huán)境下支持異步強(qiáng)化學(xué)習(xí)。他們通過將 MXFP8 MoE kernels 與專家并行和混合分片數(shù)據(jù)并行相結(jié)合,在原生低精度下訓(xùn)練模型,從而以極低的通信開銷將訓(xùn)練擴(kuò)展到數(shù)千張 NVIDIA GPU。此外,采用 MXFP8 訓(xùn)練還能在無需訓(xùn)練后量化的情況下實(shí)現(xiàn)更快的推理速度。
在進(jìn)行 RL 時(shí),團(tuán)隊(duì)希望模型能夠調(diào)用 Cursor Agent 框架中的任意工具。這些工具可用于編輯代碼、進(jìn)行語義搜索、使用 grep 查找字符串,以及運(yùn)行終端命令。以 Cursor 的規(guī)模,要讓模型高效調(diào)用這些工具,需要在云端并發(fā)運(yùn)行數(shù)十萬份隔離的沙盒編碼環(huán)境。為了承載這類工作負(fù)載,團(tuán)隊(duì)對(duì)既有的 Background Agents 基礎(chǔ)設(shè)施進(jìn)行了改造,重寫了虛擬機(jī)調(diào)度器,以適配訓(xùn)練運(yùn)行的突發(fā)性與規(guī)模。由此,他們將 RL 環(huán)境與生產(chǎn)環(huán)境實(shí)現(xiàn)了無縫統(tǒng)一。
網(wǎng)友點(diǎn)評(píng)
作為明星級(jí) AI 編程工具,Cursor 的這次大版本更新自然也收獲了無數(shù)眼球。
參與過早期體驗(yàn)的開發(fā)者紛紛給出好評(píng)。比如 every.to 博客就收集整理了多位開發(fā)者的意見反饋,其中有好有壞:
![]()
![]()
X 上也有不少網(wǎng)友分享自己的體驗(yàn)。
![]()
已經(jīng)有人玩笑式讓 Cursor 2.0 來構(gòu)建 AGI 了:
![]()
https://x.com/cursor_ai/status/1983567619946147967
https://cursor.com/blog/2-0
https://every.to/vibe-check/vibe-check-cursor-2-0-and-composer-1-alpha
https://cursor.com/cn/changelog/2-0
文中視頻鏈接:https://mp.weixin.qq.com/s/SOYp-wIq3YE_DbgppqhALg
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.