<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      這一個Tab鍵,我愿意單獨付費:Cursor在線強化學習優化代碼建議

      0
      分享至

      機器之心報道

      編輯:+0

      Cursor Tab 是 Cursor 的核心功能之一,它通過分析開發者的編碼行為,智能預測并推薦后續代碼,開發者僅需按下 Tab 鍵即可采納。



      然而,它也面臨著一個 AI 普遍存在的難題:「過度熱情」。有時,它提出的建議不僅毫無用處,甚至會打斷開發者的思路。

      問題的關鍵,不只是讓 AI 寫出更優秀的代碼,更是要教會它「察言觀色」:在最恰當的時機提供幫助,在其他時候則保持安靜。

      基于此,Cursor 采用在線強化學習技術訓練出一個全新的 Tab 模型。該模型將每一次用戶交互(接受/拒絕建議)都視為一個強化信號,直接用于模型的在線優化。在每天超過 4 億次請求的巨大流量驅動下,模型得以進行高頻度的、基于真實世界反饋的持續學習。



      Cursor 已將這個新的 Tab 模型設為默認版本。與舊模型相比,新模型提供的建議數量減少了 21%,但所提供建議的接受率卻提升了 28%。此舉旨在提升用戶的編碼體驗,Cursor 也計劃在未來繼續深化這些方法的研究。

      Cursor 的策略獨特且高效:它每天多次向用戶部署新模型(每隔 1.5-2 小時),利用實時數據進行快速訓練和優化。

      這與主流做法形成了鮮明對比。多數廠商仍在靜態數據集上進行長周期訓練,依賴人工標注,數月才發布一次新模型。Cursor 的模式則建立了一個超高頻的實時反饋循環,是對傳統模型開發流程的徹底顛覆。

      這似乎又一次向我們證明了,誰掌握了數據入口,誰就掌握了 AI 進化的主動權。

      該功能在 AI 社區也得到了非常積極的反饋,有用戶表示這是 Cursor 當前「護城河」,并愿意為 Cursor Tab 單獨付費。



      還有開發者認為,它能大幅提升了生產力,不像 agent 那樣只有噱頭,而是「比其他任何功能都更能改善工作流程」。



      另外,一條被「強化學習之父」Richard Sutton 轉發的評論表示,Cursor 的這個做法意義重大,它首次大規模證明了「實時在線學習」的巨大威力,并且指明了 AI 未來的一個重要發展方向,盡管目前還不夠完美。



      Cursor 通過一篇博客介紹了他們如何利用這些數據,通過在線強化學習技術來優化其 Tab 模型。

      • 博客地址:https://cursor.com/cn/blog/tab-rl

      「干擾性建議」的挑戰

      要實現高接受率,不僅需要提升模型本身的智能水平,更關鍵的是要判斷何時應提供建議,何時應保持靜默。在某些場景下,上下文信息不足以準確判斷用戶的意圖。即便模型具備完美的知識和推理能力,也無法預知用戶的確切操作。在這些情況下,不提供任何建議是更優的選擇。

      為提升建議的接受率,一種直接的思路是訓練一個獨立的分類模型來預測建議是否會被采納。據 Parth Thakkar 在 2022 年披露,GitHub Copilot 便采用了此種策略。它通過一個邏輯回歸模型計算「上下文過濾分數」,該模型接收 11 個特征作為輸入,涵蓋了編程語言、前次建議的采納情況、光標前的字符序列等。盡管該模型的確切預測目標未知,但外界普遍猜測其旨在預測建議被用戶接受的概率。當該分數低于 15% 時,系統便會跳過此次建議。

      該方案雖然可行,但 Cursor 的團隊希望尋求一種更通用的機制,以便能復用 Tab 模型自身學到的強大代碼表征能力。他們希望從根源上讓 Tab 模型避免生成質量不高的建議,而非僅僅在事后進行過濾。因此,他們最終選擇了策略梯度方法。

      策略梯度方法

      策略梯度是一種通用的優化框架,其目標是調整「策略」(在此即 Tab 模型),以最大化「獎勵」(Reward)。獎勵是一個被賦予策略所執行的每一個動作的數值。通過策略梯度算法,可以持續更新策略,使其在未來能夠獲得更高的平均獎勵。

      該類算法的核心思想是:允許策略進行探索性的隨機嘗試,觀察不同行為所帶來的獎勵高低,然后對獲得高獎勵的行為進行正向強化,對導致低獎勵的行為進行負向強化。

      為了運用策略梯度方法優化 Tab,團隊定義了一個精巧的獎勵函數:鼓勵被采納的建議,同時懲罰那些被展示但未被采納的建議。

      例如,假設目標是當建議的接受率不低于 25% 時才進行展示。那么,可以為被采納的建議設定 0.75 的獎勵,為被拒絕的建議設定 -0.25 的獎勵,而未展示建議的情況獎勵為 0。如果一個建議的真實接受概率為 p,那么展示該建議的期望獎勵就是。該值僅在 p>0.25 時為正。因此,一個旨在最大化獎勵的策略,將學會在其預估接受率超過 25% 時才給出建議。



      在實際應用中,Cursor 使用的獎勵函數更為復雜,還考慮了建議的長度、代碼跳轉以及展示更多建議的可能性等因素。但其核心理念是一致的:并非直接對接受率進行建模,而是學習一個能夠達成特定接受率目標的策略。

      可以推斷,模型在其內部表征中自發學習到了對接受概率的評估(或至少是評估其是否超過 25%),而這個過程完全交由優化器自行探索。

      同策略(On-Policy)數據的重要性



      然而,該方法有一個關鍵前提:用于計算梯度的動作樣本,必須來自于當前正在優化的策略。一旦策略被更新,舊的數據便不再是「同策略(On-Policy)」數據。

      為了獲取最新的有效樣本,就必須將新模型部署給用戶并收集其行為數據。這意味著需要一套高效的基礎設施,以快速部署新的模型檢查點,并縮短從用戶產生數據到數據進入下一輪訓練流程的時間。

      目前,Cursor 推出一個檢查點并收集所需數據需要 1.5 到 2 小時。盡管這在人工智能行業已屬高效,但仍有進一步優化的空間。

      Cursor 這次更新讓你心動了嗎?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      歐冠積分榜形勢:拜仁阿森納全勝,巴黎皇馬遭首敗,意甲陷危機

      歐冠積分榜形勢:拜仁阿森納全勝,巴黎皇馬遭首敗,意甲陷危機

      懂球帝
      2025-11-05 06:37:14
      哈馬斯:以色列向地道灌混凝土困我們的戰士,嚴重違反協議

      哈馬斯:以色列向地道灌混凝土困我們的戰士,嚴重違反協議

      桂系007
      2025-11-04 22:41:12
      NBA傳聞:若范弗利特仍缺陣,灰熊正考慮交易莫蘭特,火箭加入?

      NBA傳聞:若范弗利特仍缺陣,灰熊正考慮交易莫蘭特,火箭加入?

      好火子
      2025-11-06 02:15:20
      中央宣講團成員,已赴多個省份

      中央宣講團成員,已赴多個省份

      政知新媒體
      2025-11-05 22:42:32
      心情郁悶時就去瞅瞅李湘的評論區,我簡直快要笑瘋了。

      心情郁悶時就去瞅瞅李湘的評論區,我簡直快要笑瘋了。

      陳意小可愛
      2025-10-21 01:04:16
      內線都快被打爆了,結果快船依然不愿意給首輪秀多些出場時間?

      內線都快被打爆了,結果快船依然不愿意給首輪秀多些出場時間?

      稻谷與小麥
      2025-11-06 02:12:25
      四川首次迎來“春秋假”,家長卻發長文阻撓:雙職工家庭吃不消了

      四川首次迎來“春秋假”,家長卻發長文阻撓:雙職工家庭吃不消了

      熙熙說教
      2025-11-05 21:17:49
      還沒完了!趙鴻剛對手給所有武林大師下戰書,中國武協或出面干預

      還沒完了!趙鴻剛對手給所有武林大師下戰書,中國武協或出面干預

      楊華評論
      2025-11-05 23:59:12
      比肩阿德和埃托奧,勞塔羅本賽季出戰的三場歐冠比賽均有進球

      比肩阿德和埃托奧,勞塔羅本賽季出戰的三場歐冠比賽均有進球

      懂球帝
      2025-11-06 05:26:52
      湖南某三甲醫院美女眼科主任與副院長的瓜

      湖南某三甲醫院美女眼科主任與副院長的瓜

      筆桿論道
      2025-11-05 22:02:55
      全都“反水”了!美、韓芯片巨頭集體行動,外媒:限制將反轉

      全都“反水”了!美、韓芯片巨頭集體行動,外媒:限制將反轉

      科普100克克
      2025-11-03 23:36:41
      千萬不要在網上買“這4樣”東西,水太深了,看完真后怕!

      千萬不要在網上買“這4樣”東西,水太深了,看完真后怕!

      裝修秀
      2025-10-28 11:55:03
      返回臺灣!“館長”強烈安利記者去大陸玩

      返回臺灣!“館長”強烈安利記者去大陸玩

      看看新聞Knews
      2025-11-06 01:04:03
      年輕人不買賬,中年人喝不起!茅臺跌破1600,終于承認只是瓶酒?

      年輕人不買賬,中年人喝不起!茅臺跌破1600,終于承認只是瓶酒?

      金融八卦女
      2025-11-05 13:57:48
      要超就超美國,電磁彈射版攻擊-11亮相?中國隱身無人機航母走在世界前列

      要超就超美國,電磁彈射版攻擊-11亮相?中國隱身無人機航母走在世界前列

      Ck的蜜糖
      2025-11-06 00:13:30
      震驚!賴清德對解放軍攻臺保持沉默,鄭麗文一語引發國際熱議

      震驚!賴清德對解放軍攻臺保持沉默,鄭麗文一語引發國際熱議

      Ck的蜜糖
      2025-11-06 02:25:48
      baby葉珂雙雙哭暈!黃曉明跟女制片人貼臉擁抱,坐大腿親密照來了

      baby葉珂雙雙哭暈!黃曉明跟女制片人貼臉擁抱,坐大腿親密照來了

      八星人
      2025-11-05 15:32:27
      美專家:當美軍第一波導彈干掉中國航母或兩棲艦后,希望中國退讓

      美專家:當美軍第一波導彈干掉中國航母或兩棲艦后,希望中國退讓

      陣匠
      2025-08-02 09:16:14
      立冬吃餃子,別管多忙,記得:2餡不吃、4事不做,別犯忌諱

      立冬吃餃子,別管多忙,記得:2餡不吃、4事不做,別犯忌諱

      阿龍美食記
      2025-11-04 11:50:20
      A股:剛剛,兩部門重磅宣布,政策暖意托底,周四將迎大級別變化

      A股:剛剛,兩部門重磅宣布,政策暖意托底,周四將迎大級別變化

      云鵬敘事
      2025-11-06 00:00:03
      2025-11-06 06:04:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11656文章數 142499關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      美國肯塔基州州長:本州進入緊急狀態

      頭條要聞

      美國肯塔基州州長:本州進入緊急狀態

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      事關加快建設金融強國 中央金融辦發聲

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      時尚
      數碼
      親子
      教育
      游戲

      今年一定要擁有這件大衣,復古又時髦!

      數碼要聞

      小米POCO X1平板現身Geekbench 搭載驍龍7+ Gen 3

      親子要聞

      孩子夾腿觸摸自己不一定都是壞事,但這種情況除外!

      教育要聞

      語言的學習,從不講捷徑

      一份游戲雙平臺玩!PS5/PC跨平臺購買標志新發現

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻综合专区第一页| 国产免费无遮挡吃奶视频| 久久96热在精品国产高清 | 晋城| 亚洲av成人精品日韩一区| 免费无码高潮流白浆视频| 国产成人啪精品视频免费APP | 边吃奶边添下面好爽| 97成人碰碰久久人人超级碰oo| 国产精品亚洲а∨天堂2021| 日产精品久久久久久久| 亚洲精品区二区三区蜜桃| 沈阳市| 久久中文字幕无码一区二区| 精品一区二区三区四区色| 欧洲无码一区二区三区在线观看| 中文字幕无码不卡在线| 亚洲精品一区二区三区色| 狠狠婷婷色五月中文字幕| 日本阿v片在线播放免费| 亚洲熟妇自偷自拍另亚洲| 国产草草影院ccyycom| 被c到高潮疯狂喷水国产| 日韩中文字幕免费在线观看| 欧美成人精品手机在线| 一出一进一爽一粗一大视频| 线观看的国产成人av天堂| 又大又紧又粉嫩18p少妇| 国产果冻豆传媒麻婆精东 | 中文字幕人妻有码久视频| 中文字幕av无码一区二区三区| 亚洲成人午夜排名成人午夜| 中文字幕av国产精品| 交口县| 精品91在线| 国产一精品一av一免费| 国产永久免费高清在线| 99人中文字幕亚洲区三| 亚洲午夜无码久久久久蜜臀av | 在线免费观看亚洲天堂av| 久久国产免费观看精品3|