<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      大模型亂試錯、盲調用?KnowSelf讓智能體有「知識邊界感知」能力

      0
      分享至




      在 AI 領域,大模型智能體的發展日新月異。我們今天要介紹的這篇 ACL 2025 論文——《Agentic Knowledgeable Self-awareness》,聚焦于如何提升智能體的「知識邊界感知」能力,使其在復雜任務規劃中更加得心應手,為智能體的可靠應用提供了新思路。



      • 論文標題:Agentic Knowledgeable Self-awareness
      • 論文鏈接:https://arxiv.org/abs/2504.03553
      • 代碼鏈接:https://github.com/zjunlp/KnowSelf

      30 秒速讀版本

      KnowSelf 聚焦于大模型智能體在決策過程中所面臨的「知識邊界感知」問題。受人類決策機制啟發,本文指出智能體應具備三類行為模式的自主決策能力:快速反應(快思考)、深度推理(慢思考),以及主動調用外部工具(本文以外部知識增強為例)。

      KnowSelf 通過學習自身的知識邊界,使智能體能在不同情境下自主判斷是否具備足夠知識進行生成和推理,以減少無效試錯與知識濫用。實驗表明,KnowSelf 可提升智能體的知識調用準確率、任務規劃效率和跨任務泛化能力。

      研究背景:智能體規劃的困境

      大模型智能體在諸多領域展現出巨大潛力,但現有智能體規劃方法存在弊端。傳統方法多采用「盲目灌輸」模式,將標準軌跡、外部反饋和領域知識無差別地注入智能體模型,完全忽視了人類決策過程中至關重要的「自我認知」原則。

      這種「無腦式」灌輸導致智能體在面對意外信號時極易崩潰,陷入模式崩塌困境,且過度試錯與盲目知識融合在實際場景中往往不可行,還會大幅推高模型推理成本。

      人類在決策時,會根據面臨的情境動態評估自身狀態,靈活調整策略。比如,當我們遇到簡單問題時,能迅速做出判斷并行動;遇到棘手問題,會放慢思考節奏,深入分析;而面對超出自身能力范圍的問題,會主動尋求外部知識或幫助。

      然而,當前大模型智能體普遍缺乏這種「知識邊界感知」能力,導致規劃行為低效且脆弱。

      核心方法:KnowSelf 框架

      為破解這一難題,論文提出了智能體「知識邊界感知」的思路,并基于此設計了數據驅動 KnowSelf 方法,讓大模型智能體能夠自主調節知識的運用。



      • 知識系統構建

      對于外部工具(知識),并采用了一種簡單高效知識收集方法,以極低成本完成知識庫的離線構建。該知識系統由知識庫和知識選擇模塊組成,其中知識庫包含一系列知識條目,知識選擇模塊能依據智能體歷史軌跡從知識庫中精準挑選所需知識。這種設計兼顧了知識系統的實用性和高效性。

      • 情境判斷標準

      論文基于智能體的能力,將情境劃分為三類:快速思考(Fast Thinking)、慢速思考(Slow Thinking)和知識型思考(Knowledgeable Thinking)。并提出了啟發式情境判斷標準,用于標記智能體自我探索軌跡中的特殊標記,從而針對智能體的能力構建出訓練數據,為后續訓練奠定基礎。

      • 快思考:智能體無需多慮,能直接給出正確行動
      • 慢思考:智能體雖能給出正確行動,但需經過多步思考與反思
      • 知識型思考:智能體自身無法提供正確行動,必須借助外部知識輔助思考
      • 自我認知訓練

      KnowSelf 采用雙階段訓練過程,先通過監督式微調(SFT),讓智能體模型初步掌握自我認知規劃模式;再引入 RPO 損失函數,進一步強化自我認知能力。在這一體系下,智能體會生成特定特殊標記,表明其對情境的判斷,在推理過程中實現知識查詢與反思的精準調控。

      實驗成果

      本文在兩個模擬大模型智能體規劃數據集 ALFWorld 和 WebShop 上,對 KnowSelf 進行了全面評估,涵蓋 Llama-8B 和 Gemma-2B 兩個不同規模的模型。實驗結果顯示,KnowSelf 憑借極少的反思和知識使用,性能優于多種基線方法。





      與無知識基線方法對比,KnowSelf 在 Llama-8B 和 Gemma-2B 模型上均展現出卓越性能。與知識增強型基線方法相比,KnowSelf 僅用少量知識,就超越了所有的 100% 知識增強基線方法,充分證明了并非知識越多越好,精準的知識引入機制才是關鍵。

      進一步分析:深入探索智能體自我認知

      • 智能體規劃模式過擬合



      本文通過消融實驗,發現僅在標準軌跡上訓練的模型更易陷入模式擬合,而引入反思和知識邊界感知后,智能體規劃能力提升。這表明,在許多情況下,智能體并非不能做出正確決策,而是受限于規劃模式。此外,過度引入知識可能會對性能產生負面影響,因此凸顯了精準知識引入機制的重要性。

      • 智能體規劃泛化能力



      在泛化能力測試中,KnowSelf 在 ALFWorld 的三項挑戰性任務上表現優異,優于基于提示的基線方法 Reflexion。這表明 KnowSelf 能有效打破傳統規劃軌跡訓練的局限,使模型具備跨任務情境感知能力,在未見過的任務上能靈活運用反思和知識引入策略。

      • 模型與數據規模影響



      隨著模型規模擴大和自我認知訓練數據量增加,KnowSelf 性能穩步提升。當自我認知訓練數據相對比例低于 40% 時,模型性能可能出現波動甚至下降,推測模型需達到一定自我認知水平才能穩定發揮效能。

      • 智能體自我認知機制機理



      本文在 Transformer 模型的各層計算不同情境標記的平均概率,發現 Reflection 標記概率始終為零,Knowledge 標記和 Action 標記在模型最后幾層才出現。這表明智能體在內部決策時,僅在最后幾層隱藏層才決定是否調用外部知識,且調用知識的決策可能更晚出現,暗示智能體在 Token 空間內通過隱式獎勵引導進行探索,最終做出決策。

      結論與展望

      本文提出的 KnowSelf 方法為智能體規劃提供了新思路,初步探索了智能體知識邊界感知這一問題。在后 R1 時代,隨著 Search-R1、ReSearch、Deep Researcher 等工作的出現,基于 RL 的智能體自主知識獲取工作展現了巨大的前景,KnowSelf 還只是在這個時代之前的初步產物,相信隨著技術的發展,基于 RL 的智能體自我認知能迸發更大的活力。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      立即停用這種“廚房神器”,已致多人死亡,很多家庭還在用!

      立即停用這種“廚房神器”,已致多人死亡,很多家庭還在用!

      DrX說
      2025-11-03 14:13:43
      美國:發明三三戰術不是人,是神!看起來人山人海,其實僅有27人

      美國:發明三三戰術不是人,是神!看起來人山人海,其實僅有27人

      云端小院
      2025-10-27 08:52:31
      俄烏沖突大反轉!紅軍城 9000 烏軍被困,澤連斯基說辭遭拆穿

      俄烏沖突大反轉!紅軍城 9000 烏軍被困,澤連斯基說辭遭拆穿

      井普椿的獨白
      2025-11-07 14:49:13
      棄車保帥!太子集團陳志末日已到,是被“自己人”滅口的

      棄車保帥!太子集團陳志末日已到,是被“自己人”滅口的

      吃瓜局
      2025-10-31 21:11:55
      一覺醒來,全網都知道了,內向的劉詩詩有一個讓她頭疼的魔丸兒子

      一覺醒來,全網都知道了,內向的劉詩詩有一個讓她頭疼的魔丸兒子

      洲洲影視娛評
      2025-11-06 20:38:52
      吳京深夜發文生無可戀,遭網友抵制并嘲諷,咋回事?

      吳京深夜發文生無可戀,遭網友抵制并嘲諷,咋回事?

      眼光很亮
      2025-11-06 10:15:22
      王偉瑩回應排名第5:有遺憾,但這或是最好結局 全紅嬋回了3表情

      王偉瑩回應排名第5:有遺憾,但這或是最好結局 全紅嬋回了3表情

      風過鄉
      2025-11-07 12:58:43
      兒子瑞士留學被拒收!沈伯洋搞分裂,代價由全家買單!

      兒子瑞士留學被拒收!沈伯洋搞分裂,代價由全家買單!

      娛樂圈的筆娛君
      2025-11-07 05:46:03
      林丹在西班牙為子慶生,謝杏芳盛裝笑容滿面,豪宅別墅顯得熱鬧

      林丹在西班牙為子慶生,謝杏芳盛裝笑容滿面,豪宅別墅顯得熱鬧

      科學發掘
      2025-11-06 13:42:50
      重慶為例,國家區劃調整大門重啟,膠州有可能撤市設區嗎?

      重慶為例,國家區劃調整大門重啟,膠州有可能撤市設區嗎?

      王二哥老搞笑
      2025-11-07 10:28:30
      2輪換+1首輪2次輪,ESPN:各隊認為莫蘭特交易價值與23年歐文相仿

      2輪換+1首輪2次輪,ESPN:各隊認為莫蘭特交易價值與23年歐文相仿

      懂球帝
      2025-11-07 08:53:06
      24投22中狂砍55分9板!張子宇這2戰殺瘋了:無愧女籃大殺器!

      24投22中狂砍55分9板!張子宇這2戰殺瘋了:無愧女籃大殺器!

      籃球快餐車
      2025-11-07 03:56:32
      老公半夜突發心臟病,婆婆:斷氣沒?一定要確定了再打120

      老公半夜突發心臟病,婆婆:斷氣沒?一定要確定了再打120

      徐俠客有話說
      2025-11-07 11:57:00
      臺灣問題,根本不是武統、和統的問題了,而是以下這兩方面問題!

      臺灣問題,根本不是武統、和統的問題了,而是以下這兩方面問題!

      壹知眠羊
      2025-07-05 08:27:25
      婚宴22桌賓客提前走,不是沒禮貌,是儀式感熬成了煎熬

      婚宴22桌賓客提前走,不是沒禮貌,是儀式感熬成了煎熬

      白宸侃片
      2025-11-01 12:23:34
      世界上平原面積最大的五個國家

      世界上平原面積最大的五個國家

      世界縱橫說
      2025-11-05 11:29:37
      63歲演員吳鎮宇刷老年卡坐公交,被疑“冒用他人證件”險被趕下車,當場掏身份證自證清白

      63歲演員吳鎮宇刷老年卡坐公交,被疑“冒用他人證件”險被趕下車,當場掏身份證自證清白

      極目新聞
      2025-11-04 21:57:03
      波克羅夫斯克尸橫遍野!小澤要求軍官誠實,俄軍換將疑為不實信息

      波克羅夫斯克尸橫遍野!小澤要求軍官誠實,俄軍換將疑為不實信息

      鷹眼Defence
      2025-11-04 18:01:46
      差距客觀存在!中國目前被歐美卡脖子最嚴重的幾個領域

      差距客觀存在!中國目前被歐美卡脖子最嚴重的幾個領域

      老謝談史
      2025-11-04 20:27:26
      趙勇下課?女排新帥或曝光,55歲,多次執教國家隊,蔡斌好友

      趙勇下課?女排新帥或曝光,55歲,多次執教國家隊,蔡斌好友

      樂聊球
      2025-11-07 12:14:07
      2025-11-07 16:44:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11672文章數 142500關注度
      往期回顧 全部

      科技要聞

      75%贊成!特斯拉股東同意馬斯克天價薪酬

      頭條要聞

      七旬老人帶一歲孫子住院:孩子父親去世母親下落不明

      頭條要聞

      七旬老人帶一歲孫子住院:孩子父親去世母親下落不明

      體育要聞

      是天才更是強者,18歲的全紅嬋邁過三道坎

      娛樂要聞

      白百何回應東京電影節爭議

      財經要聞

      老登們的社交貨幣全崩了

      汽車要聞

      美式豪華就是舒適省心 林肯航海家場地試駕

      態度原創

      時尚
      游戲
      藝術
      手機
      公開課

      有品味的中年阿姨,穿衣搭配都有4個共同點,學會了優雅到老

      索尼打擊盜版PS周邊:索賠200萬美元

      藝術要聞

      Donna Young:美國當代藝術家

      手機要聞

      折疊屏手機哪家好?2025年五款主流旗艦全面對比與選購指南

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 免费无码又爽又刺激成人| 久久亚洲国产精品久久| 亚洲日韩性欧美中文字幕| 中文字幕日韩精品亚洲一区| 国产男人的天堂在线视频| 中文毛片无遮挡高潮免费| 乱人伦中文视频在线| 国产精品对白刺激久久久| 人妻少妇久久久久久97人妻| 国产播放91色在线观看| 人妻内射一区二区在线视频| 国产三级精品三级色噜噜| 国内精品无码一区二区三区| 日韩有码中文字幕国产| 亚洲色在线v中文字幕| 免费a级毛片18以上观看精品| 成人精品区| 在线看国产精品自拍内射| 亚洲精品日韩中文字幕| 大香网伊人久久综合网2020| 国产精品v欧美精品∨日韩| 国产精品中文字幕综合| 国产精品大片中文字幕| 蜜桃av亚洲精品一区二区| 乱人伦人妻系列| 日韩一卡二卡三卡四卡五卡| 亚洲成人精品综合在线| 亚洲国产av无码精品无广告| 国产精品无遮挡猛进猛出| 中文字幕一区日韩精品| 天天躁日日躁狠狠躁中文字幕| 免费十八禁一区二区三区| 18禁无遮挡啪啪无码网站| 国产免费福利网站| 亚洲欧美在线观看品| 国产性一交一乱一伦一色一情| 康乐县| 毛片网站在线观看| 看全黄大色黄大片视频| av无码一区二区大桥久未| 国产中文字幕精品免费 |