<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      LaDi-WM模型大幅提升機器人操作策略的成功率和跨場景泛化能力

      0
      分享至



      在機器人操作任務中,預測性策略近年來在具身人工智能領域引起了廣泛關注,因為它能夠利用預測狀態來提升機器人的操作性能。然而,讓世界模型預測機器人與物體交互的精確未來狀態仍然是一個公認的挑戰,尤其是生成高質量的像素級表示。

      為解決上述問題,國防科大、北京大學、深圳大學團隊提出LaDi-WM(Latent Diffusion-based WorldModels),一種基于隱空間擴散的世界模型,用于預測隱空間的未來狀態。

      具體而言,LaDi-WM 利用預訓練的視覺基礎模型 (Vision Fundation Models) 來構建隱空間表示,該表示同時包含幾何特征(基于 DINOv2 構造)和語義特征(基于 Siglip 構造),并具有廣泛的通用性,有利于機器人操作的策略學習以及跨任務的泛化能力。

      基于 LaDi-WM,團隊設計了一種擴散策略,該策略通過整合世界模型生成的預測狀態來迭代地優化輸出動作,從而生成更一致、更準確的動作結果。通過在虛擬和真實數據集上的大量實驗,LaDi-WM 能夠顯著提高機器人操作任務的成功率,尤其是在 LIBERO-LONG 數據集上提升27.9%,超過之前的所有方法。





      • 論文地址:https://arxiv.org/abs/2505.11528
      • 項目主頁:https://guhuangai.github.io/LaDiWM.github.io/

      論文創新點:

      1.一種基于隱空間擴散的世界模型:使用視覺基礎模型構建隱空間的通用表示,并在隱空間學習可泛化的動態建模能力。

      2.一種基于世界模型預測迭代優化的擴散策略:利用世界模型生成未來預測的狀態,將預測的狀態反饋給策略模型,迭代式地優化策略輸出。



      圖 1 :(左)通過任務無關的片段學習隱擴散世界模型;(右)通過世界模型的未來狀態預測來優化策略模型

      技術路線

      該團隊提出一種利用世界模型優化策略學習的框架,以學習機器人抓取操作相關的技能策略。該框架可分為兩大階段:世界模型學習和策略學習。

      A. 世界模型學習:

      (a)隱空間表示:通過預訓練的視覺基礎模型對觀測圖像提取幾何表征與語義表征,其中幾何表征利用 DINOv2 提取,而語義表征則使用 Siglip 提取。

      (b)交互擴散:同時對兩種隱空間表示實施擴散過程,并在擴散過程中讓二者充分交互,學習幾何與語義表征之間的依賴關系,從而促進兩種表示的準確動態預測。



      圖 2 : 基于交互擴散的世界模型架構

      B. 策略模型訓練與迭代優化推理

      (a)結合世界模型的未來預測引導策略學習:將世界模型給出的未來預測作為額外的輸入,引導策略模型的準確動作預測;模型架構基于擴散策略模型,有利于學習多模態動作分布。

      (b)迭代優化策略輸出:策略模型可以在一個時間步多次利用世界模型的未來預測作為引導,從而不斷優化自身的動作輸出。實驗顯示,該方案可以逐漸降低策略模型的輸出分布熵,達到更準確的動作預測。



      圖 3 : 基于未來預測引導的策略模型架構

      實驗結果

      虛擬實驗:

      在公開的虛擬數據集(LIBERO-LONG,CALVIN D-D)中,團隊驗證了所提出框架在機器人抓取相關的操作任務上的性能。在實驗中,世界模型的訓練數據會與策略模型的訓練數據區分開,從而驗證世界模型的泛化能力。對于 LIBERO-LONG,給定語言指令,多次執行并統計機器人完成各項任務的成功率。對于 CALVIN D-D,連續給定五個語言指令,多次執行并統計平均完成任務的數量。

      在 LIBERO-LONG 數據集,為了驗證世界模型對策略模型的引導作用,團隊僅使用 10 條軌跡去訓練各任務,對比結果如表 1 所示。相比于其他方法,LaDi-WM 能夠提供精確的未來預測,并將預測反饋給策略模型,不斷優化動作輸出,僅需少量訓練數據即可達到 68.7% 的成功率,顯著優于其他方法。



      表 1: LIBERO-LONG 性能對比

      在 CALVIN D-D 數據集上,LaDi-WM 同樣展示了在長時任務中的強大性能(表 2)。



      表 2: CALVIN D-D 性能對比

      團隊進一步驗證了所提出框架的可擴展性,如圖 4 所示。

      (a)逐漸增大世界模型的訓練數據,模型的預測誤差逐漸降低且策略性能逐漸提升;

      (b)逐漸增大策略模型的訓練數據,抓取操作的成功率逐漸提升;

      (c)逐漸增大策略模型的參數量,抓取操作的成功率逐漸提升。



      圖 4 : 可擴展性實驗

      為了驗證 LaDi-WM 的跨場景泛化能力,團隊在 LIBERO-LONG 上訓練世界模型,并直接應用于 CALVIN D-D 的策略學習中,實驗結果如表 3 所示。若是使用在 LIBERO-LONG 訓練的原始策略模型,直接應用到 CALVIN D-D 是不工作的(表第一行);而使用在 LIBERO-LONG 訓練的世界模型來引導 CALVIN 環境下的策略學習,則可以比在 CALVIN 環境訓練的原始策略的性能高 0.61(表第三行)。這表明,世界模型的泛化能力要優于策略模型的泛化能力。



      表 3: 跨場景實驗結果。L 代表 LIBERO-LONG,C 代表 CALVIN D-D

      團隊進一步探索了利用世界模型迭代優化的工作原理。團隊收集不同迭代輪次下策略模型的輸出動作并繪制其分布,如圖 5 所示。迭代優化的過程中,輸出動作分布的熵在逐漸降低,這表明策略模型每一步的輸出動作更加穩定,從而提升整體的抓取成功率。



      圖 5 : 迭代優化的動作分布對比

      真機實驗:

      團隊也在真實場景中驗證了所提出框架的性能,具體操作任務包括「疊碗」、「開抽屜」、「關抽屜」以及「抓取物體放入籃子」等,如圖 6 所示。



      圖 6 : (左)真實場景環境;(右)機器人實際操作樣例

      在真實場景中,LaDi-WM 將原始模仿學習策略的成功率顯著提升 20%(表 4)。



      表 4: 真實場景性能對比

      圖 7 展示了最終所得策略模型在不同任務上的執行軌跡,從圖中可以發現,提出的策略能夠在不同光照條件以及不同初始位置的情況下有魯棒的泛化性。



      圖 7 : 真實場景機器人執行軌跡

      總結

      國防科大、北京大學、深圳大學團隊提出了一種隱空間擴散的世界模型 LaDi-WM(Latent Diffusion-based World Models),利用視覺基礎模型提取通用的隱空間表示,并在隱空間學習可泛化的動態建模。同時,團隊提出基于世界模型的未來預測來引導策略學習,在推理階段通過迭代式地優化策略輸出,從而進一步提高策略輸出動作的準確度。團隊通過虛擬與真機上廣泛的實驗證明了 LaDi-WM 的有效性,所提出的方法顯著提升了機器人抓取操作技能的性能。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      桂綸鎂回應白百何落選:王傳君的表演,讓我非常的信服

      桂綸鎂回應白百何落選:王傳君的表演,讓我非常的信服

      韓小娛
      2025-11-06 09:21:47
      什么時候吃降壓藥合適?早上空腹能吃嗎?告訴你答案

      什么時候吃降壓藥合適?早上空腹能吃嗎?告訴你答案

      泠泠說史
      2025-11-06 15:45:43
      關鍵證人全都招了,尹錫悅聽到“槍斃”兩個字,當場就說不出話了

      關鍵證人全都招了,尹錫悅聽到“槍斃”兩個字,當場就說不出話了

      娛樂看阿敞
      2025-11-06 16:03:09
      足協認定誤判!成都蓉城因裁判兩次爭議判罰中超爭冠夢碎

      足協認定誤判!成都蓉城因裁判兩次爭議判罰中超爭冠夢碎

      封面新聞
      2025-11-06 16:45:02
      起風了,鄭麗文話音剛落,侯友宜就坐不住了?黃國昌早已有言在先

      起風了,鄭麗文話音剛落,侯友宜就坐不住了?黃國昌早已有言在先

      夢史
      2025-11-06 18:45:18
      繼父娶我媽20年從不進我房間,媽媽走后他給我把鑰匙,說:別恨我

      繼父娶我媽20年從不進我房間,媽媽走后他給我把鑰匙,說:別恨我

      秋風專欄
      2025-05-21 17:11:13
      女子離婚后和前夫有染,借看娃之機行夫妻之實,自錄視頻發網分享

      女子離婚后和前夫有染,借看娃之機行夫妻之實,自錄視頻發網分享

      吾觀専欗
      2025-11-05 18:09:58
      天吶!鞏俐這身材太驚艷了,胸圍幾乎到肚臍,狀態卻依舊十分亮眼

      天吶!鞏俐這身材太驚艷了,胸圍幾乎到肚臍,狀態卻依舊十分亮眼

      TVB的四小花
      2025-10-22 02:25:03
      第四代核反應堆,成功運行,第四艘航母,12萬噸成為定局?

      第四代核反應堆,成功運行,第四艘航母,12萬噸成為定局?

      桑啟紅原
      2025-11-04 16:36:05
      邵佳一執教國足僅2天,風波升級,球迷質疑胡搞 還意外提到了李鐵

      邵佳一執教國足僅2天,風波升級,球迷質疑胡搞 還意外提到了李鐵

      大秦壁虎白話體育
      2025-11-07 09:09:47
      三區合一!直轄市,也開啟“強省會”模式了?

      三區合一!直轄市,也開啟“強省會”模式了?

      西部城市
      2025-11-06 21:05:28
      溫格:維爾茨當初選擇利物浦前提是踢10號位,他不想踢邊路

      溫格:維爾茨當初選擇利物浦前提是踢10號位,他不想踢邊路

      懂球帝
      2025-11-06 15:32:48
      獨行俠撕毀承諾!湯神被踢到替補卻連抗議都不敢,終于想念庫里了

      獨行俠撕毀承諾!湯神被踢到替補卻連抗議都不敢,終于想念庫里了

      嘴炮體壇
      2025-11-06 10:40:41
      拒絕邀請!邵佳一前國安隊友坦言不會加盟國足,曾被國家隊打壓

      拒絕邀請!邵佳一前國安隊友坦言不會加盟國足,曾被國家隊打壓

      山河入畫屏
      2025-11-06 13:24:19
      勁爆!汪峰沉默了,森林北也沉默了,就連葛薈婕也沉默了!

      勁爆!汪峰沉默了,森林北也沉默了,就連葛薈婕也沉默了!

      情感大頭說說
      2025-11-06 13:13:56
      阿根廷大名單:梅西領銜,勞塔羅、小蜘蛛、恩佐、麥卡在列

      阿根廷大名單:梅西領銜,勞塔羅、小蜘蛛、恩佐、麥卡在列

      懂球帝
      2025-11-07 03:35:47
      全球都在看中國將如何救援航天員!俄羅斯和美國9個月,中國多久

      全球都在看中國將如何救援航天員!俄羅斯和美國9個月,中國多久

      墨蘭史書
      2025-11-07 03:20:03
      大勝!杰倫布朗35+5,榜眼空砍31+8,白魔2分,離開火箭或許錯了

      大勝!杰倫布朗35+5,榜眼空砍31+8,白魔2分,離開火箭或許錯了

      巴叔GO聊體育
      2025-11-06 14:06:24
      緬北四大家族被同盟軍包圍,情急之下向西方求助:我們有鄰國證據

      緬北四大家族被同盟軍包圍,情急之下向西方求助:我們有鄰國證據

      真實故事匯
      2023-11-14 17:55:20
      觀察|紐約和倫敦市長都是穆斯林、南亞裔,共同對抗右翼勢力抬頭

      觀察|紐約和倫敦市長都是穆斯林、南亞裔,共同對抗右翼勢力抬頭

      澎湃新聞
      2025-11-06 07:28:27
      2025-11-07 09:28:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11665文章數 142499關注度
      往期回顧 全部

      科技要聞

      75%贊成!特斯拉股東同意馬斯克天價薪酬

      頭條要聞

      牛彈琴:特朗普現在最擔心的事很不妙 心提到嗓子眼了

      頭條要聞

      牛彈琴:特朗普現在最擔心的事很不妙 心提到嗓子眼了

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      “黑料纏身”的白百何 誰給她的勇氣?

      財經要聞

      老登們的社交貨幣全崩了

      汽車要聞

      是我眼花了么?怎么大猩猩都來參加新車發布了?

      態度原創

      健康
      游戲
      旅游
      房產
      手機

      超聲探頭會加重受傷情況嗎?

      夢幻西游風少逆天預判助寶哥團隊拿狀元,歐皇鑒定130頭連出極品

      旅游要聞

      方山:山靜溪潺潺 林中有洞天

      房產要聞

      錨定居住新趨勢!廣佛新世界重構灣區“理想生活投資學”

      手機要聞

      蘋果喊話iPhone 13 Pro / 14 Pro釘子戶,不如現在就換 17 Pro 吧

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 真人无码作爱免费视频| 色噜噜一区二区三区| 竹菊影视欧美日韩一区二区三区四区五区| 午夜福利一区二区在线看| 亚洲精品成人7777在线观看| 通辽市| 深夜在线观看免费av| 日本一码二码三码的区分| 芳草地社区在线视频| ww污污污网站在线看com| 久久一夜天堂av一区二区| 国产精品无码一区二区三区电影| 人妻内射视频麻豆| 成在线人免费视频| 亚洲国产永久精品成人麻豆| 亚洲av永久无码精品成人| 亚洲精品日韩中文字幕| 国产精品综合在线免费看| 护士张开腿被奷日出白浆| 激情国产av做激情国产爱| 成人性生交片无码免费看| 成人亚洲一级午夜激情网| 啊┅┅快┅┅用力啊岳网站| 亚洲欧洲日韩国内高清| 夜夜爽77777妓女免费看| 成人无码区在线观看| 久久一卡二卡三卡四卡| 性欧美老人牲交xxxxx视频| 亚洲综合一区二区精品导航| 午夜男女爽爽影院在线| 亚洲人成电影在线天堂色| 图片区 小说区 区 亚洲五月 | 日本国产精品第一页久久| 18岁日韩内射颜射午夜久久成人| 精品久久久久久中文字幕202| 办公室强奷漂亮少妇视频| 好爽毛片一区二区三区四| 日本一区二区三区在线 |观看| 国产成AV人片在线观看天堂无码| 鸡西市| 亚洲国产精品一区二区第一页|