<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      我在哪?要去哪?字節跳動Astra雙模型架構助力機器人自由導航

      0
      分享至

      機器之心發布

      機器之心編輯部

      在當今科技飛速發展的時代,機器人在各個領域的應用越來越廣泛,從工業生產到日常生活,都能看到它們的身影。然而,現代機器人導航系統在多樣化和復雜的室內環境中面臨著諸多挑戰,傳統方法的局限性愈發明顯。

      一、傳統導航瓶頸凸顯,Astra 應勢而生

      在復雜的真實世界中,移動機器人想要安全可靠地行走,必須解決三大挑戰:我要去哪?我在哪?我要怎么去?這正是目標定位、自我定位與路徑規劃三大導航核心問題。目標定位時,在某些應用中,目標可能通過自然語言或目標圖像提示指定,這就需要系統理解提示并在地圖中定位目標;自我定位要求機器人在地圖中確定自身位置,尤其是在像倉庫這樣高度重復且缺乏全局地標的復雜場景中,傳統導航系統常依賴人工地標,如 QR 碼;路徑規劃又分為全局規劃和局部規劃,全局規劃根據機器人位姿和目標位姿生成粗略路線,局部規劃則負責在避開障礙物的同時到達全局路徑上的中間路點。

      為解決這些任務,傳統導航系統通常由多個模塊組成,包含多個小模型或基于規則的系統。近年來,基礎模型的出現促使人們將小模型集成到更大的模型中以解決更多任務,但所需模型數量及如何有效整合仍有待探索。

      為了突破傳統導航系統的瓶頸,字節跳動研發了一種創新的雙模型架構 Astra。



      • 論文標題:Astra: Toward General-Purpose Mobile Robots via Hierarchical Multimodal Learning
      • 網站:https://astra-mobility.github.io/

      通過兩大子模型:Astra-Global 與 Astra-Local,在環境理解感知與實時規劃決策之間建立通路,為下一代智能體的 “通用導航能力” 打下基礎。Astra 遵循 System 1/System 2 理念,Astra-Global 負責低頻任務,如目標和自我定位;Astra-Local 管理高頻任務,包括局部路徑規劃和里程計估計。這種架構的出現,為移動機器人導航領域帶來了新的希望,有望徹底改變機器人在復雜室內環境中的導航方式。



      圖1: Astra模型概述

      二、Astra 雙模型架構揭秘,賦能機器人高效導航

      1. Astra-Global:全局定位的智慧大腦

      Astra-Global 作為 Astra 架構中的重要組成部分,猶如智慧大腦,承擔著關鍵的低頻任務,即自我定位和目標定位。它是一個多模態大語言模型(MLLM),能夠巧妙地處理視覺和語言輸入,在全局地圖中實現精準定位。其核心在于利用混合拓撲語義圖,將其作為上下文輸入,使得模型能夠依據查詢圖像或文本提示,在地圖中準確找到對應的位置。



      圖2: Astra-Global 架構

      在構建這個強大的定位系統時,離線映射是關鍵的第一步。研究團隊提出了一種離線方法來構建混合拓撲語義圖 G=(V,E,L)。在這個圖中,V 代表節點集合,通過對輸入視頻進行時間下采樣,并利用 SfM 估計近似的 6 自由度(DoF)相機位姿,將關鍵幀設為節點,這些節點編碼了相機位姿和地標引用;E 是基于節點相對位姿關系建立的無向邊集合,對于全局路徑規劃至關重要,它代表了幾何連通性;L 則是地標信息集合,通過 Astra-Global 從每個節點的視覺數據中提取語義地標,豐富了地圖的語義理解,地標存儲了語義屬性,并通過共視關系與多個節點相連。例如,在一個辦公室場景中,拓撲地圖構建確定了各個房間、走廊等位置的節點和連接關系,地標語義豐富則為這些節點添加了如 “會議室”“辦公桌區域” 等地標信息。地標共視圖表的構建進一步確保了不同節點間關于地標信息的一致性,使得機器人能夠更全面地理解場景。

      在實際定位過程中,Astra-Global 的自定位與目標定位功能展現出獨特的優勢。視覺 - 語言定位采用粗到精的兩階段過程。在粗定位階段,模型分析輸入圖像和定位提示,檢測地標并與預建地標地圖建立對應關系,同時通過視覺一致性過濾,依據圖像相似性進一步優化匹配結果,確定最終候選節點。如在一個倉庫環境中,機器人通過攝像頭獲取圖像,Astra-Global 能夠識別出貨架、叉車等地標,并與地圖中的地標信息匹配,篩選出可能的位置。在精定位階段,模型利用查詢圖像和粗定位輸出的候選節點,從離線地圖中采樣參考地圖節點,通過比較參考節點的視覺和位置信息,直接輸出查詢圖像的預測位姿,實現高精度定位。基于語言的目標定位同樣出色,模型根據自然語言指令,利用地圖中地標已有的功能描述,識別相關地標,再通過地標到節點的關聯機制,定位相關節點,獲取目標位置的圖像和 6 自由度位姿。比如,當用戶發出 “找到打印機” 的指令時,Astra-Global 能迅速在地圖中找到與 “打印機” 相關的地標節點,從而確定打印機的位置。

      為了讓 Astra-Global 具備強大的定位能力,研究團隊采用了精心設計的訓練方法。以 Qwen2.5-VL 為骨干,結合監督微調(SFT)和組相對策略優化(GRPO)。在 SFT 階段,準備包含不同任務的多樣化數據集,除了粗定位和精定位數據集外,還構建了如共視檢測、共視圖像選擇、運動趨勢估計等輔助任務數據集,以提升模型的空間理解能力。在 GRPO 階段,針對視覺 - 語言定位任務,利用基于規則的獎勵函數進行訓練,獎勵函數包括格式獎勵、地標提取獎勵、地圖匹配獎勵和額外地標獎勵等,通過不斷優化獎勵函數,提升模型在定位任務中的表現。實驗結果表明,GRPO 顯著提升了 Astra-Global 在零樣本場景下的泛化能力,如在未見過的家庭環境中,SFT + GRPO 方法的定位準確率達到 99.9%,超過同等數據量下 SFT-only 方法的 93.7% 。

      2. Astra-Local:本地規劃的智能助手

      Astra-Local 則是 Astra 架構中負責高頻任務的智能助手,它是一個多任務網絡,能夠從傳感器數據中高效地生成局部路徑并準確估計里程計。其架構包含三個核心組件:4D 時空編碼器、規劃頭和里程計頭,每個組件都發揮著不可或缺的作用。



      圖3: Astra-Local 架構

      4D 時空編碼器是 Astra-Local 的基礎組件,它旨在取代傳統移動性堆棧中的感知和預測模塊。首先是 3D 空間編碼器,它以 N 個環視圖像為輸入,通過 Vision Transformer(ViT)將圖像編碼為判別性特征表示,再利用 Lift-Splat-Shoot 將 2D 圖像特征轉換為 3D voxel 特征。為了訓練 3D 空間編碼器,采用自監督學習方式,通過 3D 體積可微神經渲染,利用深度和顏色圖像進行監督。對于缺乏深度標簽的情況,借助大尺度單目深度估計模型對齊稀疏深度傳感器數據后生成偽深度標簽。接著,4D 時空編碼器在 3D 編碼器的基礎上進行訓練,它以過去的 voxel 特征和未來時間戳為輸入,通過 ResNet 和 DiT 模塊預測未來 voxel 特征。經過預訓練的 4D 時空編碼器能夠生成當前和未來的環境狀態表示,為后續的路徑規劃和里程計估計提供有力支持。

      規劃頭基于預訓練的 4D 特征,結合機器人速度和任務信息(如目標位姿),通過基于 Transformer 的流匹配來生成可執行的軌跡。在復雜環境中,軌跡具有多模態特性,流匹配因其高效率成為實時系統中路徑規劃的理想方法。為了避免與各種障礙物發生碰撞,規劃頭引入了掩碼 ESDF 損失。通過計算 3D 占用地圖的歐幾里得空間距離場(ESDF)圖,并在 ESDF 圖上添加 2D 地面真實軌跡掩碼,有效地減少了碰撞率。實驗結果顯示,在包含許多未見擁擠場景的 OOD 數據集上,使用掩碼 ESDF 損失的方法在碰撞率和綜合得分方面都優于其他方法,充分證明了其在生成高質量軌跡方面的有效性。

      里程計頭的主要任務是利用當前和過去的 4D 特征以及額外的傳感器數據(如 IMU、車輪數據)來預測機器人的相對位姿。它通過訓練一個 Transformer 模型來融合不同傳感器的信息,每個傳感器模態的數據都經過特定的 tokenizer 處理,再結合模態嵌入和時間位置嵌入,輸入到 Transformer 編碼器中,最后利用 CLS token 預測相對位姿。在實驗中,與基于兩幀的基線方法相比,Astra-Local 的里程計頭在多傳感器融合和位姿估計方面表現出色,如在加入 IMU 數據后,旋轉估計精度大幅提升,整體軌跡誤差降低到約 2%,進一步加入車輪數據后,尺度穩定性和估計精度進一步增強,展示了其在多傳感器數據融合方面的優勢。

      三、實驗數據見證實力

      為了全面評估 Astra 的性能,研究團隊在多種不同的室內環境中展開了廣泛且深入的實驗,涵蓋了倉庫、辦公樓和家庭等場景。這些實驗不僅驗證了 Astra 在理論上的創新架構和算法的有效性,更展示了其在實際應用中的潛力和可靠性。

      1. 多模態定位能力

      Astra-Global 的多模態定位能力通過一系列實驗得到了驗證。在處理文本和圖像定位查詢時,Astra-Global 表現出色。對于目標定位任務,它能夠準確地根據文本指令在地圖中識別出匹配的圖像和位姿,例如當接收到 “找到休息的地方” 這樣的指令時,Astra-Global 能夠迅速定位到地圖中沙發等休息區域的位置信息。與傳統的視覺位置識別(VPR)方法相比,Astra-Global 具有較大優勢。在細節捕捉方面,傳統 VPR 方法常依賴全局特征,容易忽略像房間號這樣的精細細節,而 Astra-Global 能夠精準捕捉這些關鍵信息,避免在相似場景中出現定位錯誤。在視點變化的魯棒性上,Astra-Global 基于語義地標進行定位,即使相機角度發生較大變化,地標之間的相對位置關系保持不變,使其能夠更穩定地進行定位,而傳統 VPR 方法在面對大的視點變化時往往會出現定位偏差。在位姿精度上,當存在多個相似候選位置時,Astra-Global 能夠利用地標空間關系選擇最佳匹配位姿,在 1 米距離誤差和 5 度角誤差范圍內的位姿精度顯著高于傳統 VPR 方法,在倉庫環境中的位姿精度比傳統方法提升了近 30%+。



      圖4: 不同場景下Astra Global的定位精度都顯著高于傳統VPR方法

      2. 規劃與里程計性能

      Astra-Local 中規劃頭和里程計頭的性能同樣在實驗中得到了充分的評估。在規劃頭方面,研究團隊將其與 ACT 和擴散策略(DP)等方法進行了對比。在碰撞率、速度和得分等指標上,使用基于 Transformer 的流匹配和掩碼 ESDF 損失的 Astra-Local 規劃頭表現良好。在包含許多未見擁擠場景的 OOD 數據集上,Astra-Local 的碰撞率明顯低于其他方法,同時能夠保持較高的速度和綜合得分,充分證明了掩碼 ESDF 損失在減少碰撞風險方面的有效性。在里程計頭方面,通過在包含同步圖像序列、IMU 和車輪數據以及地面真實位姿的多模態數據集上進行實驗,結果顯示,與基于兩幀 BEV-ODOM 的基線方法相比,Astra-Local 的里程計頭在多傳感器融合和位姿估計方面具有較大優勢。加入 IMU 數據后,旋轉估計精度大幅提升,整體軌跡誤差降低到約 2%,進一步加入車輪數據后,尺度穩定性和估計精度進一步增強,有效提升了機器人在復雜環境中的運動控制和導航能力。



      圖5: 通過掩碼esdf loss可以顯著降低規劃頭的碰撞率



      圖6: 里程計任務頭通過transformer有效的融合多傳感器信息

      四、未來展望

      展望未來,Astra 有著廣闊的發展前景和應用潛力。在更廣泛的場景部署方面,Astra 有望拓展到更多復雜的室內環境,如大型商場、醫院、圖書館等。在大型商場中,Astra 可幫助機器人快速定位商品位置,為顧客提供精準的導購服務;在醫院里,能協助醫療機器人高效地運送藥品和物資,提高醫療服務效率;在圖書館中,可助力機器人整理書籍、引導讀者查找資料。

      然而,Astra 目前也存在一些需要改進的地方。對于 Astra-Global 模塊,當前的地圖表示雖在信息損失和 token 長度上取得了一定平衡,但在某些情況下仍可能缺乏關鍵的語義細節,影響定位的準確性。未來,研究團隊計劃深入研究替代地圖壓縮方法,在優化效率的同時,最大限度地保留重要語義信息,以提升定位精度。此外,現有的定位僅依賴單幀觀測,在特征缺失或高度重復的環境中可能會失效。為解決這一問題,后續將引入主動探索機制,讓機器人能夠主動感知周圍環境,并將時間推理融入模型,利用序列觀測實現更穩健的定位,使機器人在復雜環境中也能準確找到自身和目標的位置。

      在本地導航與控制方面,Astra-Local 模塊也有提升空間。在實際機器人部署中,受限于模型的泛化能力以及基于規則的回退系統在邊緣情況下容易誤觸發,導致回退率不可忽視。為了增強對分布外(OOD)場景的魯棒性,團隊將通過改進模型架構和訓練方法,使其能夠更好地應對各種未知情況。同時,重新設計回退系統,使其更緊密地集成到整個系統中,實現更無縫的切換,提高系統的穩定性和可靠性。此外,還計劃將指令跟隨能力集成到模型中,使機器人能夠理解和執行人類的自然語言指令,進一步拓展其在動態、以人為中心的環境中的可用性,實現更自然、高效的人機交互。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      此前獲活塞3年2400萬合同!曝馬利克-比斯利有意前往CBA打球

      此前獲活塞3年2400萬合同!曝馬利克-比斯利有意前往CBA打球

      狼叔評論
      2025-11-05 23:26:05
      43歲孫儷上班被偶遇,打扮好知性,身材真的很好,手里拿著保溫杯

      43歲孫儷上班被偶遇,打扮好知性,身材真的很好,手里拿著保溫杯

      情感大頭說說
      2025-11-04 14:27:52
      最高法政治部主任調整

      最高法政治部主任調整

      新京報
      2025-11-05 16:56:19
      就在剛剛!10月5日中午,中國跳水隊傳來全紅嬋 王偉瑩 王宗源消息

      就在剛剛!10月5日中午,中國跳水隊傳來全紅嬋 王偉瑩 王宗源消息

      皮皮觀天下
      2025-11-05 12:06:51
      “變了!這回中國頭一次明說:要爭老大”

      “變了!這回中國頭一次明說:要爭老大”

      觀察者網
      2025-11-05 11:10:16
      官宣大名單!中國男足迎2大強敵:王鈺棟領銜,交手韓國+亞洲冠軍

      官宣大名單!中國男足迎2大強敵:王鈺棟領銜,交手韓國+亞洲冠軍

      大秦壁虎白話體育
      2025-11-05 10:49:17
      家中有變?正式退出,王藝迪返回遼寧老家,此前剛奪冠,原因找到

      家中有變?正式退出,王藝迪返回遼寧老家,此前剛奪冠,原因找到

      樂聊球
      2025-11-05 15:10:40
      一路領跑,北方最強地級市“開掛”了?

      一路領跑,北方最強地級市“開掛”了?

      城市進化論
      2025-11-05 22:24:28
      記者:當初是佩普要國足跟越南打對攻,還開小會不讓陳洋參加

      記者:當初是佩普要國足跟越南打對攻,還開小會不讓陳洋參加

      懂球帝
      2025-11-05 14:43:13
      世界大湖真稀缺啊!全球面積超過1萬km2的才17個,僅5國獨自擁有

      世界大湖真稀缺啊!全球面積超過1萬km2的才17個,僅5國獨自擁有

      全城探秘
      2025-11-04 16:33:03
      英國夫妻為體驗生活樂趣,挑戰開電動車穿越法國,結果幾度大吵崩潰到離婚…

      英國夫妻為體驗生活樂趣,挑戰開電動車穿越法國,結果幾度大吵崩潰到離婚…

      最英國
      2025-11-04 20:22:19
      韓國警方逮捕114名柬埔寨電詐團伙成員

      韓國警方逮捕114名柬埔寨電詐團伙成員

      看看新聞Knews
      2025-11-04 23:44:03
      被收回歌曲版權,被除名,被官媒諷刺,云朵終究走上了一條不歸路

      被收回歌曲版權,被除名,被官媒諷刺,云朵終究走上了一條不歸路

      有范又有料
      2025-11-05 12:31:39
      臺當局要大陸答應兩條件,否則將不參加大陸舉辦的2026年APEC峰會

      臺當局要大陸答應兩條件,否則將不參加大陸舉辦的2026年APEC峰會

      滄海旅行家
      2025-11-04 20:25:15
      《依依向北風》劉達生退了,喬正君露真面目,俞樂山一招奪回所有

      《依依向北風》劉達生退了,喬正君露真面目,俞樂山一招奪回所有

      時尚的弄潮
      2025-11-05 14:29:09
      63歲演員吳鎮宇刷老年卡坐公交,被疑“冒用他人證件”險被趕下車,當場掏身份證自證清白

      63歲演員吳鎮宇刷老年卡坐公交,被疑“冒用他人證件”險被趕下車,當場掏身份證自證清白

      極目新聞
      2025-11-04 21:57:03
      任澤平:從“十五五”規劃看未來房地產的六大趨勢

      任澤平:從“十五五”規劃看未來房地產的六大趨勢

      澤平宏觀展望
      2025-11-05 19:39:22
      邵佳一上任或擴充國足選材庫 或絲滑進行新老交替

      邵佳一上任或擴充國足選材庫 或絲滑進行新老交替

      體壇周報
      2025-11-05 22:25:17
      克萊生涯最差賽季!獨行俠想棄用卻沒替代者,陣容畸形陷死循環

      克萊生涯最差賽季!獨行俠想棄用卻沒替代者,陣容畸形陷死循環

      夜白侃球
      2025-11-05 11:09:07
      金靖身材好絕啊,纖腰細腿比例絕佳,以前確實太低調了

      金靖身材好絕啊,纖腰細腿比例絕佳,以前確實太低調了

      阿廢冷眼觀察所
      2025-11-05 09:32:41
      2025-11-05 23:39:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11656文章數 142498關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      丈夫突然病亡2天后妻子也離世留下一兒一女 妹妹發聲

      頭條要聞

      丈夫突然病亡2天后妻子也離世留下一兒一女 妹妹發聲

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      事關加快建設金融強國 中央金融辦發聲

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      健康
      時尚
      數碼
      本地
      軍事航空

      超聲探頭會加重受傷情況嗎?

      今年一定要擁有這件大衣,復古又時髦!

      數碼要聞

      小米POCO X1平板現身Geekbench 搭載驍龍7+ Gen 3

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      軍事要聞

      美國“福特”號航母駛往加勒比海

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品亚洲А∨天堂免下载| 亚洲av日韩av一区久久| 国产精品久久蜜臀av| 亚洲国产制服丝袜先锋| 日本免费精品| 佛教| 亚洲综合网国产精品一区| 中文字幕有码高清日韩| 亚洲色大成网站www久久九九 | 日韩一区二区a片免费观看 | 免费无码又爽又刺激高潮虎虎视频| 亚洲男人第一无码av网| 1000部拍拍拍18勿入免费视频| 青青草无码免费一二三区| 亚洲av二区三区在线| 精品中文人妻在线不卡| 洛阳市| 人妻中文字幕不卡精品| 日本道之久夂综合久久爱| 久草国产视频| 精品国产成人国产在线观看| 欧美激情一区二区久久久| 国产福利免费在线观看| 18岁日韩内射颜射午夜久久成人| 色综合久久中文字幕综合网| 国产午夜福利片在线观看| 另类专区一区二区三区| 最新国产精品中文字幕| 国产福利精品一区二区| 久久精品日韩av无码| 免费无码成人AV在线播放不卡| 美女黄18以下禁止观看| WWW丫丫国产成人精品| 国产真人无码作爱视频免费| 亚洲高清免费在线观看| 久久精品国产亚洲成人av| 国产亚洲精品第一综合| 男人的天堂av一二三区| 国产精品视频一区不卡| 国产精品无码aⅴ嫩草| 日韩视频一区二区三区视频|