<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      終結(jié)機器人評測混戰(zhàn)時代,RoboChallenge帶來大規(guī)模真機測評基準(zhǔn)

      0
      分享至



      當(dāng)前機器人行業(yè)呈現(xiàn)兩極分化態(tài)勢。一邊是競技賽事的火熱,如2025年世界人形機器人運動會吸引了全球16個國家280支隊伍參與,另一邊卻是現(xiàn)實核心技術(shù)仍然面臨瓶頸,某企業(yè)人形機器人因末端執(zhí)行器精度不足,導(dǎo)致工業(yè)場景中的精密作業(yè)效率甚至比不上人工。

      這種理想與現(xiàn)實的落差,在資本層面表現(xiàn)得更為明顯。今年前七個月,具身智能與機器人領(lǐng)域融資金額已突破240億元,遠超去年全年總和。面對層出不窮的機器人公司和產(chǎn)品,投資者卻陷入困惑:如何判斷哪些企業(yè)真正掌握核心技術(shù)?哪些產(chǎn)品具備長期落地的潛力?

      行業(yè)缺乏的,正是一個能夠客觀衡量機器人能力的標(biāo)尺。

      對此,由Dexmal原力靈機聯(lián)合Huggingface共同發(fā)起的全球首個大規(guī)模真機基準(zhǔn)測試集RoboChallenge,為具身智能真機評測提供了有效標(biāo)準(zhǔn)。



      那么,為什么具身智能行業(yè)急需一個統(tǒng)一測評標(biāo)準(zhǔn)?RoboChallenge真機基準(zhǔn)測試平臺又從哪些層面攻克了行業(yè)難點呢?



      在算法和模型的世界里,基準(zhǔn)測試早已是推動進步的發(fā)動機。計算機視覺有ImageNet,自然語言處理有GLUE,每一項突破都以公開、可復(fù)現(xiàn)的排行榜為標(biāo)尺,激發(fā)了無數(shù)創(chuàng)新。而機器人領(lǐng)域長期沒有類似的標(biāo)準(zhǔn)體系。

      對機器人能力的評估始終在兩個極端搖擺。

      一端是那些刷屏社交網(wǎng)絡(luò)的機器人項目。無論是后空翻的人形機器人,還是展會現(xiàn)場表演泡咖啡,炫技式的展示雖然極易出圈,吸引大眾眼球,但更偏向于娛樂和營銷,無法反映機器人在通用、非結(jié)構(gòu)化環(huán)境中的真實能力。

      另一端是實驗室測試。在科研領(lǐng)域,研究人員會在仿真環(huán)境或高度結(jié)構(gòu)化的物理環(huán)境中測試機器人的某項特定能力,例如物體抓取成功率、路徑規(guī)劃效率等。但這些演示無法代表現(xiàn)實世界的復(fù)雜與不確定,也無法讓投資者、同行或市場知道,它們之間到底差多少、強在哪。



      缺乏基準(zhǔn)的后果,是整個行業(yè)信息失真。

      投資角度,評估難。投資者缺乏有效的技術(shù)評估工具,往往只能依賴于光鮮的演示視頻和創(chuàng)始團隊的背景來做判斷,這可能導(dǎo)致擅長演示的團隊可能比技術(shù)扎實的團隊更容易獲得融資。

      市場角度,劣幣驅(qū)逐良幣。當(dāng)演示效果重于實際效用時,企業(yè)的資源分配就會自然傾斜。本應(yīng)用于核心技術(shù)突破的研發(fā)精力,被迫分流到能夠快速制造傳播熱點的炫技功能上。

      而沒有公認的基準(zhǔn),技術(shù)就無法在同一維度上進行比較和衡量,也就難以形成清晰的技術(shù)演進路線圖。開發(fā)者們各自為戰(zhàn),重復(fù)造輪子。某個團隊已經(jīng)解決的經(jīng)典問題,可能在另一個團隊那里仍是攔路虎;某個領(lǐng)域的突破性進展,往往難以被準(zhǔn)確識別并快速擴散到整個行業(yè),整個行業(yè)的創(chuàng)新效率大打折扣。

      投資者、消費市場、技術(shù)發(fā)展都呼喚著一個更加強有力的真機測量標(biāo)準(zhǔn)來提供統(tǒng)一基座,推動具身智能行業(yè)良性發(fā)展。



      行業(yè)急需一套更全面、科學(xué)的具身智能真機測試標(biāo)準(zhǔn)。然而,要在真實環(huán)境中對機器人進行公平、可復(fù)現(xiàn)的評測,難度遠超想象。

      當(dāng)前行業(yè)內(nèi)的測試體系普遍面臨著三大痛點:測試場景碎片化,各機構(gòu)使用的環(huán)境、任務(wù)千差萬別;評估標(biāo)準(zhǔn)不統(tǒng)一,導(dǎo)致結(jié)果缺乏可比性;評測方法不夠系統(tǒng),難以全面反映機器人的真實能力水平。這些問題使得不同算法、不同硬件平臺的機器人表現(xiàn)如同使用不同尺子測量的身高:數(shù)據(jù)再多,也難以進行有意義的橫向比較。

      正是在這樣的行業(yè)背景下,由Dexmal原力靈機團隊和HuggingFace推出的RoboChallenge直面挑戰(zhàn),提出了全球首個大規(guī)模具身智能真機測評平臺,旨在通過科學(xué)評估體系為具身智能產(chǎn)業(yè)構(gòu)建一個開放、公正、可復(fù)現(xiàn)的真實考場。

      RoboChallenge的第一個顛覆性創(chuàng)新,是規(guī)模化、穩(wěn)定地解決了公平性難題。

      過去,機器人領(lǐng)域的基準(zhǔn)測試長期處于割裂狀態(tài):學(xué)術(shù)界的實驗多局限于單一模型或固定環(huán)境,缺乏跨平臺可比性,而企業(yè)的內(nèi)部測試又往往自成體系,難以形成行業(yè)共識。

      RoboChallenge則以大規(guī)模真機測試為核心,通過統(tǒng)一任務(wù)標(biāo)準(zhǔn)、統(tǒng)一評估指標(biāo)和跨模型對照機制,實現(xiàn)了真正的公平測評。

      為精準(zhǔn)評估VLA算法核心能力,RoboChallenge首期采用配備夾爪的機械臂作為標(biāo)準(zhǔn)化平臺,其傳感方案同步輸出多視角RGB與對齊深度信息。系統(tǒng)集成了UR5、Franka Panda、COBOT Magic Aloha和ARX-5四類主流機型,支持7×24小時不間斷運行。通過這種方式,在完全相同的初始條件和任務(wù)下,不同算法的實力得以被客觀地量化與呈現(xiàn)。RoboChallenge首次在真實物理環(huán)境中,實現(xiàn)了對多種主流機器人平臺的多任務(wù)、跨模型測試。

      RoboChallenge的另一大創(chuàng)新,是推出了遠程機器人評測模式。

      通過自研的遠程推理系統(tǒng),研究者即使不擁有實體機器人,也能在平臺上完成算法部署、任務(wù)執(zhí)行與結(jié)果驗證。

      平臺采用無容器化設(shè)計,用戶通過標(biāo)準(zhǔn)化API可直接調(diào)用;RGB圖像等觀測數(shù)據(jù)均帶有毫秒級時間戳,便于多模型融合與復(fù)雜時間對齊;系統(tǒng)通過HTTP API實現(xiàn)異步處理,并提供實時隊列反饋。同時,智能作業(yè)調(diào)度模塊可實時查看任務(wù)狀態(tài),支持模型多任務(wù)并行,大幅提升測試效率與系統(tǒng)穩(wěn)定性。

      這種“在線真機評測”在保證高精度與可復(fù)現(xiàn)性的同時,大幅降低了科研與創(chuàng)新門檻。對學(xué)術(shù)界,它提供了開放、免費的實驗資源;對產(chǎn)業(yè)界,它搭建了公平、高效的驗證平臺。全球研究者得以在統(tǒng)一環(huán)境、標(biāo)準(zhǔn)化流程下參與測試,真正實現(xiàn)“沒有機器人,一樣做實驗”。



      除了公平的測試基準(zhǔn)與遠程評測模式,一套科學(xué)、精細的評分體系同樣是衡量機器人能力的核心。

      當(dāng)前行業(yè)內(nèi)的真機評測往往只包含3到5項任務(wù),難以系統(tǒng)、全面地評估算法的綜合表現(xiàn)與泛化能力。而作為RoboChallenge推出的首套測試集,Table30以“科學(xué)分類學(xué)”為設(shè)計理念,從VLA、機器人類型、任務(wù)場景環(huán)境和目標(biāo)物體屬性等維度構(gòu)建了30個覆蓋多維度操作場景的桌面級任務(wù)。

      評分機制上,Table30突破傳統(tǒng)二值化評估局限,引入更符合實際應(yīng)用需求的進度評分系統(tǒng):對復(fù)雜任務(wù)認可分步進展,對簡單任務(wù)優(yōu)化完成效率。分揀、倒液體、開瓶蓋、疊放物體……這些看似簡單的任務(wù),實則高度還原了人類日常生活中的細微操作需求。優(yōu)秀的模型不應(yīng)只在某些任務(wù)上表現(xiàn)出色,更應(yīng)在整個任務(wù)矩陣中展現(xiàn)出穩(wěn)健、全面的能力。通過這種精細化、系統(tǒng)化的設(shè)計,Table30 能夠清晰測出不同模型之間的代際差距,將算法差異量化、可視化,為技術(shù)演進提供了可靠的衡量依據(jù)。

      官方學(xué)術(shù)論文《RoboChallenge: Real-robot based Large Scale Evaluation of Embodied Policies》則進一步證明了Table30基準(zhǔn)測試是有效且具有區(qū)分度的。研究顯示,在系列真實測試中,Pi05 模型在成功率和得分上均顯著領(lǐng)先,而多任務(wù)模型版本(/multi)普遍表現(xiàn)不如單任務(wù)版本。研究揭示,當(dāng)前不同VLA(視覺-語言-動作)模型之間存在顯著的性能差距,一個多指標(biāo)、公平且大規(guī)模的具身智能真機評測平臺是有意義的。



      值得注意的是,訪問RoboChallenge官網(wǎng),每個用戶都能看到RoboChallenge的評測任務(wù)列表。每個任務(wù)都包含任務(wù)名稱、狀態(tài)、提交次數(shù)、提交者、提交時間和得分等信息。用戶可以通過點擊任務(wù)名稱查看任務(wù)詳情,包括任務(wù)描述、評測指標(biāo)、提交記錄和模型表現(xiàn)等。此外,頁面還提供了篩選和排序功能,方便用戶查找感興趣的任務(wù)和評測結(jié)果。



      可以說,RoboChallenge并非一場短暫的賽事,而是一項長期構(gòu)建的行業(yè)基礎(chǔ)工程。它致力于建立一套可持續(xù)演進的任務(wù)體系,持續(xù)吸納來自社區(qū)和產(chǎn)業(yè)界的新挑戰(zhàn)場景;它要形成一個公開、可信的排行榜,使所有參與者都能從中看到自己在真實世界的坐標(biāo);它要積累起標(biāo)準(zhǔn)化的評測數(shù)據(jù),為投資、科研、產(chǎn)品化提供決策依據(jù)。

      而它的意義,遠不止于建立一套測試標(biāo)準(zhǔn),更在于打造一把源自中國的標(biāo)尺,為整個具身智能行業(yè)的長遠發(fā)展,注入持續(xù)而深刻的動力。



      每一項技術(shù)的成熟,都需要一把被全行業(yè)認可的公共標(biāo)尺。
      從ImageNet到COCO,從GLUE到MMLU,這些基準(zhǔn)不僅塑造了技術(shù)發(fā)展的格局,也定義了產(chǎn)業(yè)迭代的節(jié)奏。

      如今,RoboChallenge的問世讓具身智能也有了這樣的量尺:一個扎根現(xiàn)實、開放共建、可度量的真實舞臺。

      更重要的是,這是一個向所有人開放的舞臺。

      據(jù)悉,RoboChallenge堅持全面開放原則。平臺不僅向全球研究者免費提供測試服務(wù),還公開所有任務(wù)的演示數(shù)據(jù)與測試中間結(jié)果,真正實現(xiàn)了可復(fù)現(xiàn)、可驗證的透明度。這意味著,無論是頂尖實驗室還是初創(chuàng)團隊,都能在統(tǒng)一標(biāo)準(zhǔn)下對比成果、復(fù)現(xiàn)實驗、優(yōu)化算法。

      這種開放性,將打破機器人研發(fā)長期以來的高門檻與孤島化局面,促進行業(yè)共識的形成,加速學(xué)術(shù)成果與產(chǎn)業(yè)能力的雙向轉(zhuǎn)化。但它的意義遠不止于服務(wù)學(xué)術(shù)論文的發(fā)表和B端產(chǎn)業(yè)鏈,更在于真正推動測評技術(shù)走向C端,實現(xiàn)廣泛落地。

      如果你是研究人員,可以不再受限于仿真環(huán)境與實體硬件,在真實機器人上驗證你的想法;如果你是創(chuàng)業(yè)者,可以基于客觀數(shù)據(jù)展示你產(chǎn)品的真實能力,讓技術(shù)說話;技術(shù)愛好者甚至在校學(xué)生,也獲得了接觸前沿、親手參與的機會,人人都可以親手為機器人“跑個分”。



      目前,RoboChallenge已正式登陸Hugging Face平臺,面向全球開放其真機評測任務(wù)與數(shù)據(jù)集。平臺已發(fā)布三十個真實世界任務(wù)數(shù)據(jù)集,涵蓋擦桌、澆花、開關(guān)電器、堆疊積木、分類物品等多種具身操作場景,全面展示了機器人在現(xiàn)實環(huán)境下的感知與行動能力。所有任務(wù)數(shù)據(jù)均支持公開訪問與復(fù)現(xiàn)實驗,體現(xiàn)了RoboChallenge對“可比性、可復(fù)現(xiàn)、可共建”的堅持。



      正因如此,RoboChallenge不僅是一個評測平臺,它正逐漸成為機器人世界的公共基礎(chǔ)設(shè)施。

      它讓機器人不再停留于看起來聰明,而是必須在真實世界中“確實聰明”;讓投資判斷不再憑故事,而是扎實的數(shù)據(jù);讓研究不再各自為政,而能在同一套規(guī)則中進化。

      在未來幾年里,RoboChallenge也許會像當(dāng)年的ImageNet一樣,成為推動一個時代加速的引擎。它不是一場比賽,而是一面鏡子,讓整個行業(yè)照見自己的真實能力。

      而機器人世界的跑分時代,也終于要開始了。



      聲明:個人原創(chuàng),僅供參考

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      侃爺澳籍妻子打扮性感現(xiàn)身澳洲!內(nèi)衣內(nèi)褲外穿,超絕白絲大長腿

      侃爺澳籍妻子打扮性感現(xiàn)身澳洲!內(nèi)衣內(nèi)褲外穿,超絕白絲大長腿

      澳洲紅領(lǐng)巾
      2025-11-05 13:39:02
      一邊拍手叫好,一邊頭皮發(fā)麻!四川在全省推行中小學(xué)春秋假

      一邊拍手叫好,一邊頭皮發(fā)麻!四川在全省推行中小學(xué)春秋假

      教師吧
      2025-11-05 07:39:26
      不要混淆了,全國只有兩個行政新區(qū),重慶的兩江有望成為下一個

      不要混淆了,全國只有兩個行政新區(qū),重慶的兩江有望成為下一個

      童童聊娛樂啊
      2025-11-05 10:17:30
      預(yù)計我國將進入拉尼娜狀態(tài)!今年冬季,廣西或出現(xiàn)極端低溫

      預(yù)計我國將進入拉尼娜狀態(tài)!今年冬季,廣西或出現(xiàn)極端低溫

      南國今報
      2025-11-05 12:47:03
      外媒報道:特斯拉起火車門無法打開致5人死亡遭訴訟!網(wǎng)友:國內(nèi)新能源車企也要整改了

      外媒報道:特斯拉起火車門無法打開致5人死亡遭訴訟!網(wǎng)友:國內(nèi)新能源車企也要整改了

      大白聊IT
      2025-11-04 12:58:29
      事關(guān)供暖!河北5地最新消息

      事關(guān)供暖!河北5地最新消息

      魯中晨報
      2025-11-05 11:27:18
      廣東人注意:接到這個電話,別掛!

      廣東人注意:接到這個電話,別掛!

      南粵女聲
      2025-11-05 12:00:26
      華為Mate 新機曝光:11月6日,開啟預(yù)售!

      華為Mate 新機曝光:11月6日,開啟預(yù)售!

      科技堡壘
      2025-11-04 11:15:54
      特斯拉撞死一頭百斤野豬,交警判定司機需承擔(dān)全責(zé),車輛維修費2.3萬元

      特斯拉撞死一頭百斤野豬,交警判定司機需承擔(dān)全責(zé),車輛維修費2.3萬元

      環(huán)球網(wǎng)資訊
      2025-11-04 15:45:04
      女子勸鄰居別亂扔垃圾被打后續(xù):監(jiān)控曝光,鄰居信息被扒,已立案

      女子勸鄰居別亂扔垃圾被打后續(xù):監(jiān)控曝光,鄰居信息被扒,已立案

      以茶帶書
      2025-11-04 18:22:20
      財政部新設(shè)債務(wù)管理司 北大教授許云霄:推動政府債務(wù)管理從分散走向統(tǒng)一

      財政部新設(shè)債務(wù)管理司 北大教授許云霄:推動政府債務(wù)管理從分散走向統(tǒng)一

      封面新聞
      2025-11-05 16:09:03
      看哭了!舅舅18歲開始撫養(yǎng)三個外甥,九年時間感動全網(wǎng)!

      看哭了!舅舅18歲開始撫養(yǎng)三個外甥,九年時間感動全網(wǎng)!

      曉踏就是我
      2025-11-02 16:55:18
      死傷慘重!俄軍導(dǎo)彈從天而降,北約“大魚”被炸,烏克蘭新兵被炸

      死傷慘重!俄軍導(dǎo)彈從天而降,北約“大魚”被炸,烏克蘭新兵被炸

      荷蘭豆愛健康
      2025-11-05 08:00:37
      醫(yī)院亂象,副院長染指多名女醫(yī)生護士,被其中一人未婚夫當(dāng)街追砍

      醫(yī)院亂象,副院長染指多名女醫(yī)生護士,被其中一人未婚夫當(dāng)街追砍

      四月十九
      2024-09-23 14:59:37
      C羅打臉自己:以前說世界杯冠軍是最大的夢想,現(xiàn)在否定!

      C羅打臉自己:以前說世界杯冠軍是最大的夢想,現(xiàn)在否定!

      氧氣是個地鐵
      2025-11-05 17:18:18
      臺灣舉行大閱兵,場景太凄涼了

      臺灣舉行大閱兵,場景太凄涼了

      遠方青木
      2025-11-05 00:12:54
      我中獎300萬后回鄉(xiāng)下養(yǎng)老,弟弟問我中了多少,我謊稱只有8萬

      我中獎300萬后回鄉(xiāng)下養(yǎng)老,弟弟問我中了多少,我謊稱只有8萬

      白云故事
      2025-11-03 20:40:03
      放棄洋帥!足協(xié)做出重大決定,國足主帥四選一,一人手握兩大優(yōu)勢

      放棄洋帥!足協(xié)做出重大決定,國足主帥四選一,一人手握兩大優(yōu)勢

      籃球圈里的那些事
      2025-11-05 14:02:52
      對烏克蘭影響最大的不在戰(zhàn)場,而在這里……

      對烏克蘭影響最大的不在戰(zhàn)場,而在這里……

      山河路口
      2025-11-04 14:04:32
      當(dāng)面硬剛!范戴克直播中再懟魯尼,有理有據(jù),爭執(zhí)現(xiàn)場太刺激

      當(dāng)面硬剛!范戴克直播中再懟魯尼,有理有據(jù),爭執(zhí)現(xiàn)場太刺激

      夜白侃球
      2025-11-05 11:16:17
      2025-11-05 17:35:00
      腦極體 incentive-icons
      腦極體
      從智能密鑰到已知盡頭
      3495文章數(shù) 167145關(guān)注度
      往期回顧 全部

      科技要聞

      大轉(zhuǎn)彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      苦等14年 50歲貝克漢姆獲封英國王室最高爵士頭銜

      頭條要聞

      苦等14年 50歲貝克漢姆獲封英國王室最高爵士頭銜

      體育要聞

      開拓者的11號簽,變成了灰熊未來核心?

      娛樂要聞

      港星林尚武突發(fā)心臟病去世

      財經(jīng)要聞

      中方官宣!對美關(guān)稅,調(diào)整!

      汽車要聞

      首家"A+H"豪華新能源車企 賽力斯登陸港交所主板

      態(tài)度原創(chuàng)

      時尚
      本地
      教育
      健康
      公開課

      壞了,看到劇本殺鼻祖了!

      本地新聞

      秋顏悅色 | 在榆中,秋天是一場盛大的視覺交響

      教育要聞

      解一元一次方程!

      超聲探頭會加重受傷情況嗎?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲精品久久久久久无码色欲四季| 吉川爱美一区二区三区视频| 亚洲日韩久热中文字幕| 欧美成人午夜精品免费福利| 免费无码无遮挡裸体视频在线观看| 亚洲av熟女国产一二三| 青青草原国产精品啪啪视频| 18av千部影片| 国产精品久久久久久无毒不卡| 亚洲av色精品一区二区| 内射毛片内射国产夫妻| 偷自拍另类亚洲清纯唯美| 婷婷丁香五月六月综合激情啪| 国产成年码AV片在线观看| 久久毛片少妇高潮| 日本三级香港三级人妇99| 欧洲美熟女乱又伦免费视频| 亚洲综合伊人久久综合| 国产精品系列在线免费看| 国产线播放免费人成视频播放 | 国产精品大片中文字幕| 日韩欧美亚洲综合久久| 91色老久久精品偷偷蜜臀| 国产成人A在线视频免费| 国产精品极品美女自在线观看免费| 国产又色又爽又黄的| 一区二区三区国产偷拍| 好大好硬好爽免费视频| 国产精品小视频一区二页| 精品 日韩 国产 欧美 视频| 中文字幕一区二区久久综合| 97午夜理论电影影院| 国产日韩精品一区在线不卡| 无套内谢少妇毛片在线| 亚洲成A人片在线观看的电影| 开心五月深深爱天天天操| 国产一区二区三区乱码| 国产桃色在线成免费视频| 男人的天堂av社区在线| 中文字幕人乱码中文| 国产伦视频一区二区三区|