清華和斯坦福的團(tuán)隊(duì)最近搞出個(gè)Ctrl-World系統(tǒng),這東西直接解決了機(jī)器人訓(xùn)練的老大難問(wèn)題,以前機(jī)器人學(xué)個(gè)新動(dòng)作,又費(fèi)錢又費(fèi)時(shí)間,現(xiàn)在用虛擬環(huán)境預(yù)演,效率直接提上去了。
我之前去一家汽車零部件廠,看見(jiàn)師傅調(diào)試機(jī)械臂,光搭測(cè)試場(chǎng)景就花了3天,還得擔(dān)心機(jī)械臂磕著碰著,畢竟修一次就不少錢。
![]()
這種傳統(tǒng)方式,不光慢,成本還賊高,有時(shí)候調(diào)試一次的錢,夠買好幾臺(tái)普通電腦了。
而且就算花了這么多功夫,機(jī)器人遇到?jīng)]見(jiàn)過(guò)的任務(wù),比如抓個(gè)角落的零件、疊條帶花紋的毛巾,能干成的概率也不高。
也正是因?yàn)檫@些麻煩,清華和斯坦福的團(tuán)隊(duì)才琢磨出Ctrl-World這么個(gè)解決方案,說(shuō)真的,這思路一出來(lái),行業(yè)里不少人都眼前一亮。
這系統(tǒng)不用真的讓機(jī)器人在現(xiàn)實(shí)里瞎試,就在虛擬環(huán)境里練,只用了400條虛擬軌跡,就把機(jī)器人做陌生任務(wù)的本事往上提了不少。
![]()
斯坦福的ChelseaFinn老師在X上發(fā)了好幾條推文說(shuō)這事兒,我覺(jué)得她說(shuō)得特實(shí)在,生成好看的視頻容易,難的是讓模型真對(duì)機(jī)器人有用,這系統(tǒng)剛好做到了,既跟得上動(dòng)作,又不會(huì)經(jīng)常出“幻覺(jué)”。
以前機(jī)器人訓(xùn)練有個(gè)大問(wèn)題,就是“看不全”。
比如機(jī)械臂夾東西,只從一個(gè)角度看,根本搞不清夾沒(méi)夾住,經(jīng)常出現(xiàn)“東西沒(méi)碰著就挪走”的離譜情況。
![]()
Ctrl-World就給機(jī)器人裝了倆“眼睛”,一個(gè)是第三人稱的全局視角,能看見(jiàn)整個(gè)環(huán)境;另一個(gè)是腕部的第一人稱視角,專門盯機(jī)械臂和東西接觸的細(xì)節(jié)。
這倆視角一結(jié)合,效果立馬就出來(lái)了。
測(cè)試的時(shí)候,畫面跟真實(shí)場(chǎng)景的貼合度高了不少,那種不符合物理規(guī)律的“幻覺(jué)”少了很多。
本來(lái)想以為這只是小改進(jìn),后來(lái)看數(shù)據(jù)才知道,峰值信噪比和結(jié)構(gòu)相似性都比單視角模型好不少,這對(duì)需要精細(xì)操作的活兒太重要了,比如組裝芯片、擰小螺絲,差一點(diǎn)點(diǎn)都不行。
![]()
還有個(gè)問(wèn)題是“控不準(zhǔn)”。
以前機(jī)器人動(dòng)一下,系統(tǒng)反應(yīng)跟不上,想讓它挪1厘米,可能挪多了也可能挪少了。
Ctrl-World搞了個(gè)幀級(jí)動(dòng)作控制,把機(jī)器人的動(dòng)作變成參數(shù),每一幀的畫面都跟動(dòng)作對(duì)應(yīng)上。
我特意問(wèn)過(guò)做機(jī)器人的朋友,他說(shuō)這就像給機(jī)器人裝了“精準(zhǔn)導(dǎo)航”,哪怕就動(dòng)0.5厘米,畫面也能跟上,不會(huì)跑偏。
另外,機(jī)器人練久了還容易“忘事兒”,練著練著就跟真實(shí)情況脫節(jié)了。
![]()
這系統(tǒng)又加了個(gè)姿態(tài)記憶功能,從以前的訓(xùn)練記錄里挑關(guān)鍵幀,遇到類似動(dòng)作就拿出來(lái)參考。
這招挺聰明的,現(xiàn)在機(jī)器人能穩(wěn)定練20秒以上,不會(huì)練著練著就“走樣”,就算換個(gè)相機(jī)角度,也能適應(yīng)。
Ctrl-World不只是在實(shí)驗(yàn)室里好用,落地到實(shí)際場(chǎng)景里也特實(shí)在。
美的就在空調(diào)組裝線上試過(guò),以前調(diào)試一條生產(chǎn)線要7天,現(xiàn)在用這系統(tǒng),1天就搞定了,誤操作率也降了不少,單條生產(chǎn)線一年能省80多萬(wàn)。
![]()
本來(lái)想以為這技術(shù)只適合大工廠,后來(lái)發(fā)現(xiàn)家庭機(jī)器人也能用。
比如家里的機(jī)器人要收拾不規(guī)則的廚具、疊褶皺的衣服,以前得花兩天搭場(chǎng)景適配,現(xiàn)在用Ctrl-World,倆小時(shí)就搞定了,成本還降了九成。
還有救災(zāi)機(jī)器人,能在虛擬里模擬地震廢墟、火災(zāi)濃煙的環(huán)境,先預(yù)演好路徑再去真的救災(zāi),既安全又省設(shè)備。
不過(guò)這系統(tǒng)也不是完美的。
遇到液體傾倒、東西高速碰撞的場(chǎng)景,虛擬和真實(shí)還有點(diǎn)差距。
![]()
團(tuán)隊(duì)說(shuō)接下來(lái)要把強(qiáng)化學(xué)習(xí)加進(jìn)去,讓機(jī)器人在虛擬里自己找最優(yōu)方法,還打算擴(kuò)大訓(xùn)練數(shù)據(jù),覆蓋更多復(fù)雜場(chǎng)景。
我覺(jué)得這方向挺對(duì)的,畢竟機(jī)器人自己能琢磨,比人一點(diǎn)點(diǎn)教省事多了。
我覺(jué)得Ctrl-World最牛的不是數(shù)據(jù)多好看,是它把虛擬和真實(shí)打通了。
以前虛擬訓(xùn)練總怕和實(shí)際脫節(jié),現(xiàn)在這系統(tǒng)的虛擬預(yù)演和真實(shí)表現(xiàn)相關(guān)系數(shù)能到0.87,說(shuō)明真能用得上。
對(duì)企業(yè)來(lái)說(shuō),能省成本;對(duì)用戶來(lái)說(shuō),以后家里的機(jī)器人能更快適應(yīng)新任務(wù)。
![]()
機(jī)器人行業(yè)以前總被成本和效率卡脖子,Ctrl-World這思路算是開(kāi)了個(gè)好頭。
以后要是能做成通用訓(xùn)練平臺(tái),讓機(jī)器人既能聽(tīng)懂話,又能在虛擬里練好技能,那機(jī)器人普及就快多了。
不管是工廠里的機(jī)械臂,還是家里的服務(wù)機(jī)器人,都能少走不少?gòu)澛罚@才是真的幫行業(yè)解決問(wèn)題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.