機器人訓練燒錢又低效,清華斯坦福聯手破局,成功率飆至83.4%
不夸張地說,機器人學干活比咱們養孩子難十倍都不止。
你想啊,教孩子抓筷子,頂多試個十幾次就會了。
可機器人練“抓取東西”這一個動作,得折騰出天大的陣仗,大小不一的塑料塊、滑溜溜的玻璃珠、軟塌塌的布料,光物體就得備上百種,桌面紋理換三種,燈光調五個亮度,就為了讓它“見多識廣”。
更糟的是,這活兒還特燒錢。
工廠里調試機械臂,撞壞個精密夾爪就得幾千塊,單輪測試下來,物體損耗加零件維修費輕松超千元。
最頭疼的是“認生”,練熟了抓方塊,換個帶弧度的訂書機立馬抓空,之前的功夫全白費。
但最近這僵局被徹底打破了。
斯坦福大學ChelseaFinn團隊和清華大學陳建宇團隊聯手搞出個“Ctrl-World”模型,直接給機器人裝了個“虛擬訓練場”,不用真機折騰,就在“想象”里練技能,陌生任務的成功率從38.7%一下飆到83.4%。
更牛的是,這技術早不是實驗室里的擺設,商業化跑得比大伙想的快多了。
其實說白了,以前機器人練技能總掉坑,核心就兩字:失真。
要么看不全細節,要么動作控不準,要么練著練著就跑偏。
Ctrl-World就是沖著這三個坑,挨個下了猛藥。
![]()
第一招是“雙視角觀察”,專治“看不全”的毛病。
以前的模型就像蒙著一只眼干活,只有個第三人稱視角,機械臂抓東西時,腕部和物體貼沒貼緊、夾得牢不牢,根本看不見。
這就導致經常出現幻覺,屏幕里物體沒碰到夾爪,居然自己“瞬移”進去了。
Ctrl-World直接給機器人配了“雙眼睛”:第三人稱視角當“遠視眼”,看清楚桌面布局這些全局信息;腕部視角當“近視眼”,專盯夾爪和物體的接觸細節。
還通過技術手段把兩個視角的信息拼在一起,就像咱們干活時既要抬頭看環境,又要低頭看手里的活。
數據說話,它的畫面相似度比傳統模型高15%以上,那種“隔空取物”的幻覺幾乎沒了。
第二招是“幀級動作控制”,實現“厘米級精準”。
這兒得跟大伙說清楚,機器人干活最忌“差不多”。
Z軸往下動4厘米是剛好抓住杯子,動6厘米就可能把杯子砸爛,差一點結果天差地別。
以前的模型管不住這種細節,現在Ctrl-World給每個動作都配了“分鏡腳本”,把機械臂的關節動作轉換成姿態參數,每幀畫面都和對應的動作死死綁定。
動作變一毫米,虛擬畫面就跟著變一點,絕不含糊。
實驗證明,要是去掉這功能,模型精準度直接掉10%,可見這招多關鍵。
![]()
第三招是“記憶校準”,治好了“越練越歪”的毛病。
以前虛擬訓練超不過10秒就亂套,物體位置跟真實物理規律差十萬八千里,練得越久錯得越遠。
Ctrl-World給機器人加了個“記憶庫”,會從之前的訓練軌跡里挑出相似的姿態當參考。
預測新畫面時,就對著歷史數據校準,相當于有人在旁邊隨時糾正:“哎,剛才手不是這么放的”。
這么一來,就算練20秒也不漂移,時序連貫性比傳統模型提升了近40%。
講真的,實驗室里的數據再好看,不如落地賺錢實在。
這項技術的核心研發者之一陳建宇,早就帶著技術闖市場了,創辦的“星動紀元”今年7月剛拿了近5億元A輪融資,產品都賣到全球頂尖科技巨頭手里了。
他們家的五指靈巧手、輪式服務機器人,全裝了類似Ctrl-World的“虛擬訓練模塊”。
就說工廠里的機械臂調試,以前一條汽車焊接生產線調試得停線一周,每天損失幾十萬產值;現在用虛擬預演,一天就能搞定,停線損失直接省了九成。
家庭場景里更顯本事。
面對“折疊帶花紋的毛巾”“抓異形水杯”這些活兒,機器人不用專家花幾萬塊標注數據,在虛擬里練幾遍就會了。
星動紀元的機器人已經能在酒店端菜、在家庭做清潔,甚至能幫老人拿藥,這些都是虛擬訓練的功勞。
![]()
從另一個角度看,整個行業都跟著沾光。
斯坦福不光搞出模型,今年2月還開源了“ToddlerBot”平臺,6000美元就能攢出一個有30個自由度的人形機器人,連沒硬件經驗的學生三天都能裝好。
更方便的是,虛擬里練的技能能直接用到真機上,大大降低了研究門檻。
智源研究院10月剛發布的Emu3.5模型也跟上了節奏,借鑒了類似的動態模擬思路,推理速度直接快20倍。
以前機器人算10秒的動作軌跡,現在半秒就搞定,反應跟人手似的靈敏。
不夸張地說,這些進展正在改寫行業規則。
以前機器人訓練是“砸錢堆經驗”,練100條折疊毛巾的軌跡,得資深工程師花20小時,成本超萬元;現在用Ctrl-World生成400條虛擬軌跡,成本才是傳統方法的1/20。
就拿基礎策略π?.?來說,微調后抓沒見過的手套、訂書機,成功率從25%升到75%,這提升太實在了。
機器人不用真機就能“腦補”練技能,真不是唬人的黑科技,是能幫工廠省成本、幫家庭添幫手的硬實力。
從清華斯坦福的實驗室,到星動紀元賣向全球的產品,再到6000美元就能搞定的開源機器人,這條路已經走通了。
![]()
以前覺得人形機器人進家庭得等十年,現在看,有了這種“虛擬教練”,說不定三五年后,家里的機器人就能自己疊衣服、做飯,這日子真不遠了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.