《科創板日報》11月5日訊(記者 黃心怡)在第八屆虹橋國際經濟論壇“人形機器人創新發展合作”分論壇上,宇樹科技創始人王興興發表了主題演講。
他表示,今年機器人產業非常非常火熱,個人比較樂觀估計,全中國智能機器產業平均每家公司增長至少超過50%-100%。
![]()
“原本這個數據是我猜的,但前段時間有個相對比較準確的出口數據,我國出口工業機器人增長54.9%。在工業機器人領域都有這樣的增長,那我覺得在智能機器人領域平均應該有100%的速度。今年非常火熱,全行業應該感謝各種政策的支持。”王興興稱。
王興興提到,機器人大模型進展速度比想象中慢了點,還沒達到臨界點。
“像我們做一些深度強化學習的全身運控,今年相對去年的進步是非常明顯的,全球有目共睹。這部分的技術進步在當下的每個月還非常快,但在具身大模型、端到端能干活領域的技術進步,比我原本想象的稍微會慢一點點,但總體還是非常快。”
王興興認為,目前機器人大模型的狀態相當于ChatGPT發布前1-3年。“大家已經發現了方向,但還沒有達到真正做出來的臨界點。”
對于具身智能模型和數據誰更值得關注,王興興認為,兩方面都值得改進。
“簡單的模型結構已經做了很多嘗試,泛化能力還不太夠,所以模型能力還需要創新。大家希望數據質量更好一點,有更大規模的數據,但對數據的采集、數據質量的評判還是非常困難。這兩部分相輔相成,需要花更多時間。而不是單單只是一股腦地去采集大量數據,或者一股腦把模型規模做大,這稍微有點盲目了,更多在模型結構、數據采集方式和質量上需要更多思考,這也是目前面臨比較大的問題。“
談及何時實現真正的具身智能“ChatGPT時刻”,王興興認為,真正的具身智能在“ChatGPT時刻”是在陌生的生活場景中,如果給機器人發送語音或文字,機器人大概能實現80%左右的任務。
“這個場景是人形機器人完全沒有預訓練過的,能達到80%左右的成功率,已經是非常突破性的技術了,而且基本可以達到ChatGPT時刻,這是非常非常重要的目標。未來一年到兩年,當然希望我們公司能實現。但說實在,目前全世界做AI還是概率成分、看運氣。如果明年、后年誰能把這個目標實現了,毋庸置疑應是全球最領先的具身智能AI模型。“
對于具身智能兩種主流模型——VLA和世界模型,王興興表示非常喜歡基于視頻生成的世界模型
“相對來說架構比較清晰干凈的VLA+RL模型,可以用仿真環境做訓練,或者用真實場景做訓練,這也是當下大家非常非常主流的模型,但也面臨很多挑戰,泛化能力相對來說不是特別夠。而基于視頻生成的世界模型,我個人還是非常喜歡。這個模型也面臨比較大的挑戰,中小型機器人公司這個模型跑不太動,因為視頻生成模型對算力的需求非常非常大,需要的算力卡是比較多的。反而是一些大的AI公司、互聯網公司對視頻模型的資源更加豐富,可以做出來的概率更大一點。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.