【智車(chē)派新聞】近日,理想汽車(chē)自動(dòng)駕駛研發(fā)高級(jí)副總裁郎咸朋在接受媒體采訪時(shí)回顧了理想智駕團(tuán)隊(duì)發(fā)展演變歷程,并首次回應(yīng)外界對(duì)VLA的質(zhì)疑。
![]()
據(jù)智車(chē)派了解,今年3月理想發(fā)布VLA技術(shù)后,競(jìng)爭(zhēng)對(duì)手和行業(yè)觀察者在落地可行性、技術(shù)路線選擇等方面提出不同看法。如博世智能駕駛與控制系統(tǒng)事業(yè)部(XC)中國(guó)區(qū)總裁吳永橋認(rèn)為,VLA落地有“多模態(tài)的特征對(duì)齊非常困難”等多個(gè)難點(diǎn)。華為智能汽車(chē)解決方案BU CEO靳玉志稱(chēng),華為不會(huì)走向VLA的路徑,而是更看重WA(World Action)路徑。
對(duì)此,郎咸朋進(jìn)行了詳細(xì)回應(yīng):
第一是多模態(tài)對(duì)齊。據(jù)了解,博世不自研基座模型,也幾乎沒(méi)做過(guò)大模型相關(guān)工作。但我們成立了基座模型研發(fā)團(tuán)隊(duì),智駕團(tuán)隊(duì)之前做VLM時(shí)也做過(guò)視頻和文本的多模態(tài)對(duì)齊,這方面能力我們已經(jīng)積累很多。這確實(shí)有難度,但難才有技術(shù)含量,對(duì)我們來(lái)說(shuō)不是問(wèn)題。
第二是數(shù)據(jù)訓(xùn)練和提取。博世自己的數(shù)據(jù)量不大,但不能簡(jiǎn)單認(rèn)為我們也沒(méi)有很多數(shù)據(jù)。我們摟著采,到現(xiàn)在還有十幾億公里的數(shù)據(jù)。
第三是大語(yǔ)言模型的幻覺(jué)。不能完全站在生成式數(shù)據(jù)角度來(lái)考慮,生成圖像、文本。隨著模型這幾年不斷迭代,幻覺(jué)越來(lái)越少。而且我們有強(qiáng)化學(xué)習(xí)、有超級(jí)對(duì)齊,有辦法解決模型幻覺(jué)。
靳總說(shuō)的也同理。我們已經(jīng)做完端到端,過(guò)程中發(fā)現(xiàn)corner case的數(shù)據(jù)收集,最重要的是數(shù)據(jù)分布和數(shù)據(jù)質(zhì)量。現(xiàn)在就是corner case分布不均衡,收集數(shù)據(jù)困難,確實(shí)挑戰(zhàn)很大。即使有很多數(shù)據(jù),也不可能窮盡世界上所有場(chǎng)景。必須讓系統(tǒng)有人類(lèi)這種思維推理能力才可以,簡(jiǎn)單泛化不行。
![]()
郎咸朋認(rèn)為,他們反對(duì)VLA,恰恰說(shuō)明VLA是正確的。出于市場(chǎng)競(jìng)爭(zhēng)和技術(shù)演進(jìn)的考慮,在VLA和端到端上線初期,我們首先要保證它們?cè)诎踩缘木S度上做得不差,之后再去逐步提高上限。他表示,理想VLA的能力現(xiàn)在還沒(méi)有完全發(fā)揮出來(lái),到今年底、明年初,大家就能看到一些非常好的表現(xiàn),用戶會(huì)覺(jué)得這輛車(chē)真的活了。
郎咸朋還認(rèn)為,VLA可以實(shí)現(xiàn)L4,但以后一定還會(huì)有新技術(shù)出來(lái)。他指出,開(kāi)車(chē)這件事并不需要很復(fù)雜的技術(shù)或很高的智商,一般人都能學(xué)會(huì)開(kāi)車(chē),所以VLA夠用。但技術(shù)本身會(huì)持續(xù)迭代,比如將來(lái)人工智能發(fā)展到讓每個(gè)人都像愛(ài)因斯坦或各領(lǐng)域?qū)<夷菢樱切枰萔LA更高級(jí)的技術(shù)才能實(shí)現(xiàn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.