【CNMO科技消息】11月5日,小鵬“科技日”正式舉行。本屆科技日以“涌現(Emergence)”為主題正式發布了第二代VLA視覺語言動作大模型。該系統以視覺為核心,融合語言理解與動作生成,不僅能大幅提升感知與推理效率,更能實現從“感知智能”到“決策智能”的跨越,被小鵬定義為“不僅是VLA大模型,更是世界模型”。
![]()
何小鵬稱,第二代VLA以視覺信號為主要輸入,通過近1億段視頻片段進行訓練,數據量相當于一個人駕駛65000年所經歷的極端場景總和。該系統通過“理解-推演-生成”的閉環機制,顯著降低信息傳遞中的損耗,實現更高效率的推理與更快的響應速度。小鵬強調,VLA 2.0的突破在于其“世界模型”屬性,能夠模擬物理世界的運行規律,從而在面對復雜路況時做出更接近人類駕駛員的判斷與決策。
![]()
在此處添加圖片標題
在硬件與算法層面,小鵬完成了從芯片、算子到模型的全棧自研與協同優化。其中,圖靈AI芯片能實現3至22倍的性能提升;針對性優化算子效率提升12倍;VLA 2.0模型訓練與推理效率提升10倍。
![]()
除了基礎駕駛決策,VLA 2.0還展現出“智能涌現”的新功能,例如手勢識別。車輛可識別用戶手勢指令,實現“招手即停”等互動操作,顯示出AI在理解非結構化指令方面的進步。
![]()
何小鵬還在科技日上宣布基于VLA 2.0的“小路NGP”(Narrow Road NGP)即將上線,實現從高速、城市道路到園區小路的全程無縫銜接。系統在復雜小路場景下的平均接管里程提升13倍,用戶將有望實現“每月僅1次接管”的高階智駕體驗,真正接近“車位到車位”的全場景貫通。
![]()
此外,小鵬在科技日上提出“物理AI”概念,強調人工智能不僅限于數字世界,更應具備與物理世界實時交互的能力。VLA 2.0正是這一理念的落地體現,它通過視覺與語言的聯合建模,讓機器具備了對真實環境的“認知-預測-生成”能力。
![]()
值得一提的是,何小鵬宣布,第二代VLA面向全球商業伙伴進行開源。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.