10月30日,ArmUnlocked2025 AI技術峰會終于來到了深圳。作為Arm與國內科技公司、芯片合作伙伴、行業專家以及開發者們的交流盛會,此次大會設有軟件和產品展示區,同時也設置了消費電子、智能汽車、邊緣AI、基礎設施和開發者等多個專場論壇,聚焦 AI 計算在這些關鍵領域的前沿技術創新與產業落地實踐。
![]()
Arm架構作為目前計算領域運用最廣泛的架構之一,可以說已然滲透到各行各業,特別是Arm架構在能效和AI性能層面的優勢,使其成為AI時代各類設備的最佳選擇之一,因此,此次大會也是吸引了眾多關注,雷科技也應邀前往深圳會場,給大家帶回一手報道。
Arm LumexCSS來了,面向AI時代而生
在ArmUnlocked深圳現場,Arm終端事業部產品管理副總裁JamesMcNiven詳細介紹了Arm LumexCSS平臺的架構與性能提升。該平臺是Arm面向旗艦智能手機和下一代個人計算設備推出的計算子系統平臺,采用“AI優先”(AI-first)的全新設計理念。
Arm LumexCSS基于最新的Arm v9.3-A架構打造,這也使其與前代相比有眾多的升級,比如全新的C1系列CPU集群和全新的SME2矩陣擴展指令集,這也是Arm首次將專用矩陣運算加速單元直接集成到CPU核心。
![]()
讓我們先來聊聊C1系列CPU集群。作為Arm LumexCSS的核心,C1 CPU 集群采用3nm制程工藝打造,IPC再次實現了雙位數百分比的性能提升。同時,該平臺還為開發者準備了更多的CPU產品矩陣,讓開發者可以根據需求更細致地定制CPU設計,深度適配不同場景、設備的需求。
其中,作為旗艦級CPU的Arm C1-Ultra超大核相比前代Cortex-X925,在單線程峰值性能上提升高達25%,擁有了更強的處理能力。而主打高效性能平衡的Arm C1-Pro大核相較上一代Cortex-A725,在相同主頻下持續性能提升16%的,并在實現相同性能輸出的情況下,能效提升幅度達到 12%。
除此之外,Arm這次也介紹了兩款針對不同細分市場的新內核,其中面向次旗艦手機設備的Arm C1-Premium比Arm C1-Ultra在性能接近的情況下面積縮小約35%,顯著降低芯片成本。面向穿戴設備的Arm C1-Nano,則完全是把能效最大化作為首要目標,讓迷你設備也能擁有足夠的性能。
而且,Arm LumexCSS還擁有全新的MaliG1-UltraGPU,除了在圖形和AI推理等方面得到雙位數百分比的性能提升外,還集成了第二代光線追蹤技術 (RTUv2),使移動端GPU的光線追蹤性能相比上代提升兩倍。
![]()
可以說,單看硬件性能,Arm LumexCSS就已經相當不錯了,而這一代平臺的最大升級亮點,恰恰在于硬件背后的矩陣擴展技術,也就是我們前面提到過的SME2。
得益于SME2,CPU在AI推理方面實現了至多5倍的性能提升,同時在相同功耗下達到3倍的能效優化。據Arm公布的數據,通過SME2內置加速,語音識別等延遲敏感任務的響應速度大幅提高,在測試中,語音類工作負載延遲降低了4.7倍,音頻生成速度提升2.8倍,使得AI翻譯、AI會議紀要等方面的體驗得到顯著提升。
當然,SME2所帶來的提升并不止于此,其更大的意義在于讓CPU也可以承擔AI推理的任務,如此一來即使移動平臺本身沒有配備高性能NPU,也能夠得到足夠的AI性能來運行AI應用或服務。
SME2依托ArmCPU這一通用架構,使開發者無需針對各式NPU做額外適配或重寫算法,大多數移動設備上都能直接運行統一的CPU端AI計算。這一點極大降低了端側AI應用的開發門檻和推廣成本。簡言之,SME2讓通用計算平臺承擔AI推理,為開發者提供了一個“一次開發、廣泛適用”的便利途徑。
![]()
可以說,Arm LumexCSS平臺成功實現了性能、能效與靈活性的三管齊下。在相同功耗預算下,該平臺較前代實現了五倍AI性能提升且顯著降低能耗,讓開發者能夠在不犧牲電池續航的前提下部署更大更復雜的模型。
同時,Arm LumexCSS也能為端側設備提供了充分的算力盈余去支撐實時翻譯、智能助手、本地大模型推理等新興AI應用。在雷科技看來,Arm Lumex CSS就是為AI時代打造的全新平臺,通過系統級協同設計和軟硬件結合,Arm將讓AI計算變得無處不在且更加高效普及。
直面Arm終端副總裁:Lumex還有哪些亮點?
在主題演講及會議結束后,雷科技也得到了采訪Arm 終端事業部產品管理副總裁 James McNiven的機會,并且提問了一個雷科技讀者非常關注的問題:
“本次發布的第二代光線追蹤單元實現了兩倍的性能提升。您如何看待這一改進對移動游戲生態的影響?此外,是否有可能通過人工智能技術,使原本不支持光線追蹤效果的游戲也能夠呈現出類似的視覺體驗?”
amesMcNiven回答稱,第二代光線追蹤單元的核心價值在于大幅擴展了游戲開發者在光照效果上的創作空間。過去由于性能所限,手游中的光線追蹤只能應用于局部場景,而隨著性能翻番,開發者有望逐步實現全場景的實時光線追蹤,帶來更加全面、自然的光影呈現。
他舉例說,在UnrealEngine5的內部測試場景中,去年采用傳統光追時渲染幀率僅約26~27FPS,而在嘗試將光追計算改為軟件實現后,雖然理論性能提高,但畫面質量并未同步改善。而全新的MaliG1-Ultra在同一場景下幀率提升了約40%,并且光照效果更加真實、細膩。
![]()
這證明了硬件級光追在性能和精確度上具有明顯優勢,能夠實現“更高幀率下的更高畫質”。隨著移動GPU光追能力的攀升,手游中的光影表現有望接近主機游戲的水準,這將極大提升高端玩家對移動平臺的認可度。
至于“能否通過AI讓不支持光追的游戲呈現類似視覺效果”的提問,McNiven表示這是“可以期待”的方向。他解釋道,借助神經網絡等AI技術,有機會為游戲圖形渲染帶來更多創新。例如,通過訓練特定模型,AI可以在傳統光柵化畫面上模擬出更高級的光影與細節效果,彌補原始畫面的不足。
當然,具體效果取決于所使用的模型,但總體可以預見:未來AI驅動的圖形渲染將在光照表現上取得巨大突破。不過他也坦言,就當前而言,硬件原生光追在精確度和畫質上仍有不可替代的優勢,AI渲染暫時是補充而非完全替代。
同時,作為一名游戲愛好者,McNiven表示他本人對神經圖形技術充滿期待,希望看到它在移動平臺上釋放更大的潛能與創意。
除此之外,James McNiven也回答了不少關于SME2的提問,表示SME2將矩陣加速能力直接集成進CPU,不僅大幅降低了延遲,更具備廣泛的適配性和部署靈活性,開發者無需為不同設備重復適配,有助于AI應用快速落地。
James McNiven還指出Arm的C1架構在處理快速迭代的AI模型時,展現出強大的通用性和計算彈性,也進一步凸顯CPU在異構計算體系中的重要角色。同時,針對未來端側AI的“殺手級”應用潛力,Arm認為游戲和個性化助理等場景將成為推動消費者換機的核心動力,而LumexCSS已經為此做好準備。
以騰訊和vivo等合作案例為例,SME2已在AI NPC、語音交互、本地推薦等功能中展現出顯著成效。James McNiven表示,Arm正通過軟硬件協同和系統級優化,為用戶帶來更沉浸、更智能的使用體驗,同時也加速AI從云端走向終端的變革。
在雷科技看來,隨著AI逐漸成為智能終端的核心賣點,用戶對于設備性能的關注點也從傳統的處理速度轉向了AI能力的強弱,而Arm正是這個浪潮背后最具話語權的推手。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.