這幾天的WAIC上,AI芯片軍備競賽悄然變陣。曾經比拼的峰值算力標簽正逐漸褪色,取而代之的,是一場圍繞算力利用率的深層較量。如何讓每1TOPS的算力真正轉化為可用的性能,成為所有廠商無法回避的核心命題。
![]()
從云端萬卡集群到終端手機、汽車,無論場景如何,行業共識已經清晰。AI的未來,不在于有多少算力,而在于能用上多少。
![]()
云端集群算力再高,少一個因子全歸零
在云端,競爭早已超越單顆芯片的參數比拼,轉向集群整體效率的系統性博弈。
華為以超過800平米的黃金展位高調亮相,重點并非只是昇騰910C,而是其Matrix 384超節點架構。通過自研高速互聯技術,實現384個NPU之間的低延遲、高帶寬通信,直擊大模型訓練中算得快、傳不動的通信瓶頸。這不僅是硬件升級,更是對集群算力利用率的系統性突破。
![]()
華為昇騰384超節點
摩爾線程則提出AI工廠理念,強調從芯片、服務器到智算集群的全棧協同。摩爾線程展出AI萬卡集群液冷服務器MCCX D800 X2,將效率公式概括為:AI工廠生產效率 = 加速計算通用性 × 單芯片有效算力 × 單節點效率 × 集群效率 × 集群穩定性。其展出的MTT GPU、MCCX液冷服務器與KUAE集群,配合MUSA軟件棧,形成完整閉環,只有全鏈路優化,才能避免算力跑丟。
![]()
除了AI訓練和推理,摩爾線程還展示了自家GPU在不同場景下的應用,如數字服務、智能駕駛、智慧醫療、智能制造等。
![]()
其他廠商也各展所長。沐曦曦云C600國產化供應鏈,保障算力供給的穩定性。燧原科技則深耕推理場景,燧原S60以接近國際競品的性能和更高性價比,在美圖等實際業務中落地,體現用得值的務實邏輯。其慶陽智算中心萬卡S60推理集群,已于2025年1月起對外提供推理算力服務。
功耗紅線上的極限壓榨,端側無需裝核反應堆?
如果說云端追求的是規模效率,端側則是在功耗、成本、體積的極限約束下,實現算力的極致壓榨。
后摩智能推出的漫界M50芯片,僅10W功耗即實現160 TOPS算力,可支持70B參數大模型本地運行,能效比達到新高。愛芯元智同樣憑借高能效比打開市場,其AX170A芯片能效達13.4 TOPS/W,并在智能駕駛和手機影像領域實現規模化落地。
![]()
效率提升不止靠硬件。此芯科技通過集成CPU、GPU、NPU,實現片內資源高效調度。OPPO聯合芯片方推出的端側AI并行譯碼技術,性能提升超8倍,卻未顯著增加功耗。這正是軟硬協同的典型范例,不堆硬件,也能榨出更多性能。
根上重構效率,用RISC-V和稀疏計算掀翻英偉達?
除了優化現有路線,一些企業正從底層架構尋求突破。
算能科技推出基于RISC-V的服務器處理器SG2044,搭配新一代TPU BM1690,構建全棧國產的異構計算平臺。通過讓不同任務各歸其位,實現整體效率最大化,為AIGC等復雜負載提供新選擇。基于SG2044的高性能服務器產品已完成量產,軟硬件全棧國產化,可應用于通用計算、AIGC、智算中心、邊緣計算等場景。
![]()
墨芯人工智能則聚焦稀疏計算,其Antoum芯片支持高達32倍稀疏率,能自動跳過AI模型中的無效計算,將算力精準投向關鍵運算。這種深度結合算法特性的芯片設計,是對傳統蠻力計算的顛覆,也是提升實際利用率的創新方向。
WAIC 2025的芯片展區,已不再是參數的秀場,而是效率的試驗場。無論是集群通信優化、全棧協同、能效突破,還是架構創新,所有努力都指向同一個目標:讓算力真正可用、好用、用得起。
![]()
未來的贏家,未必是算力最高的,但一定是把算力用得最好的。誰能最懂應用、最擅系統優化,誰就能在AI的下半場,真正掌握話語權。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.