![]()
IDC數(shù)據(jù)顯示,2024年中國(guó)AI大模型解決方案市場(chǎng)規(guī)模達(dá)34.9億元,同比增長(zhǎng)126.4%,而MaaS(模型即服務(wù))市場(chǎng)更是實(shí)現(xiàn)215.7%的爆發(fā)式增長(zhǎng)。這背后,是MaaS 正通過(guò)“技術(shù)優(yōu)化+模式創(chuàng)新”,顯著降低企業(yè)AI應(yīng)用的綜合成本,使“低成本規(guī)模化”成為可能。
企業(yè)級(jí)AI規(guī)模化挑戰(zhàn)
與市場(chǎng)規(guī)模不斷增長(zhǎng)相對(duì)的,目前企業(yè)級(jí)AI應(yīng)用看似諸多落地,但又似乎有一些缺失。
首先是成本,英偉達(dá)預(yù)測(cè)2030年全球AI基礎(chǔ)設(shè)施開(kāi)支將達(dá)3-4萬(wàn)億美元,2025-2030年復(fù)合增長(zhǎng)率達(dá)38%-46%。
在不斷增加的基礎(chǔ)設(shè)施開(kāi)支的背后,是算力成本高企制約企業(yè)AI規(guī)模化應(yīng)用的痛點(diǎn),尤其對(duì)中小企業(yè)形成顯著門(mén)檻。據(jù)硅基流動(dòng)的運(yùn)營(yíng)數(shù)據(jù)顯示,單一企業(yè)大模型訓(xùn)練單次成本常超百萬(wàn),而推理階段的算力消耗更是持續(xù)產(chǎn)生的“剛性支出”。
以教育機(jī)構(gòu)為例,據(jù)測(cè)算,為100萬(wàn)用戶提供AI個(gè)性化學(xué)習(xí)服務(wù),僅GPU租賃費(fèi)用每年就需數(shù)千萬(wàn)元,遠(yuǎn)超其營(yíng)收承受能力。
成本壓力來(lái)自“低效使用”與“結(jié)構(gòu)失衡”雙重因素。一方面,算力資源利用率偏低。多數(shù)企業(yè)采用固定算力配置,無(wú)法根據(jù)業(yè)務(wù)潮汐波動(dòng)動(dòng)態(tài)調(diào)整,導(dǎo)致白天高峰期算力不足、夜間閑置期資源浪費(fèi)。
某電力巨頭在引入硅基流動(dòng)的動(dòng)態(tài)擴(kuò)縮容方案前,算力利用率僅為35%,夜間閑置算力占比達(dá)60%;另一方面,成本結(jié)構(gòu)不合理。英偉達(dá)算力雖性能強(qiáng)勁但價(jià)格昂貴,國(guó)產(chǎn)算力雖成本較低但需額外優(yōu)化投入,企業(yè)難以找到“性能”與“成本”的最佳平衡點(diǎn)。
這種成本失衡形成惡性循環(huán):企業(yè)因擔(dān)心投入回報(bào)比不足,不敢加大AI投入,導(dǎo)致應(yīng)用深度不夠,進(jìn)一步降低價(jià)值產(chǎn)出,最終陷入 “小投入-低產(chǎn)出-更少投入” 的困境。IDC數(shù)據(jù)顯示,中小企業(yè)AI平均投入僅320萬(wàn)元,不足大型企業(yè)的1/10,這使得其應(yīng)用集中于智能客服等基礎(chǔ)場(chǎng)景,難以實(shí)現(xiàn)深度業(yè)務(wù)變革。
除了成本之外,企業(yè)還面臨著“技術(shù)困局”。企業(yè)級(jí)AI應(yīng)用的技術(shù)復(fù)雜度遠(yuǎn)超個(gè)人場(chǎng)景,集中體現(xiàn)在算力管理與模型適配兩大難題上。算力管理層面,在國(guó)產(chǎn)算力崛起的背后,是企業(yè)逐漸面臨著“國(guó)產(chǎn)多品牌芯片+英偉達(dá)芯片”共存的異構(gòu)形態(tài),但不同芯片的指令集、優(yōu)化邏輯差異顯著,導(dǎo)致 “算力孤島” 現(xiàn)象普遍存在。對(duì)此,硅基流動(dòng)聯(lián)合創(chuàng)始人兼首席產(chǎn)品官胡健表示,硅基流動(dòng)觀察到,某能源企業(yè)早期部署的千卡級(jí)算力池,因缺乏統(tǒng)一納管工具,算力利用率不足40%,部分國(guó)產(chǎn)卡甚至處于閑置狀態(tài)。
模型適配的滯后性進(jìn)一步制約應(yīng)用深度。企業(yè)往往需要根據(jù)業(yè)務(wù)場(chǎng)景快速迭代模型,但傳統(tǒng)模式下,新模型適配周期長(zhǎng)達(dá)1~4周,且性能難以保障。胡健告訴筆者,稠密模型適配需數(shù)周,MoE類(lèi)模型因結(jié)構(gòu)復(fù)雜更是耗時(shí)良久。
即便企業(yè)翻越了“技術(shù)”與“成本”兩座大山,還將面臨安全合規(guī),與AI人才不足等困境,現(xiàn)階段對(duì)于企業(yè)AI應(yīng)用來(lái)說(shuō),一面是AI帶來(lái)的技術(shù)紅利,另一面則是AI應(yīng)用過(guò)程中存在的多重阻礙。
MaaS能讓企業(yè)級(jí)AI“照進(jìn)現(xiàn)實(shí)么?
在胡健看來(lái),MaaS的服務(wù)模式將成為企業(yè)級(jí)AI落地過(guò)程中的最佳方式。MaaS通過(guò)“模型倉(cāng)庫(kù)+推理引擎+運(yùn)維工具鏈”的一體化解決方案,將以硅基流動(dòng)為代表的服務(wù)商的技術(shù)能力轉(zhuǎn)化為企業(yè)可直接使用的標(biāo)準(zhǔn)化服務(wù)。
IDC發(fā)布的《中國(guó)模型即服務(wù)(MaaS)及AI大模型解決方案市場(chǎng)追蹤,2024H2》報(bào)告中指出,2024 年中國(guó) MaaS市場(chǎng)呈現(xiàn)爆發(fā)式增長(zhǎng),全年規(guī)模達(dá) 7.1 億元人民幣,較 2023 年實(shí)現(xiàn)215.7% 的同比激增,其中 2024 下半年市場(chǎng)規(guī)模達(dá)4.6億元人民幣。同時(shí),《報(bào)告》預(yù)計(jì),展望2024-2029 年,MaaS市場(chǎng)將以66.1%的年均復(fù)合增長(zhǎng)率高速擴(kuò)容,預(yù)計(jì)2029年市場(chǎng)規(guī)模將達(dá)到90億元人民幣。
成本是MaaS模式最為明顯的優(yōu)勢(shì)之一。MaaS 服務(wù)通過(guò)“技術(shù)優(yōu)化+模式創(chuàng)新”,顯著降低了企業(yè)AI應(yīng)用的綜合成本,使“低成本規(guī)模化”成為可能。
在硬件成本方面,MaaS服務(wù)商通過(guò)大規(guī)模采購(gòu)與國(guó)產(chǎn)算力適配,為企業(yè)提供高性價(jià)比選項(xiàng)。據(jù)胡健介紹,通過(guò)與華為深度合作,硅基流動(dòng)實(shí)現(xiàn)了昇騰卡推理成本比英偉達(dá)低50%以上,某能源企業(yè)采用該方案后,千卡級(jí)算力池年成本下降近千萬(wàn)元。
不僅于此,胡健介紹,通過(guò)硅基流動(dòng)的動(dòng)態(tài)擴(kuò)縮容技術(shù),還可使企業(yè)能根據(jù)業(yè)務(wù)量實(shí)時(shí)調(diào)整算力資源,避免閑置浪費(fèi),在降低了算力成本的同時(shí),還能提升算力資源利用率。
除了硅基流動(dòng)之外,也有不少大模型服務(wù)商通過(guò)不同的方式,降低了算力成本。比如,火山引擎通過(guò)“規(guī)模效應(yīng)”進(jìn)一步降低單位成本,其豆包大模型日均Tokens調(diào)用量達(dá)16.4萬(wàn)億,通過(guò)飛輪效應(yīng)使單位Token成本降至行業(yè)低位。
MssS服務(wù)在成本方面的核心價(jià)值在于——讓企業(yè)從“購(gòu)買(mǎi)算力”轉(zhuǎn)向“購(gòu)買(mǎi)價(jià)值”,通過(guò)服務(wù)的模式,讓企業(yè)無(wú)需為底層技術(shù)投入買(mǎi)單。IDC數(shù)據(jù)顯示,采用MaaS模式的企業(yè),AI投入回報(bào)率較傳統(tǒng)模式提升2~3倍,金融行業(yè)更是達(dá)到4倍以上。
成本優(yōu)勢(shì)固然是MaaS服務(wù)能夠出現(xiàn)的重要原因,但MaaS服務(wù)真正的優(yōu)勢(shì)還是在于讓企業(yè)實(shí)現(xiàn)了“AI平權(quán)”——通過(guò)“封裝復(fù)雜技術(shù)”降低應(yīng)用門(mén)檻,使企業(yè)無(wú)需專(zhuān)業(yè)AI Infra團(tuán)隊(duì)即可實(shí)現(xiàn)規(guī)模化部署。
以硅基流動(dòng)的MaaS服務(wù)為例,胡健介紹,硅基流動(dòng)的企業(yè)級(jí)MaaS構(gòu)建了低代碼操作界面與可視化儀表盤(pán),將模型部署、算力調(diào)度等復(fù)雜操作轉(zhuǎn)化為“一鍵式”流程,傳統(tǒng)運(yùn)維人員經(jīng)過(guò)簡(jiǎn)單培訓(xùn)即可上手。某電力巨頭通過(guò)該系統(tǒng),實(shí)現(xiàn)了非技術(shù)人員參與Agent開(kāi)發(fā),使AI應(yīng)用覆蓋從電力運(yùn)維到合同審核的全業(yè)務(wù)鏈,日Token消耗達(dá)百億級(jí)。
除此之外,MaaS服務(wù)通過(guò)底層技術(shù)優(yōu)化與系統(tǒng)性調(diào)度,實(shí)現(xiàn)了算力效率與模型性能的雙重提升,破解了企業(yè)“硬件強(qiáng)、軟件弱”的困境。胡健與筆者分享了硅基流動(dòng)MaaS平臺(tái)的一些經(jīng)驗(yàn),他指出,硅基流動(dòng)MaaS平臺(tái)支持異構(gòu)算力統(tǒng)一納管,已適配英偉達(dá)、華為昇騰、沐曦等國(guó)內(nèi)外主流芯片,通過(guò)智能路由算法將不同任務(wù)分配至最優(yōu)算力節(jié)點(diǎn)。并且,基于自研推理引擎,硅基流動(dòng)MaaS平臺(tái)實(shí)現(xiàn)了“dense類(lèi)模型當(dāng)天上線、MoE類(lèi)模型1~2天適配”,較行業(yè)平均周期縮短80%以上。
MaaS服務(wù)未來(lái)路在何方?
當(dāng)前,中國(guó)MaaS市場(chǎng)已形成“頭部引領(lǐng)、多元競(jìng)爭(zhēng)”的格局,同時(shí)在技術(shù)迭代與需求驅(qū)動(dòng)下,正朝著“智能體化、國(guó)產(chǎn)化、生態(tài)化”方向演進(jìn)。IDC數(shù)據(jù)顯示,2024年中國(guó)MaaS市場(chǎng)規(guī)模達(dá)7.1億元,2025年上半年公有云大模型調(diào)用量已達(dá)536.7萬(wàn)億Tokens,較2024年全年增長(zhǎng)近400%,印證了市場(chǎng)的爆發(fā)式增長(zhǎng)。硅基流動(dòng)等服務(wù)商的實(shí)踐,不僅勾勒出當(dāng)前市場(chǎng)的基本面貌,更揭示了未來(lái)發(fā)展的核心方向。
從市場(chǎng)發(fā)展上看,現(xiàn)階段MaaS服務(wù)呈現(xiàn)出“公有云普及、私有化深化”的發(fā)展態(tài)勢(shì)。
公有云MaaS以低門(mén)檻、高彈性為優(yōu)勢(shì),主要服務(wù)個(gè)人開(kāi)發(fā)者與中小企業(yè)。比如,硅基流動(dòng)的MaaS平臺(tái)已積累超過(guò)700萬(wàn)用戶,2024年中旬適配DeepSeek V2后,單月用戶從50萬(wàn)激增至 500萬(wàn),成為國(guó)內(nèi)少數(shù)大規(guī)模用國(guó)產(chǎn)卡提供服務(wù)的平臺(tái)。火山引擎則憑借公有云優(yōu)勢(shì)占據(jù)市場(chǎng)主導(dǎo),2025年上半年以49.2%的Token調(diào)用量份額位居第一,其豆包大模型日均Tokens調(diào)用量達(dá)16.4萬(wàn)億。
相對(duì)公有云的模式來(lái)說(shuō),選擇私有化部署的大多數(shù)是央國(guó)企或大型企業(yè)。這部分企業(yè)看重的是私有化MaaS以安全合規(guī)與定制化為核心的競(jìng)爭(zhēng)力。據(jù)胡健介紹,目前硅基流動(dòng)已經(jīng)完成了某電力巨頭、某石化等頭部案例落地,其私有化方案通過(guò)“模型倉(cāng)庫(kù)+推理引擎+運(yùn)維工具鏈”的一體化架構(gòu),滿足企業(yè)數(shù)據(jù)本地化、算力自主化的需求。
值得注意的是,百度智能云同樣在私有化市場(chǎng)表現(xiàn)突出,據(jù)公開(kāi)數(shù)據(jù)顯示,百度智能云已經(jīng)服務(wù)超600家金融客戶,并與國(guó)家電網(wǎng)聯(lián)合打造了“光明電力大模型”。
這種分化源于客戶需求差異:中小企業(yè)更關(guān)注成本與便捷性,而央國(guó)企則將安全合規(guī)與國(guó)產(chǎn)適配置于首位。
在“雙線”發(fā)展的基礎(chǔ)之上,MaaS市場(chǎng)將呈現(xiàn)“公有云向中小企業(yè)下沉、私有化向高端定制深化”的分化趨勢(shì)。公有云方面,隨著單位Token成本持續(xù)下降(火山引擎已實(shí)現(xiàn) “厘計(jì)價(jià)”),中小企業(yè)的AI應(yīng)用門(mén)檻將進(jìn)一步降低,預(yù)計(jì)2027年中小企業(yè)MaaS滲透率將從當(dāng)前的30%提升至60%。“硅基流動(dòng)計(jì)劃通過(guò)PLG模式(中小開(kāi)發(fā)者驅(qū)動(dòng))拓展海外市場(chǎng),提供標(biāo)準(zhǔn)化API服務(wù)。”胡健如是說(shuō)。
私有化方面,MaaS將向“全棧定制+國(guó)產(chǎn)替代”方向深化。央國(guó)企與頭部企業(yè)的需求已從“模型部署”升級(jí)為“AI 能力體系構(gòu)建”,這就對(duì)MaaS服務(wù)商提出了新的要求——提供從算力規(guī)劃、模型微調(diào)至應(yīng)用開(kāi)發(fā)的全流程服務(wù)。
從技術(shù)層面來(lái)看,MaaS服務(wù)正從單一模型調(diào)用向“AI Agent+多模態(tài)”的綜合平臺(tái)演進(jìn),成為企業(yè)智能生產(chǎn)力的核心載體。AI Agent的融入將實(shí)現(xiàn)從“任務(wù)執(zhí)行”到“決策支撐”的升級(jí)。基于此,胡健表示,硅基流動(dòng)計(jì)劃推出的SaaS產(chǎn)品“Function and Service”,將聚焦代碼生成、語(yǔ)音交互等場(chǎng)景,構(gòu)建“目標(biāo)導(dǎo)向”的智能體能力。
未來(lái),隨著AI Agent與多模態(tài)技術(shù)的融入,MaaS服務(wù)將從“輔助工具”升級(jí)為“智能生產(chǎn)力系統(tǒng)”,成為企業(yè)數(shù)字化轉(zhuǎn)型的核心基礎(chǔ)設(shè)施。而MaaS的終極價(jià)值,是讓AI真正成為所有企業(yè)都能駕馭的生產(chǎn)力工具,推動(dòng)產(chǎn)業(yè)智能化進(jìn)入“人均Agent”的新時(shí)代。(文|Leo張ToB雜談,作者|張申宇,編輯丨蓋虹達(dá))
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.