![]()
本報(chinatimes.net.cn)記者石飛月 北京報道
“聲網對話式AI相關用量在2025年第三季度實現151%的環比增長,這一切都展現出強勁的市場需求。”11月3日,聲網方面對《華夏時報》記者表示。這也意味著該公司的多元化轉型取得初步成效。今年上半年,該公司推出對話式AI引擎。
然而,這條高增長賽道也面臨著技術與市場的雙重考驗:一方面,盡管前景廣闊,但要實現真正“聲情并茂”的自然對話,業界認為仍需幾年時間以攻克低延遲、情感理解等技術瓶頸;另一方面,全球范圍內對話式AI創業公司呈現爆發態勢,賽道競爭日趨激烈。
生成式AI帶來新機遇
在近日由聲網與RTE開發者社區聯合主辦的Convo AI&RTE 2025第十一屆實時互聯網大會上,聲網創始人兼CEO趙斌表示,對話式AI將成為下一代AI Infra的重要部分。據聲網方面向本報記者提供的數據,該公司對話式AI相關用量在2025年第三季度實現151%的環比增長。
究其根本,是因為多模態大語言模型的出現讓計算機具備了類人的實時語音對話能力,為解決此前的挑戰帶來了全新路徑。趙斌認為,對話式AI正驅動RTE從能夠“正常對話”到“聲情并茂”的關鍵躍遷,為RTE(實時互動)行業帶來一個不可估量的全新市場。
在此之前,RTE產業依然面臨著從"連通"到"對話"的本質挑戰。行業數據顯示,僅21%的用戶對現有AI對話體驗滿意,部分服務的用戶流失率高,這是因為,人類對話中僅有7%的信息來自語言內容,超過90%的信息感知依賴于語調、表情和肢體語言等非語言要素。
今年3月,聲網發布了全球首個對話式AI引擎,這個對話式AI引擎可支持任意文本大模型快速升級為“能說會道”的對話式多模態大模型,之后,MiniMax、星野、智譜清言等都與聲網在對話式AI業務方面達成了合作;近日,聲網又推出了對話式AI引擎2.0。
深度科技研究院院長張孝榮對《華夏時報》記者表示,該賽道處于高速成長期,核心驅動力來自大模型多模態化與實時交互需求的融合,聲網等技術提供商通過高精度語音識別、低延遲通信與情感計算能力,填補了大模型從"文本智能"到"語音交互"的關鍵環節,未來將在智能座艙、虛擬人、沉浸式娛樂等領域形成規模化落地。
不過,大模型技術雖然為RTE從能夠“正常對話”到“聲情并茂”實現關鍵躍遷提供了可能,但目前距離理想化水平還存在一定差距。
“這個過程可能還需要3-5年。”張孝榮說,技術上的最大挑戰是如何突破低延遲響應、自然打斷、上下文管理以及多模態的情感理解與表達等復雜挑戰。
聲網方面則認為,實現“聲情并茂”所需要的時間難以精確預估,可能是幾年甚至更長時間,這一過程的關鍵節點主要與技術突破(比如多模態大語言模型的成熟)、市場應用(規模化商業落地)相關。
除了技術瓶頸,這條賽道的競爭也比較激烈。據聲網,在開發者生態中,全球范圍內正掀起一場實時語音技術的新浪潮,對話式AI與語音智能體創業公司呈現爆發式增長態勢,Y Combinator近期的孵化團隊中,語音智能體公司占比顯著提升。
音視頻市場止跌回升
事實上,對話式AI是聲網新場景多元化轉型的關鍵一步。
聲網成立于2014年,主業為實時音視頻業務。疫情期間,由于線上教育、直播帶貨、在線會議、遠程醫療、音視頻娛樂等多個賽道的需求增長進一步加速了實時語音業務規模的爆發,聲網一度獲得巨大的流量。
但之后由于業務過于單一,再加上疫情之后帶來流量的多個場景出現市場變化,聲網開始陷入業績下滑與虧損的困境。
生成式AI在全球的爆火讓聲網看到了新的機會,該公司也很快抓住這個市場節點進行布局,并取得了不錯的成績。在經歷多次虧損后,聲網已經連續三個季度實現盈利,其母公司Agora,Inc.發布的2025年第2季度財報顯示,總營收為3426萬美元,同比增長11%,GAAP凈利潤為146萬美元。
當然,原本的音視頻業務仍然是聲網的支柱型產業。聲網方面對本報記者表示,該公司當前發展勢頭最好的業務包括對話式AI和RTC(實時通信)相關業務,但最大頭收入還是來自RTC相關服務。
好消息是,這一市場已經逐漸轉好。IDC發布的《中國視頻云市場跟蹤,2024下半年》報告顯示,2024下半年中國視頻云市場規模達到50.8億美元,止跌回升,同比增長4.7%。頭部短視頻與直播電商平臺為直播體驗拔高技術指標、互聯網視頻短劇需求持續提升、智能化視頻云服務逐步落地,成為驅動這期市場增長的主要動力。
“AI需要音頻能力。借助于大模型的高速發展,音視頻業已從‘爆發式增長’進入‘結構性增長’的新階段,未來,音視頻將作為底層能力與對話式AI等技術結合,賦能更多創新場景。”張孝榮說。
在這條賽道,聲網同樣存在很多競爭對手,在該公司多年前遞交的招股書中,就將騰訊、TokBox、美國的Twilio都列為競爭對手。
“我們會繼續發揮技術優勢(自研大網、抗丟包、延遲、AI優化)、優化產品策略(對話式AI引擎配套系列產品發布、低代碼產品適配不同需求人群)、聚焦垂直場景(智能硬件、泛娛樂社交、出海、教育)、并加強本地化運營(聲網是第一家全球化的RTC公司,在北京、硅谷、倫敦、新加坡等地都有分部),來應對市場競爭。”聲網方面告訴本報記者。
責任編輯:黃興利 主編:寒豐
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.