![]()
“當(dāng)前,大模型在垂直領(lǐng)域已具備足夠的智能,能夠處理事務(wù)、回答問題。我們要解決的是,能否為AI賦予身體,使其有形象、能表達(dá)?”
公司情報專家《財經(jīng)涂鴉》獲悉,10月29日,魔琺科技(Xmov)宣布正式上線全球首個高質(zhì)量、低時延、高并發(fā)、低成本、多終端的具身智能3D數(shù)字人開放平臺——魔琺星云,以期將AI交互從當(dāng)前以“文本框”為主的單一模式,全面升級為具備語音、表情、動作等多模態(tài)交互能力的智能數(shù)字人。
魔琺科技創(chuàng)始人兼CEO柴金祥認(rèn)為,如今,AI已經(jīng)可以寫文章、編程序甚至做決策,并且可以調(diào)用各種API成為智能體,“然而,現(xiàn)在的AI依然有重大缺失——即缺少了身體。魔琺星云就是要把AI從無形變?yōu)橛行危孉I從擁有大腦進(jìn)化為擁有身體”。
推動AI從大腦進(jìn)化到「身體」
由于當(dāng)前的傳統(tǒng)技術(shù)方案難以兼顧質(zhì)量、延時、成本的“鐵三角”,這些挑戰(zhàn)導(dǎo)致高質(zhì)量3D數(shù)字人的交互體驗無法實現(xiàn)規(guī)模化商用。
對此,星云平臺利用文生多模態(tài)3D大模型+技術(shù)實現(xiàn)路徑的協(xié)同突破,成為全球首個可大規(guī)模商用的具身智能底層基建,讓AI完成了從“大腦”到“身體”的進(jìn)化。
例如,模型層面,平臺通過自研的全球首個文生多模態(tài)3D大模型,直接將文本/語音轉(zhuǎn)換為語音、動作、表情、手勢等多模態(tài)的3D表達(dá)信號;架構(gòu)層面,云-端拆分的方式不僅極大降低了下行帶,亦在端側(cè)實現(xiàn)了將參數(shù)實時轉(zhuǎn)化為畫面。
柴金祥透露,魔琺科技自2018年起積累了大量高質(zhì)量的3D動畫數(shù)據(jù),成為其模型訓(xùn)練的關(guān)鍵壁壘。其中每一條數(shù)據(jù)都需要具備強(qiáng)動畫制作能力的團(tuán)隊進(jìn)行標(biāo)定與審核的制作,成本高達(dá)每秒千元,涵蓋人臉、手勢、身體動作與表情的高質(zhì)量3D動畫數(shù)據(jù),為模型的高質(zhì)量輸出奠定堅實基礎(chǔ)。
據(jù)悉,在核心技術(shù)指標(biāo)上,魔琺星云擁有六大優(yōu)勢,包括高質(zhì)量實時自然生成;驅(qū)動延遲壓縮至500ms以內(nèi);千萬級設(shè)備并發(fā)的驅(qū)動能力;可在百元級芯片上運行的低成本;適配多場景應(yīng)用需求;完全兼容國產(chǎn)信創(chuàng)芯片體系。
通過構(gòu)建從實時驅(qū)動到內(nèi)容創(chuàng)作的全鏈路能力體系,星云平臺不僅推動傳統(tǒng)顯示屏向“AI具身智能交互屏”演進(jìn),亦可助力人形機(jī)器人從執(zhí)行基礎(chǔ)操作的“藍(lán)領(lǐng)”進(jìn)階為具備交流服務(wù)能力的“白領(lǐng)”與智能伙伴。
這一技術(shù)突破或?qū)⒅厮苋藱C(jī)交互產(chǎn)業(yè)格局,為數(shù)字經(jīng)濟(jì)注入新動能。
商業(yè)化進(jìn)程啟動,百家客戶正在測試
商業(yè)化方面,柴金祥透露,已有上百家企業(yè)客戶正在測試,部分已經(jīng)付費,展現(xiàn)出強(qiáng)烈的市場興趣與商業(yè)化潛力。其中,顯示器制造商率先看到了機(jī)會。
“在顯示器行業(yè)競爭飽和的當(dāng)下,通過星云平臺,公司可以在原有的屏幕上給出更多交互方案。”光嶼智聯(lián)CEO馮晨在現(xiàn)場分享中表示,“對用戶來說,那將是一種超越預(yù)期的震撼體驗。”
據(jù)悉,從手機(jī)、平板、電腦,到商顯屏幕、電視、車載大屏,任何屏幕都可以通過魔琺星云升級為能自然交互的具身智能體,從被動信息載體變成主動交流和服務(wù)入口。
萬屏?xí)r代CEO黃鍇則基于與多家頭部數(shù)字人公司合作的經(jīng)驗進(jìn)一步表示,目前,頭部公司產(chǎn)品優(yōu)秀,但整個行業(yè)產(chǎn)品質(zhì)量參差不齊,成本高、服務(wù)不穩(wěn)定,“數(shù)字人能力的局限束縛了行業(yè)發(fā)展,大家都在低水平重復(fù)造輪子”。
“魔琺星云的發(fā)布將極大拓寬整個顯示器行業(yè)的市場邊界。”他認(rèn)為,未來市場或?qū)陌賰|市場成長至千億甚至萬億。
魔琺科技相關(guān)負(fù)責(zé)人透露,在教育、客服、法律、銷售、導(dǎo)游等眾多領(lǐng)域,魔琺星云可提供低成本、高效率、規(guī)模化的交互式具身智能服務(wù)。同時,平臺的能力也將延伸至機(jī)器人領(lǐng)域,賦予人形機(jī)器人更自然的語音、眼神與手勢交互能力,
目前,開發(fā)者、系統(tǒng)集成商及生態(tài)伙伴均可基于魔琺星云快速構(gòu)建各類應(yīng)用,涵蓋App、小程序、Web端、智能座艙、零售展廳等多種場景。
現(xiàn)場,柴金祥還宣布,魔琺星云將面向全球開發(fā)者全面開放,“魔琺星云有這個能力讓每一塊屏幕、每一個應(yīng)用、每一個終端,都有一個具身3D智能數(shù)字人。”
作者:蘇打
編輯:tuya
出品:財經(jīng)涂鴉(ID:caijingtuya)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.