近日,豆包語音團(tuán)隊發(fā)布了“AI多人有聲劇”自動化方案。方案支持多角色、高表現(xiàn)力的TTS(語音合成)演播,同時實現(xiàn)了全自動AI后期的鏈路,從小說文本到高質(zhì)量的多人有聲劇成品,全部由AI端到端完成。
據(jù)了解,“AI多人有聲劇”自動化方案基于高自然度的多角色智能朗讀,配合AI后期自動添加音樂、音效、特效,并進(jìn)行智能混音,能夠全自動生產(chǎn)媲美真人水準(zhǔn)的有聲劇作品。這套方案不僅使得聽書自然度、沉浸感顯著提升,且生產(chǎn)鏈路全程無人工參與,可大幅降低制作成本、縮短制作周期,高效覆蓋更多書籍。
![]()
“AI多人有聲劇”自動化方案支持從小說文本到完整成品有聲劇的全自動生產(chǎn)。該方案可以自動進(jìn)行角色劃分,準(zhǔn)確率超過98%,同時其語音大模型通過對海量文本與語音的多模態(tài)預(yù)訓(xùn)練,原生地將文本和語音模態(tài)融合,引入思維鏈信息,具備強(qiáng)大的文本理解能力和語音演繹能力,多人演播效果發(fā)音自然、情感豐富。
此外,方案中的畫本預(yù)測模型在多角色演播音頻基礎(chǔ)上,實現(xiàn)了從小說文本到帶有音效、人聲特效、環(huán)境音、配樂的畫本預(yù)測,在得到畫本信息之后進(jìn)行音頻召回并合成、智能動態(tài)調(diào)整音頻參數(shù),并結(jié)合多角色TTS最終合成“有聲劇”成品。
目前,首批通過“AI多人有聲劇”方案端到端創(chuàng)作的作品已經(jīng)在番茄小說APP上線,效果超出預(yù)期,并得到書友良好反饋,為聽書行業(yè)注入全新活力。未來,“AI多人有聲劇”方案仍將不斷升級,覆蓋更多有聲內(nèi)容,小說更新即可讓用戶同步享受精品有聲劇。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.