近日,豆包語(yǔ)音團(tuán)隊(duì)發(fā)布了 "AI 多人有聲劇 " 自動(dòng)化方案。方案支持多角色、高表現(xiàn)力的 TTS(語(yǔ)音合成)演播,同時(shí)實(shí)現(xiàn)了全自動(dòng) AI 后期的鏈路,從小說(shuō)文本到高質(zhì)量的多人有聲劇成品,全部由 AI 端到端完成。
據(jù)了解,"AI 多人有聲劇 " 自動(dòng)化方案基于高自然度的多角色智能朗讀,配合 AI 后期自動(dòng)添加音樂(lè)、音效、特效, 并進(jìn)行智能混音,能夠全自動(dòng)生產(chǎn)媲美真人水準(zhǔn)的有聲劇作品。這套方案不僅使得聽書自然度、沉浸感顯著提升,且生產(chǎn)鏈路全程無(wú)人工參與,可大幅降低制作成本、縮短制作周期,高效覆蓋更多書籍。

此外,方案中的畫本預(yù)測(cè)模型在多角色演播音頻基礎(chǔ)上,實(shí)現(xiàn)了從小說(shuō)文本到帶有音效、人聲特效、環(huán)境音、配樂(lè)的畫本預(yù)測(cè),在得到畫本信息之后進(jìn)行音頻召回并合成、智能動(dòng)態(tài)調(diào)整音頻參數(shù),并結(jié)合多角色 TTS 最終合成 " 有聲劇 " 成品。
目前,首批通過(guò) "AI 多人有聲劇 " 方案端到端創(chuàng)作的作品已經(jīng)在番茄小說(shuō) APP 上線,效果超出預(yù)期,并得到書友良好反饋,為聽書行業(yè)注入全新活力。未來(lái),"AI 多人有聲劇 " 方案仍將不斷升級(jí),覆蓋更多有聲內(nèi)容,小說(shuō)更新即可讓用戶同步享受精品有聲劇。