喜馬拉雅推出AI主播“喜小道”:AIGC為內(nèi)容創(chuàng)作注入新活力
近日,國(guó)內(nèi)知名AI續(xù)寫應(yīng)用彩云小夢(mèng)入駐喜馬拉雅,由其AI續(xù)寫的小說故事將由喜馬拉雅AI主播“喜小道”演播并發(fā)布在喜馬拉雅平臺(tái)。AI續(xù)寫和AI演播的跨界合作與強(qiáng)強(qiáng)聯(lián)合,使得音頻作品從文本到有聲,均由AI完成創(chuàng)作。聽友們將可以在喜馬拉雅上聽到由AI創(chuàng)作并演播的腦洞大開的故事,感受科技的力量。
當(dāng)前,以互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能(AI)等為代表的現(xiàn)代信息技術(shù)日新月異,AI技術(shù)也越來越成熟,并正在深入地運(yùn)用到我們生活的各個(gè)方面。在內(nèi)容創(chuàng)作領(lǐng)域,如音頻內(nèi)容的創(chuàng)作,以往都是先由真人作者創(chuàng)作出文本(文章/小說/詩(shī)歌等等),再經(jīng)真人主播演播而成。
現(xiàn)在,就文本的創(chuàng)作而言,國(guó)內(nèi)知名AI續(xù)寫應(yīng)用“彩云小夢(mèng)”已經(jīng)可以實(shí)現(xiàn)小說故事的AI創(chuàng)作。彩云小夢(mèng)是基于大規(guī)模語(yǔ)言模型自研的自然語(yǔ)言處理模型,是一個(gè)能夠進(jìn)行各種類型文本創(chuàng)作的人工智能:只需要給彩云小夢(mèng)一個(gè)1-1000字的開頭,它就能為你續(xù)寫出后面的故事。2021年9月,彩云小夢(mèng)在蘋果商店上線,獲評(píng)當(dāng)月月度最佳應(yīng)用。彩云小夢(mèng)此次官方入駐喜馬拉雅,其專輯節(jié)目中的作品均由AI續(xù)寫創(chuàng)作而成。

而將文本通過AI智能技術(shù)有聲化,則是喜馬拉雅的強(qiáng)項(xiàng)。在音頻領(lǐng)域,將文本轉(zhuǎn)換為語(yǔ)音的技術(shù)統(tǒng)稱為TTS技術(shù)(Text-to-speech,語(yǔ)音合成),喜馬拉雅音頻算法團(tuán)隊(duì)自研的TTS框架目前已處于行業(yè)領(lǐng)先水平,其TTS前端文本處理分析模塊已經(jīng)能夠高精度、全自動(dòng)地對(duì)文本進(jìn)行多音字識(shí)別、韻律預(yù)測(cè)和風(fēng)格分類,并已開發(fā)出可以實(shí)現(xiàn)多情感、多風(fēng)格、多語(yǔ)種聲音的TTS技術(shù)模型,不僅可以演繹不同情緒的文字,還可以自動(dòng)區(qū)分旁白、對(duì)白,并支持英文,極大地豐富了TTS能表達(dá)的情感和韻律。
喜馬拉雅此次與彩云小夢(mèng)續(xù)寫AI合作的AI主播“喜小道”就是基于喜馬拉雅自研的TTS框架,并采集頭部主播“喜道公子”的真聲打造而成。在此次合作中,彩云小夢(mèng)入駐為喜馬拉雅旗下網(wǎng)文創(chuàng)作平臺(tái)奇跡文學(xué)的寫手,同時(shí)將其作品經(jīng)“喜小道”有聲化后,發(fā)布在喜馬拉雅平臺(tái)。AI續(xù)寫和AI演播的跨界合作與強(qiáng)強(qiáng)聯(lián)合,使得音頻作品從文本到有聲化的創(chuàng)作,均由AI完成,登錄喜馬拉雅搜索“彩云小夢(mèng)”即可收聽由AI創(chuàng)作和AI演播的小說故事。
除AI主播“喜小道”,目前,TTS技術(shù)已經(jīng)支持喜馬拉雅在相聲評(píng)書、電子書、新聞等領(lǐng)域?qū)崿F(xiàn)了突破,能夠高效地將新聞、書籍和文章中的大量文字信息轉(zhuǎn)為音頻,這些TTS內(nèi)容在上線后也獲得了較大的收聽量。比如,2021年,喜馬拉雅用TTS技術(shù)完美還原單田芳先生的聲音,并首次將單田芳先生的AI合成音應(yīng)用于風(fēng)格各異的書籍,用單式評(píng)書腔調(diào),全新演繹聽眾耳熟能詳?shù)慕?jīng)典之作,至今,喜馬拉雅上已有80多部運(yùn)用還原自單田芳先生聲音制作的專輯。同時(shí),隨著眾多主流媒體入駐喜馬拉雅,媒體們紛紛借助喜馬拉雅TTS技術(shù)加速制作新聞?lì)愐纛l節(jié)目,讓聽眾有了更多的渠道聽到更權(quán)威的新聞。值得一提的是,運(yùn)用TTS技術(shù)重現(xiàn)單田芳聲音版本的《毛氏三兄弟》和歷史類作品,其聲音完播率遠(yuǎn)超過普通人聲作品,這也為未來出版物大量有聲化提供了新的解決方案。

隨著AI技術(shù)的發(fā)展與成熟,其豐富的知識(shí)圖譜、自生成以及涌現(xiàn)性的特征,為內(nèi)容創(chuàng)作帶來變革:提升內(nèi)容創(chuàng)作效率的同時(shí),也讓內(nèi)容本身變得多樣而豐富。在喜馬拉雅平臺(tái)上,已逐漸形成UGC、PGC、PUGC的音頻內(nèi)容和創(chuàng)作者生態(tài)。喜馬拉雅在TTS技術(shù)領(lǐng)域的深耕,也帶動(dòng)著音頻行業(yè)以語(yǔ)音合成技術(shù)為基礎(chǔ)的AIGC內(nèi)容的產(chǎn)出,這將進(jìn)一步豐富喜馬拉雅原有的UGC+PGC+PUGC的音頻生態(tài),除真人主播外,AI主播的出現(xiàn)也讓喜馬拉雅創(chuàng)作者生態(tài)變得更加多元。
喜馬拉雅智能語(yǔ)音實(shí)驗(yàn)室盧恒表示,喜馬拉雅語(yǔ)音技術(shù)開發(fā)會(huì)將AIGC作為輔助工具,為喜馬拉雅平臺(tái)上的主播等內(nèi)容創(chuàng)作者助力。AIGC的崛起,為內(nèi)容創(chuàng)作注入了新的活力。
彩云小夢(mèng)AI續(xù)寫和喜馬拉雅AI演播的合作,展現(xiàn)了AIGC及AI技術(shù)賦能創(chuàng)作廣闊前景。未來,喜馬拉雅也將借助科技的力量不斷打開對(duì)于聲音的想象,讓AI技術(shù)為聲音賦能,讓聲音服務(wù)美好生活。