姜sir變成姜siri,AI配音能不能滿(mǎn)足玩家需求?
在原定錄音工作無(wú)法完成的情況下,為了保障重要游戲資源的完整,臨時(shí)調(diào)整計(jì)劃或更換CV并不少見(jiàn)。近日,因?yàn)樨?fù)責(zé)當(dāng)期內(nèi)容的配音演員無(wú)法參與錄制,《時(shí)空中的繪旅人》和《未定事件簿》也相繼發(fā)布了角色更換配音的公告,不過(guò),這次并不是換人,而是用AI配音替代真人錄制。

AI配音不稀奇,但AI配音游戲角色,還是配乙女游戲中的男主之一,確實(shí)是個(gè)新鮮事。除了引發(fā)粉絲和吃瓜群眾對(duì)背后的內(nèi)情的探究,這一嘗試也讓游戲玩家既期待又忐忑不安。不過(guò),隨著語(yǔ)音在游戲中實(shí)裝,以及相關(guān)實(shí)機(jī)視頻的公布,語(yǔ)音最終呈現(xiàn)出來(lái)的效果卻出乎玩家的預(yù)料:


也有被新嗓子俘獲,情緒較為激動(dòng)的:

雖然存在缺陷,但總體來(lái)說(shuō)并未翻車(chē),反而算得上是驚喜。
AI配音正在大步向前
AI配音,似乎在逐漸顛覆大眾的普遍印象:

雖然與早期的小冰等相比,現(xiàn)在的智能語(yǔ)音助手,在語(yǔ)言流暢度上已經(jīng)有了很大的進(jìn)步,也有了更為豐富的聲音方案,但大部分時(shí)候,智能語(yǔ)音助手、AI聽(tīng)書(shū)、短視頻AI配音等,仍然扮演著沒(méi)有感情的念稿機(jī)器,還會(huì)在斷句、特殊句式、多音字上屢次碰壁。而早期作為虛擬歌手標(biāo)配的機(jī)械感和電音,隨著聲庫(kù)和調(diào)音技術(shù)的升級(jí),也逐漸被削弱。創(chuàng)作者還會(huì)特意加入換氣聲,使之更貼近于真人。

雖然好笑,但確實(shí)是生動(dòng)起來(lái)了。
在許多人對(duì)AI語(yǔ)音的印象還停留在探索階段時(shí),《繪旅人》和《未定》則在語(yǔ)言銜接、語(yǔ)氣以及情緒上,展現(xiàn)出了高度貼合真人的成果,當(dāng)然,距離完美還有提升空間。

在評(píng)論區(qū),玩家的評(píng)判標(biāo)準(zhǔn)也反復(fù)橫跳,一方面知道是AI后忍不住開(kāi)始找毛病,另一方面又認(rèn)為不應(yīng)該對(duì)AI太過(guò)嚴(yán)格。
不過(guò),鑒于這是兩個(gè)人第一次“學(xué)說(shuō)話(huà)”,評(píng)價(jià)大體上還是包容居多,甚至自發(fā)尋求合理性,比如莫弈的略微氣虛契合了劇情設(shè)定下的曖昧氛圍,葉瑄的微妙停頓以及電流聲,恰好可以歸于“外星人”設(shè)定。

還原本音外,此次AI配音的另一個(gè)特殊之處,在于音源來(lái)自于角色而非CV。
無(wú)論是虛擬歌手,還是智能語(yǔ)音助手,大都是由真人提供音源。因此對(duì)于AI語(yǔ)音,特別是即時(shí)生成的語(yǔ)音來(lái)說(shuō),聲庫(kù)質(zhì)量尤為重要。即使是虛擬歌手,其歌曲效果,也不只取決于調(diào)校水平。

但《繪旅人》和《未定》中,葉瑄和莫弈這兩個(gè)角色,并非由CV直接提供音源,而是通過(guò)角色過(guò)往的配音來(lái)分析提取聲紋,也就是說(shuō),這是葉瑄和莫弈“自己給自己配音”。

涉及到的兩個(gè)AI技術(shù)提供者,在這之前也已經(jīng)在其他領(lǐng)域中大展身手。網(wǎng)易AI Lab曾在去年與《羊城晚報(bào)》合作推出廣東媒體首個(gè)視頻類(lèi)真人AI合成主播“羊小晚”和“羊小派”。至于逆熵AI,在前段時(shí)間米哈游旗下虛擬偶像鹿鳴的直播上,就引發(fā)過(guò)討論,在幾年前公布時(shí),也對(duì)AI配音這方面做出了解釋?zhuān)瓷疃葘W(xué)習(xí)記錄配音演員的聲音和情感,做到輸入文字就能夠生成語(yǔ)音。也是由于這一項(xiàng)技術(shù)的經(jīng)驗(yàn),相較于準(zhǔn)備時(shí)間較為倉(cāng)促且第一次嘗試的葉瑄,莫弈的配音才能呈現(xiàn)出更好的效果。
相似的原理,在虛擬歌手身上也得到了應(yīng)用,8月末,洛天依AI在軟件ACE Studio上開(kāi)啟公測(cè),同樣是通過(guò)深入學(xué)習(xí)來(lái)模擬真人發(fā)聲效果。
在視頻平臺(tái)上,也有網(wǎng)友將洛天依AI聲庫(kù)與此前的V3、V4聲庫(kù)進(jìn)行對(duì)比,相比之下AI聲庫(kù)呈現(xiàn)出來(lái)的歌曲片段,在流暢感和真人感上都有很大的提升,更為自然柔和。不過(guò)也有網(wǎng)友認(rèn)為這樣失去了洛天依特有的標(biāo)志性電音。
洛天依聲庫(kù)的加入,無(wú)疑讓ACE Studio進(jìn)入了更多網(wǎng)友的視野,而除了調(diào)音,這一虛擬歌姬軟件的捏聲線(xiàn)功能也為創(chuàng)作者帶來(lái)了更多的靈感和途徑:

在選定模板的基礎(chǔ)上,通過(guò)調(diào)節(jié)參數(shù)得出聲音“配方”后,給人的感覺(jué)基本就像是角色本人在唱歌了。
但無(wú)論是真人音源還是虛擬音源,由于AI的可調(diào)性,AI語(yǔ)音呈現(xiàn)出來(lái)的效果和真人也有著微妙的差異。這在虛擬歌手上比較常見(jiàn),在聲線(xiàn)和語(yǔ)氣上已經(jīng)高度還原的莫弈身上,也會(huì)產(chǎn)生一種角色和CV分離開(kāi)來(lái)的感覺(jué),給人的感覺(jué)像“貼莫而不貼姜”。而神奇的是,這種與真人稍微剝離的感覺(jué),似乎并不會(huì)讓玩家不滿(mǎn),反而讓他們更有代入感。
AI會(huì)代替真人配音嗎
使用AI配音的直接目的,是避免因?yàn)橥饨缫蛩囟鴮?dǎo)致超出計(jì)劃的變動(dòng)。不過(guò),這也受到角色定位的影響,近兩個(gè)月中,其他游戲里也有姜廣濤配音的其他角色出場(chǎng),如《花亦山心之月》中的玉澤和《食物語(yǔ)》中的龍井蝦仁,但除了提前錄好的部分,在其他內(nèi)容中暫時(shí)成為了“啞巴”。這些角色?雖然也有高人氣,總歸只是眾多角色中的一個(gè),在時(shí)裝及其劇情的暫時(shí)失聲并沒(méi)有太大的影響,但作為乙女游戲的男主角之一,葉瑄和莫弈在活動(dòng)劇情中缺席或失聲,都會(huì)對(duì)角色塑造和玩家體驗(yàn)上產(chǎn)生嚴(yán)重的負(fù)面影響。


而在局勢(shì)尚未明朗的當(dāng)下,更換CV也確實(shí)不合適,因此,使用AI配音,便成為了最優(yōu)解。

AI會(huì)替代真人配音嗎?對(duì)此網(wǎng)友的態(tài)度也各不相同,有人認(rèn)為AI配出來(lái)的沒(méi)有靈魂,有人則認(rèn)為紙片人就應(yīng)該配電子音:

不過(guò),就當(dāng)下的情形來(lái)看,短時(shí)間內(nèi)這樣的可能性不大。
主要是在于技術(shù)與成本。人工智能的使用,很大程度上是為了降低人力成本,但應(yīng)用的范圍也有限。當(dāng)前AI配音主要應(yīng)用于不需要太多情緒的短視頻文案、新聞播報(bào)、聽(tīng)書(shū)功能上,滿(mǎn)足基本的信息傳達(dá)功能。而更為復(fù)雜的有情緒的AI配音,在這些領(lǐng)域是不適用的,也不必要的。因?yàn)锳I配音的相對(duì)低的成本,并不包括像《繪旅人》和《未定》這樣給主要角色臨時(shí)配音的情況——不僅要考慮語(yǔ)言流暢、還要在語(yǔ)氣情緒上貼近角色,以及盡量還原配音演員。在技術(shù)要求和工作量上,這無(wú)疑是高于真人配音的,也并非所有的游戲都能擁有網(wǎng)易米哈游兩家大廠(chǎng)在資金和技術(shù)上的支持。

而對(duì)于合作雙方來(lái)說(shuō), 除了與角色的適配度,CV本身的影響力,也是游戲廠(chǎng)商考慮的重點(diǎn)。雖說(shuō)將角色與配音演員聯(lián)系在一起并不好,但這種現(xiàn)象依舊是普遍存在,否則也不會(huì)將CV作為宣傳點(diǎn),并舉辦CV和玩家的互動(dòng)活動(dòng)了。這些附加效應(yīng),自然也是真人配音的高成本中的一部分。而廠(chǎng)商要?jiǎng)?chuàng)造獨(dú)家AI CV,再將其打造成為IP,擁有與頭部CV相當(dāng)?shù)奶?hào)召力,并不是能一朝一夕完成的。
此外,AI配音技術(shù)尚未完全成熟。

而且,比起情感,AI配音更多的是擁有了情緒,而這些情緒是通過(guò)一點(diǎn)點(diǎn)的后期調(diào)節(jié)來(lái)實(shí)現(xiàn)的。相對(duì)于真人,許多時(shí)候數(shù)據(jù)或許會(huì)少了一些打動(dòng)人心的力量。比如視頻創(chuàng)作者的小情緒、發(fā)音習(xí)慣、甚至是偶爾的口胡,都能拉近與觀(guān)眾的距離,這是追求完美的的AI配音無(wú)法實(shí)現(xiàn)的。
雖然對(duì)頂級(jí)的CV沒(méi)有太大的影響,但對(duì)于許多在業(yè)務(wù)能力和知名度上較低的配音工作者來(lái)說(shuō),AI配音的不斷進(jìn)步確實(shí)會(huì)有威脅,比如現(xiàn)在的AI聽(tīng)書(shū)已經(jīng)開(kāi)始擠占有聲書(shū)市場(chǎng)了。但這也并非完全是壞事,競(jìng)爭(zhēng)會(huì)推動(dòng)配音演員對(duì)自身技能的提升。不過(guò),這一問(wèn)題并非面向個(gè)人,而是需要整個(gè)行業(yè)進(jìn)行調(diào)整,提升真人配音的競(jìng)爭(zhēng)力來(lái)應(yīng)對(duì)危機(jī)。
結(jié)語(yǔ)
AI配音游戲角色,讓人們看到了這一技術(shù)在語(yǔ)音領(lǐng)域的又一次進(jìn)步。在感慨人工智能技術(shù)的越來(lái)越強(qiáng)大的同時(shí),也擔(dān)心會(huì)帶來(lái)虛假信息、擠占市場(chǎng)、剝奪創(chuàng)造力等社會(huì)問(wèn)題。此前的AI換臉、AI繪畫(huà),也是如此。
但就如機(jī)械代替部分人力一樣,AI在更廣泛領(lǐng)域得到應(yīng)用的趨勢(shì)是不可阻擋的,我們只能通過(guò)法規(guī)等來(lái)規(guī)避其隱患,而無(wú)法阻止它。但能替代的,也只是一部分,至少在目前,AI配音的應(yīng)用范圍還十分有限,而在技術(shù)成熟和成本降低的未來(lái),局面或許會(huì)發(fā)生改變。

不過(guò),即使是AI技術(shù)在未來(lái)達(dá)到了突破性進(jìn)展,我也更愿意相信,將AI作為輔助工具,協(xié)助真人CV完成各類(lèi)配音工作,并在這一過(guò)程中互相學(xué)習(xí)促進(jìn),才是最理想的結(jié)果。