合成歌聲調(diào)教經(jīng)驗(yàn)總結(jié)(三)歌聲合成技術(shù)基礎(chǔ)
????調(diào)聲者使用歌聲合成工具調(diào)聲,亦須學(xué)習(xí)歌聲合成技術(shù)。許多調(diào)教師在實(shí)踐中掌握了聲庫(kù)制作以至歌聲合成引擎制作能力,調(diào)聲能力亦有提升。一般調(diào)教師雖無(wú)須精通各項(xiàng)相關(guān)技術(shù),但仍需簡(jiǎn)單了解,以期調(diào)聲過(guò)程中“知其所以然”。
????首先,從任何一種歌聲合成工具編輯器界面即可推斷出,引擎將對(duì)原音進(jìn)行伸縮與變調(diào),再將各個(gè)發(fā)音拼接成完整歌聲。而如果想當(dāng)然地草率實(shí)現(xiàn)這三個(gè)步驟,得到的聲音缺不盡人意。故需先行了解一些本應(yīng)于上一章講解,但與本章關(guān)系更為密切的語(yǔ)音學(xué)知識(shí)。


????可見(jiàn)一個(gè)(最復(fù)雜的)漢語(yǔ)普通話發(fā)音由聲母和韻母組成,韻母可以分為韻頭(u)、韻腹(A)、韻尾(N),其中聲母先于理論發(fā)聲時(shí)間(即節(jié)拍)發(fā)聲,人類聽(tīng)感上以韻母起始對(duì)應(yīng)節(jié)拍。

????可見(jiàn)一般情況下,當(dāng)拉伸發(fā)音長(zhǎng)度時(shí),韻頭和韻尾基本保持不變,而主要拉伸韻腹。如果對(duì)韻頭韻腹韻尾均等拉伸,得到的聲音將十分奇怪(SVR1)。所以聲庫(kù)制作者會(huì)對(duì)原音進(jìn)行標(biāo)記,標(biāo)出輔音、韻頭、韻腹、韻尾的位置,以便引擎合理地進(jìn)行伸縮。當(dāng)然有時(shí)出于表現(xiàn)效果會(huì)拉伸韻頭介母(萬(wàn)古生香:“誰(shuí)馬踏桃hu---a”),另當(dāng)別論。
????如果使用混音宿主對(duì)人聲進(jìn)行移調(diào)而不勾選“共振峰保持”一類的功能,當(dāng)移調(diào)達(dá)三度時(shí)人聲音色即發(fā)生極大的變化,可見(jiàn)共振峰為影響音色的參數(shù),一般歌聲合成引擎中都會(huì)開(kāi)放基于共振峰調(diào)整的性別(gen)參數(shù)以調(diào)整歌聲音色。但算法移調(diào)即便保持共振峰也不可避免地會(huì)造成一定程度的失真,即通常所說(shuō)的“電”的一種成因(另一種成因是音高過(guò)于平穩(wěn)且過(guò)渡突兀,如沒(méi)加默認(rèn)滑音的無(wú)參utau)。
????最早的一批民間(非企業(yè)勢(shì))聲庫(kù)制作者常使用utau,一種原本只針對(duì)日語(yǔ)設(shè)計(jì),但完全開(kāi)源且自由度極高的歌聲合成工具制作聲庫(kù),初學(xué)者可以重走一遍早先聲庫(kù)制作者的探索歷程:將字典上所有的發(fā)音各自單獨(dú)地錄制下來(lái),在標(biāo)記界面把“先行”放在聲母與韻母的交界,將“輔音”(即“不拉伸”)放在韻頭與韻腹的交界。發(fā)現(xiàn)韻尾與下一個(gè)聲母銜接不夠順暢,于是使用“重疊”將韻尾與下一個(gè)聲母部分重疊,將音量包絡(luò)交叉淡化,得到一個(gè)相對(duì)順暢的銜接。但此時(shí)韻腹與韻尾同時(shí)拉伸,一遇長(zhǎng)音則效果不佳,于是將不含韻尾的韻頭韻腹作為一個(gè)發(fā)音,將韻尾單獨(dú)設(shè)定為一個(gè)發(fā)音,把韻腹與韻尾過(guò)渡階段設(shè)定為“重疊”,令其與韻腹平穩(wěn)過(guò)渡;將韻尾設(shè)定為“先行”中不重疊的部分,令其發(fā)音清晰完整。使用時(shí)在音符尾拆下與下一發(fā)音輔音長(zhǎng)度相當(dāng)?shù)囊舴{(diào)用韻尾音符交叉淡化,即可得到相對(duì)完整的發(fā)音(僅為其中一種標(biāo)記思路,不唯一)。這種方案叫“擴(kuò)張整音”。
????但韻尾與聲母之間的銜接問(wèn)題尚未真正解決。于是只能在錄音時(shí)錄制相關(guān)采樣,出現(xiàn)了vcv與cvvc錄音方案(c=輔音,v=元音),普通話vcv錄音量極大無(wú)法使用,于是cvvc被廣泛采用,即將普通話所有發(fā)音的所有銜接方式窮舉錄制,標(biāo)記時(shí)將擴(kuò)張整音的韻尾發(fā)音改為韻尾-聲母發(fā)音(元音-輔音/vc)和語(yǔ)尾息。此時(shí)又發(fā)現(xiàn)由無(wú)聲到發(fā)聲的第一個(gè)音,即“開(kāi)頭音”,與句中的“中間音”發(fā)音有別,于是分別標(biāo)記為不同發(fā)音,即是當(dāng)下使用的中文cvvc(utau需手動(dòng)或用插件拆音,dv與sv中自動(dòng)完成)。

????????普通話中,清輔音為噪波(有爭(zhēng)議),頻譜連續(xù),無(wú)法識(shí)別音高;濁輔音和元音為諧波噪波混合,諧波頻譜分立,可通過(guò)確定基頻確定音高,可通過(guò)各級(jí)泛音頻譜頂點(diǎn)連線確定共振峰;噪波即為通常所謂“氣聲”,故氣聲參數(shù)即為對(duì)引擎分離出的噪波振幅的調(diào)整,張力參數(shù)即為對(duì)泛音振幅的調(diào)整,音高參數(shù)即為對(duì)所有諧波在保持共振峰前提下的移調(diào)。正因如此,除響度(音量,動(dòng)態(tài)同理)與氣聲以外的參數(shù)對(duì)清輔音無(wú)效。(對(duì)于SVR2自帶正弦波音源,由于無(wú)噪波,無(wú)泛音,導(dǎo)致除響度(發(fā)聲)、音高(顫音)以外的參數(shù)無(wú)效)