最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【隨便寫寫的音頻專欄】六、簡單的AI語音合成混音案例分析

2023-08-02 23:14 作者:浮生枕草  | 我要投稿

前言

在看這篇之前,希望你已經(jīng)看過前面的幾篇內(nèi)容,了解基本的操作,但并不需要你了解的特別深入,你可以通過之后的一些案例來進(jìn)一步學(xué)習(xí)。此次分析的工程是我之前做的一個(gè)簡單的AI語音合成視頻。需要注意的是:AI合成的語音與傳統(tǒng)的人聲干聲的混音略有不同,下面會(huì)提及。鏈接如下:

https://www.bilibili.com/video/BV1JX4y1s7dx

一、AI合成與假立體聲(選看)

1.1單聲道、雙聲道和全景聲是什么:

對(duì)聲音的體積感的探索由來已久,最早可以追尋至文藝復(fù)興時(shí)期,威尼斯樂派通過在建筑內(nèi)將合唱團(tuán)分為左右兩組,從而借助建筑的回聲達(dá)到立體聲的效果。在此之前的演出均是將合唱團(tuán)安排在正中間,其聲音的立體感便大打折扣。

而對(duì)于現(xiàn)代的回放設(shè)備,同樣經(jīng)歷了一個(gè)由單聲道到雙聲道,最后發(fā)展出了現(xiàn)在的全景聲。我想你應(yīng)該已經(jīng)理解了單聲道和雙聲道的意思,單聲道只有一個(gè)聲音在正中間播放,雙聲道有兩個(gè)聲音在左右大概各30度的位置播放

在這一基礎(chǔ)上繼續(xù)發(fā)展,便有了5.1、7.1等聲道的360度環(huán)繞聲,以及最低7.1.2聲道標(biāo)準(zhǔn)的全景聲。這里的小數(shù)點(diǎn)表達(dá)的是分割符的意思,并不是小數(shù),指的是音箱數(shù)量,5.1即環(huán)繞一圈的5只音箱和1個(gè)低音音箱構(gòu)成的環(huán)繞聲系統(tǒng),7.1.2即環(huán)繞一圈的7只音箱和1只低音音箱和頭頂?shù)?只音箱構(gòu)成的全景聲系統(tǒng)。

近幾年,廠家開始推出全景聲制作的相關(guān)插件、渲染器,使全景聲混音真正可行性,并且因?yàn)樘O果對(duì)于空間音頻的推廣,在國外全景聲混音作品日益增加。但遺憾的是,全景聲在目前國內(nèi)的市場認(rèn)可度并不高,國內(nèi)相當(dāng)多的混音師對(duì)全景聲技術(shù)也并不感冒,所以你甚至很難在網(wǎng)絡(luò)上找到全景聲混音的相關(guān)內(nèi)容。

1.2假立體聲是什么:

前面提到立體聲是由雙聲道構(gòu)建的,但并不是雙聲道就一定會(huì)有很強(qiáng)的立體感。用兩個(gè)單聲道的音頻同樣可以做成立體感,這就是被稱為假立體聲的手法。其聲學(xué)原理在于:信號(hào)差,即左右聲道的信號(hào)差越大,立體感越強(qiáng)。

也就是說,基于這個(gè)原理,將兩軌單聲道音頻稍微各往左右打一點(diǎn),然后擴(kuò)大兩者之間的信號(hào)差即可,這也是幾乎所有的image聲像類效果器的基本原理。

1.3給AI語音合成的一些建議(選看):

在這個(gè)視頻中,我使用的是稱為RVC變聲器的技術(shù),它可以加載人聲音色,再通過給它的人聲干聲推理出新的人聲音頻。

干聲提取與處理:

我使用的是UVR5來提取人聲,但提取出的人聲不能直接使用,因?yàn)槿匀粫?huì)混有很大的混響,會(huì)影響AI模型的推理。所以需要使用去混響插件,此外我還用EQ做了高切(保證人聲的主要頻率范圍完整即可,并且用門限器去除產(chǎn)生的雜音。據(jù)我實(shí)踐得出的結(jié)論,對(duì)于很多AI模型而言,干音的高頻會(huì)極大的干擾其推理的效果,但高切后推理出的音頻并不會(huì)缺失高頻。

假立體聲:

用AI合成出來的音頻為單聲道,而推理過程會(huì)需要提供一些參數(shù),所以提供微調(diào)這些參數(shù),就可以得到兩個(gè)天然存在信號(hào)差的單聲道音頻。然后通過調(diào)整其聲像,就可以得到立體感十足的聲音了。

這個(gè)做法目前看來應(yīng)該是b站首發(fā),并不是說假立體聲是什么新鮮的手法,而是指的我所見過的絕大多數(shù)AI語音合成作品,其聲音都是中置的單聲道而缺乏立體感。

值得一提的是,立體感以及聲音的寬度并非越大越好,你當(dāng)然可以通過調(diào)整伴奏,來為人聲讓出更多的空間。但是最重要的是人聲要和伴奏契合。

二、手術(shù)EQ與clip gain(必看)

希望你已經(jīng)看到eq掃頻和自動(dòng)化的內(nèi)容了。clip gain則是對(duì)音頻本身的音量包絡(luò)線進(jìn)行處理,控制音量不要忽高忽低,更好進(jìn)入地壓縮。值得一提的是,這種做法調(diào)整的音量會(huì)經(jīng)過該軌道所有的效果器,而自動(dòng)化是在經(jīng)過了效果器后再調(diào)整音量。

對(duì)聲音中不好聽的頻段,可以通過掃頻的方式確定并衰減它,這就是常說的手術(shù)eq,因?yàn)榫拖袷窃谧鲆恍┚?xì)的摘除手術(shù)一樣。很多多段的eq插件也是做這個(gè)用的,因?yàn)橥鶗?huì)有多個(gè)頻段需要去調(diào)整,一般三、四段eq就足夠了。

三、伴奏的人聲讓位(必看)

人聲讓位在這類混音中可以說是最重要的手法了。有多種方式可以讓伴奏為人聲空出位置,比如在時(shí)間、響度、頻率上,你可以對(duì)伴奏在人聲的重要頻率上進(jìn)行衰減(可以通過側(cè)鏈再用eq match的功能快速尋找到這些頻段),也可以通過側(cè)鏈壓縮的方式在時(shí)間和響度上對(duì)人聲進(jìn)行避讓。

四、人聲eq與壓縮(必看)

傳統(tǒng)做法通常會(huì)先用eq,再用壓縮,因?yàn)槟阍趀q中改變的雖然是某個(gè)頻段的音量,但還是會(huì)影響整體輸出的音量大小,所以接下來用壓縮控制音量就顯得是一件十分自然的事情。但實(shí)際上在數(shù)字時(shí)代,daw完全可以先壓縮再用eq,雖然這并不常用。

五、總線的處理(選看)

雖然這個(gè)視頻并沒有在總線做什么,但其實(shí)可以在總線上稍微做一下eq和染色等,比如前一個(gè)視頻當(dāng)中,我在總線上加了一個(gè)磁帶模擬的效果器。

對(duì)于這類視頻,在調(diào)整好伴奏和人聲的比例后,可以通過限幅器將響度提升至-14lufs。當(dāng)然也可以略大一些,但我一般并不建議上次b站的視頻響度超過-10lufs。

封面來源:重返未來1999

【隨便寫寫的音頻專欄】六、簡單的AI語音合成混音案例分析的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
清苑县| 巴东县| 新建县| 远安县| 古丈县| 楚雄市| 沙洋县| 茌平县| 那曲县| 当雄县| 将乐县| 武宣县| 福州市| 五大连池市| 英吉沙县| 临江市| 岳普湖县| 钟祥市| 天峻县| 贵南县| 青岛市| 克东县| 富阳市| 泰兴市| 穆棱市| 泸溪县| 杭州市| 高淳县| 乐东| 奇台县| 礼泉县| 琼海市| 大港区| 浑源县| 毕节市| 乌海市| 德化县| 泊头市| 牟定县| 陆河县| 连山|