最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【RVC教程】 AI 實(shí)時(shí)變聲器使用教程|AI降噪|音頻跳線

2023-05-27 09:36 作者:慕秋槿  | 我要投稿

完整圖文教程在群里(有問題可以加群問)

AI技術(shù)交流群:652859021


我的配置(僅供參考):?

CPU:13700KF?

顯卡:銘瑄RTX3080?

內(nèi)存:美商海盜船DDR4?32G*2、金士頓DDR4?8G*2?

主板:ROG?STRIX?B760-A?GAMING?WIFI?D4?吹雪?

水冷:瓦爾基里C360W-RGB?

鼠標(biāo):羅技G502?

鍵盤:黑峽谷GK715S

麥克風(fēng):HyperX極度未知?聲浪麥克風(fēng)


以下是會(huì)用到的工具及軟件(下載鏈接)


NVIDIA Broadcast(輸入聲音降噪)

https://www.nvidia.cn/geforce/broadcasting/broadcast-app/


RVC語音轉(zhuǎn)換(變聲器)

GitHub項(xiàng)目開源地址:https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI

變聲器框架:花兒不哭


Voicemeeter Potato(虛擬聲卡)

https://vb-audio.com/Voicemeeter/potato.htm


這里為了方便學(xué)習(xí),我已經(jīng)整理好了所有用到的軟件以及一些免費(fèi)的模型

鏈接:https://pan.quark.cn/s/bf5ce7268a48



完整圖文教程在群里?。?!

下載完這4個(gè)文件


這些先把這兩個(gè)軟件安裝了(應(yīng)該會(huì)讓你重啟電腦,如果沒讓你重啟,也最好手動(dòng)重啟一下)



使用NVIDIA Broadcast降噪

然后打開NVIDIA Broadcast

把麥克風(fēng)源改成你的輸入設(shè)備


如果不知道哪個(gè)是輸入設(shè)備,可以打開聲音設(shè)置


看哪個(gè)有顯示波形哪個(gè)就是輸入設(shè)備


這個(gè)噪聲消除是默認(rèn)打開的,你也可以調(diào)節(jié)它的強(qiáng)度



使用RVC實(shí)時(shí)語音轉(zhuǎn)換(變聲器)

然后我們打開RVC





點(diǎn)擊以后會(huì)彈出cmd以及前端

在使用過程中cmd和前端都不能關(guān)


加載模型

1.Hubert模型,在RVC-beta內(nèi),往下拉找到它


(提醒一下所有的模型文件庫必須設(shè)置英文)


2.pth文件,(聲音模型文件)

剛剛網(wǎng)盤下載的文件中有,請(qǐng)放在英文路徑的模型文件夾中?。?!

3.index文件,(聲音特征索引文件)同上

4.npy文件,可以忽視,



音頻設(shè)置

這樣輸入設(shè)置設(shè)置為nvidia broadcast的麥克風(fēng)(因?yàn)檫@是nvidia broadcast降噪過的輸出源)


然后我們?cè)诎演敵鲈O(shè)備調(diào)整為VoiceMeeter Input(這是Voicemeeter Potato安裝后的跳線通道)


注:這里選擇輸入輸出設(shè)備的時(shí)候注意看后面是否有帶(MME),選擇帶(MME)的



參數(shù)設(shè)置(該參數(shù)部分參考:Abbott風(fēng))

1.響應(yīng)閾值

盡量拉滿-60,這里說一下,同時(shí)開多個(gè)ai處理軟件,對(duì)顯存要求比較高,盡量8gb以上,不然打游戲都會(huì)卡的。

在提醒一下RVC在運(yùn)行時(shí)主要對(duì)CPU有一定的要求,CPU差的話它的延時(shí)(推理時(shí)間)就會(huì)很長

2.音調(diào)設(shè)置

男轉(zhuǎn)女一般在+12,在這附近左右調(diào)整可以變粗或變細(xì),選好之后就不要?jiǎng)恿恕?/p>

女轉(zhuǎn)男一般在-12,

3.index rate

這東西左邊是接近底模的音色,右邊是接近模型的音色。如果調(diào)高不影響口齒,可以略微調(diào)高,一般0.3-0.5都是可以的。如果模型效果不理想盡量往左。

4.采樣長度

盡量調(diào)低一些,只要不卡,0.3以上都可以。我一般就默認(rèn)1.0

5.淡入淡出長度

可以理解為尾音的長短,小了聲音清脆但容易斷字,大了聲音連貫但音色會(huì)糊。根據(jù)自己聽感來。

6.額外推理時(shí)長

一般2種選擇,當(dāng)采樣長度比較大的適合,可以保持采樣長度一樣的數(shù)值,但是說話會(huì)比較干,沒什么拖音。

另外一種選擇,可以考慮公式:采樣長度+額外推理時(shí)長=2這個(gè)公式,一般效果效果還不錯(cuò),說話連續(xù)性更強(qiáng)。

推理這個(gè)參數(shù)有點(diǎn)像壓限器的釋放時(shí)長,如果你想你的尾音拖的比較長就拉到1.5左右,如果想清爽點(diǎn),吐字如機(jī)關(guān)槍,那就往低了拉,一般到采樣長度左右就行。

7.輸入降噪 輸出降噪

下面的輸入輸出降噪建議不要開(影響變聲效果,而且影響推理時(shí)間,所以這里用了nvidia broadcast的ai降噪)


使用Voicemeeter Potato(虛擬聲卡)做音頻跳線操作

然后打開Voicemeeter Potato


你可以把這些默認(rèn)點(diǎn)亮的A1、B1關(guān)掉(劃線的是要關(guān)的)


我們點(diǎn)右上角A1


我們可以看到這里有很多的輸出設(shè)備,選擇你要輸出的設(shè)備就可以了




下面是整個(gè)聲音源的轉(zhuǎn)換流程圖












下面是聲音模型的訓(xùn)練教程

訓(xùn)練聲音模型

打開文件夾里的這個(gè)程序


會(huì)自動(dòng)打開cmd跳轉(zhuǎn)到網(wǎng)頁端(前端)

使用的時(shí)候cmd不要關(guān)



進(jìn)來以后這樣一個(gè)界面,我們點(diǎn)擊“訓(xùn)練”





采樣這邊越高越好(不過要看你的訓(xùn)練素材,如果訓(xùn)練素材采樣不好,再高也沒有用)




這是你的CPU線程數(shù)一般默認(rèn)最高就好了




用于聲音訓(xùn)練的文件夾(這里是文件夾,就算只有一條用于訓(xùn)練的聲音也要在音頻文件的上層建立一個(gè)文件夾)



里面放好聲音源

一般wav格式的聲源最好,MP3也行(MP3格式的采樣率不高,有wav格式優(yōu)先wav格式)


這里可以鼠標(biāo)右鍵復(fù)制文件地址




我一般就選擇這個(gè)(13700kf無所畏懼)




這里我一般就這么設(shè)置


保存頻率:默認(rèn)是5,不過我一般設(shè)置20


總訓(xùn)練輪數(shù):1000

不過這個(gè)訓(xùn)練輪數(shù)不是越高越好的,訓(xùn)練輪數(shù)多了會(huì)過擬合 反正就是模型效果會(huì)變差,

而且訓(xùn)練時(shí)間是真的慢,10分鐘的訓(xùn)練音源(干凈的人聲)RTX3080跑1000輪要一個(gè)小時(shí)左右,

不過如果真的要煉一個(gè)非常好的聲音,推薦音源都是在一個(gè)小時(shí)以上的(音源干凈非常重要)


每張顯卡的batch_size:這是調(diào)整訓(xùn)練時(shí)顯存占用的,你調(diào)的越大訓(xùn)練的越快,不過重點(diǎn)就是看你的顯卡了

像我RTX3080 10G 給20就跑滿了,再高就會(huì)報(bào)錯(cuò)或無法訓(xùn)練



然后這個(gè),我推薦打開“是”,

不開的話非常容易滿硬盤(500輪就100G了)

然后我推薦把這個(gè)RVC軟件放在固態(tài)里面的,可以加速訓(xùn)練時(shí)間



下面這兩個(gè)是預(yù)訓(xùn)練的底模路徑(大佬可以自行調(diào)整)



底模路徑就在RVC文件夾里



打開可以看到預(yù)訓(xùn)練的底模



設(shè)置好這些就可以開始訓(xùn)練了



訓(xùn)練的時(shí)候它會(huì)幫你把完整的音頻文件拆開(在logs文件夾里)

點(diǎn)你命名的那個(gè)模型名的文件夾



這兩個(gè)文件夾里面是拆好的音頻文件




然后 訓(xùn)練完后在你命名的模型名文件夾里,有這個(gè)added開頭的文件,這是模型的聲音特征索引文件



如果訓(xùn)練完沒有的話可以點(diǎn)這個(gè),重新訓(xùn)練一份聲音特征索引(這個(gè)聲音特征索引,訓(xùn)練幾秒鐘就好了)


看右下角輸出信息,顯示訓(xùn)練完成就好了


使用模型推理查看訓(xùn)練效果

然后可以去模型推理查看訓(xùn)練效果



選擇你剛剛訓(xùn)練出來的模型



變調(diào):男轉(zhuǎn)女+12,女轉(zhuǎn)男-12

然后選擇你的原聲錄音,添加到待處理音頻文件路徑中(這里是音頻文件,不是文件夾)

提取算法選擇 harvest



點(diǎn)擊這個(gè)index路徑選擇框,選擇訓(xùn)練好的模型聲音特征索引,這個(gè)聲音特征索引要跟你訓(xùn)練出來的聲音模型是匹配的,用不匹配的模型聲音特征索引轉(zhuǎn)換出來的聲音會(huì)很奇怪


這邊設(shè)置好以后轉(zhuǎn)換就可以了,稍等一會(huì)右側(cè)就會(huì)出現(xiàn)播放按鈕

【RVC教程】 AI 實(shí)時(shí)變聲器使用教程|AI降噪|音頻跳線的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
潼关县| 高唐县| 石渠县| 新野县| 沽源县| 资阳市| 崇义县| 湘乡市| 长治县| 临泉县| 衡水市| 油尖旺区| 镇安县| 昌都县| 沁源县| 夹江县| 蒙城县| 湘乡市| 武川县| 柘城县| 屏山县| 清水县| 浦城县| 婺源县| 乐昌市| 乐东| 巴塘县| 辽阳市| 湘乡市| 奈曼旗| 资兴市| 马龙县| 金坛市| 临武县| 麟游县| 嘉义县| 庆元县| 南宁市| 宜丰县| 叙永县| 墨江|