So-Vits-SVC模型使用教程 (個(gè)人簡(jiǎn)易向)
以下簡(jiǎn)易教程僅為個(gè)人摸索出來的效果較好的使用習(xí)慣,請(qǐng)隨意修改,改進(jìn)。
*請(qǐng)?jiān)谡H说牡赖聵?biāo)準(zhǔn)內(nèi)使用模型,禁止使用模型抹黑任何藝人!?。≈x謝。
**作品不用注明模型來源。(但艾特我看的話會(huì)很開心~)
***如有與非本賬號(hào)發(fā)布的模型聯(lián)動(dòng)作品出現(xiàn),非制作者本意。
官方手冊(cè)地址:https://www.yuque.com/umoubuton/ueupp5/sdahi7m5m6r0ur1r
需要Windows系統(tǒng)?Mac據(jù)說也可以但是我不知道咋搞
手冊(cè)內(nèi)含整合包地址,下載并解壓。
我自己用的是v1(提取碼為g8n4那個(gè)),即完整整合包(非增量更新!)如想使用v2增量版整合包,需要按照手冊(cè)更改config文件。
所以我用的也是笨方法手動(dòng)復(fù)制模型。。
1. 網(wǎng)盤zip里的文件夾們:
????????1. logs: 用來替換整合包中logs文件夾
文件夾結(jié)構(gòu)(我應(yīng)該是都放對(duì)了,以防萬一):
logs?
–》44k (44k文件夾里放主模型G_xxxx.pt)
–》diffusion(diffusion文件夾里放擴(kuò)散模型model_xxxx.pt)
????????2. configs: 用來替換整合包中configs文件夾
configs --》內(nèi)含兩個(gè)配置文件
請(qǐng)嚴(yán)格對(duì)應(yīng)唱歌人的logs和configs文件夾,不可混用,替換歌手時(shí)建議先將logs 和 configs 文件夾改成其他名稱以防止混淆。例: 改成logs-kaito 和 configs-kaito 然后復(fù)制其他歌手的logs和configs文件夾到so-vits-svc文件夾。 (v2好像有更聰明的方法。。)
2. 音源干音:
必須只有干凈人聲,有和聲不太行。推理出來會(huì)山路十八彎。
UVR5 推薦提取干音線路(不唯一,僅推薦):以下模型不好下載的話我也可以傳個(gè)網(wǎng)盤
MDX-Net里先用Kim Vocal2 提取所有人聲。此時(shí)xx_instrumental 為伴奏,xx_vocal為所有人聲。
然后用同樣MDX-Net里UVR-MDX-NET Karaoke 2 提取xx_vocal里主唱干音。此時(shí)xx_vocal_instrumental為和聲, xx_vocal_vocal為推理所需要的干音。
(非必要)使用VR architecture 里 UVR-DeNoise 消除xx_vocal_vocal噪音(因?yàn)榻?jīng)常會(huì)有電流聲)。aggression setting 我一般選2
(非必要)最后根據(jù)干音混響程度,使用VR architecture 里 UVR-DeEcho-DeReverb 消混響。 aggression setting 我一般選1
3. 推理:
雙擊so-vits-svc文件夾里的?啟動(dòng)webui.bat,會(huì)彈出一個(gè)網(wǎng)頁。
選擇模型文件。
需要選擇主模型、主模型配置文件、擴(kuò)散模型和擴(kuò)散模型配置文件。
模型文件有的放了步數(shù)不同的兩個(gè),效果可能略微不同,請(qǐng)多多嘗試。
點(diǎn)擊加載模型 文件夾復(fù)制位置正確的話So-vits 說話人會(huì)出現(xiàn)歌手名。
把準(zhǔn)備好的干音拖進(jìn)框框。
選擇是否變調(diào)、f0預(yù)測(cè)器、淺擴(kuò)散步數(shù)(推薦60左右)和音頻自動(dòng)切片 (15)。
f0預(yù)測(cè)器里Rmvpe音質(zhì)好,但容易啞音。
Crepe音質(zhì)一般但高音表現(xiàn)好。
最好兩個(gè)(或所有預(yù)測(cè)器)都試一下,然后取長(zhǎng)補(bǔ)短拼接一下。
推理音頻一首歌時(shí)長(zhǎng)一般沒問題,再長(zhǎng)最好剪一下,不然會(huì)卡?。ㄎ?G顯卡)。
推理完記得下載音頻
4. 后處理:
(非必要)根據(jù)干音和推理結(jié)果,可以使用UVR5 VR architecture 里 UVR-DeNoise 處理一下。注意強(qiáng)度,aggression setting 我一般用2。
混響狂魔強(qiáng)烈建議至少加個(gè)混響,可以蓋住一部分機(jī)械音。audacity和audition就可以。看個(gè)人接受程度。
把伴奏,和聲,處理完的人聲合起來就好啦(升降調(diào)推理后伴奏和音也要升降調(diào)哦)
高級(jí)一點(diǎn)的話肥波之類的也可以照著視頻教程一通亂搞。常用肥波插件:NS1 Q3? C2 DS L2 具體咋用我也不是很懂。。b站教程很多,有時(shí)間可以看看。
差不多就是這些,不知不覺又話癆了很多,有問題請(qǐng)私信,或在模型發(fā)布視頻下面留言,我看到會(huì)盡量幫忙,跟it太相關(guān)的我也不太會(huì)。模型是我自己氪金煉的,數(shù)據(jù)收集也用了很久,有人用的話會(huì)很開心~
玩耍愉快~
免責(zé)聲明:本作品僅作為娛樂目的發(fā)布,可能造成的后果與使用的音聲轉(zhuǎn)換項(xiàng)目的作者、貢獻(xiàn)者無關(guān),本視頻使用AI合成技術(shù),視頻中演唱人聲并非歌手本人。