DDSP-SVC訓(xùn)練詳細(xì)教程:門檻最低的AI聲音轉(zhuǎn)換模型
聲明:本軟件開源協(xié)議為MIT。簡單來說,你使用這個(gè)軟件進(jìn)行的行為,責(zé)任全都由你自己承擔(dān)。所以請自重

DDSP-SVC優(yōu)勢在于訓(xùn)練和推理速度比so-vits-svc快很多?;旧掀胀ǖ膎vidia顯卡都能訓(xùn)練。歌聲效果可能不如so-vits-svc,但是實(shí)時(shí)變聲效果比它好很多,主要優(yōu)勢還是硬件要求低

數(shù)據(jù)集準(zhǔn)備
44100Hz采樣率,wav格式,PCM-16編碼,單聲道,時(shí)長建議高于2s低于15s
100條也許可以訓(xùn)練,我用了320條。
選10條優(yōu)質(zhì)的放在data\val\audio文件夾下作為驗(yàn)證集,剩下的放在data\train\audio
然后打開webui,選擇你的訓(xùn)練設(shè)置

batch_size可以不動(dòng),如果爆顯存了可以調(diào)小。其他保持默認(rèn)即可。顯存較小的可以取消勾選“啟用緩存”。設(shè)置完畢點(diǎn)擊“創(chuàng)建配置文件”。你應(yīng)該可以在configs文件夾下看到opt.yaml這個(gè)文件??梢源蜷_檢查里面的配置是否正確
預(yù)處理
點(diǎn)擊“開始預(yù)處理”。耐心等待一會,應(yīng)該會出現(xiàn)這樣的進(jìn)度條

結(jié)束后開始訓(xùn)練。
訓(xùn)練
點(diǎn)擊“開始訓(xùn)練”,如果命令行顯示進(jìn)度是正常的。

可視化進(jìn)度
啟動(dòng)可視化按鈕只在Linux上工作。在Windows下啟動(dòng)你需要在根目錄新建一個(gè)txt,輸入
cd DDSP-SVC&&.\runtime\Scripts\activate.bat&&.\runtime\python.exe .\runtime\Scripts\tensorboard.exe --logdir=exp

并重命名后綴為bat,然后雙擊

然后再瀏覽器里面輸入下面顯示的網(wǎng)址就行。train/loss越低越好。等待它下降,到快要停止下降的時(shí)候差不多就行了
