【sovitsAI語音】在colab部署,新人學(xué)習(xí)分享

? ? ? ? 最近很多人都學(xué)習(xí)了@Rcell在github上的項(xiàng)目https://github.com/innnky/so-vits-svc,制作了有趣的視頻和懶人包。首先對作者Rcell致敬,開發(fā)了這么有趣的項(xiàng)目。我沒有合適的顯卡,加上不想配置本地環(huán)境,所以用了google Colab。
????????colab可以免費(fèi)使用,但是時(shí)間長了,會分不到GPU資源,所以時(shí)間較長的訓(xùn)練可能會跑不玩。付費(fèi)的colab pro現(xiàn)在是84塊左右,一個(gè)月時(shí)限,99個(gè)計(jì)算單元,大概1個(gè)小時(shí)2個(gè)計(jì)算單元,也就是總共可以用50個(gè)小時(shí)左右。昨天我分到的顯卡是tesla t4,大約相當(dāng)于顯存翻倍的2070s。

?
進(jìn)入https://github.com/innnky/so-vits-svc,可以點(diǎn)擊32k處選擇分支版本,我選擇4.0版本。

作者將python程序的執(zhí)行順序?qū)懺赾olab上,很貼心。閱讀完README.MD后點(diǎn)擊Open in Colab.


前面一直執(zhí)行命令即可,等前一個(gè)命令執(zhí)行完再執(zhí)行后一個(gè)命令。







將數(shù)據(jù)做成.wav文件壓縮上傳到谷歌云盤,建一個(gè)叫dataset的文件夾,存在里面。這里是EULA.zip.


unzip -d? /content/so-vits-svs/dataset_raw? {ZIP_NAME}.zip 將該zip文件解壓到dataset_raw.
該壓縮文件是/content/drive/MyDrive/dataset/kiritan.zip

DATASETNAME,可以修改,但是要和上傳存在MyDrive/dataset/下的文件名同名。這里我的dataset下存的是EULA.zip,所以DATASETNAME:EULA。在谷歌盤里,根目錄下為dataset/,掛載到Colab是/content/drive/MyDrive/dataset/。
修改完成后點(diǎn)擊按鈕執(zhí)行。
命令會將/conntent/drive/MyDrive/dataset/EULA.zip解壓縮到/content/so-vits-svc/dataset_raw/EULA/下?,F(xiàn)在點(diǎn)擊colab最左邊的文件,文件結(jié)構(gòu)是這樣。

如果要處理不同的角色的聲音,只需重新命名,上傳,改DATASETNAME就可以了。

這時(shí)文件結(jié)構(gòu)會變成:

這個(gè)dataset和谷歌云盤里村zip文件的dataset不是一個(gè)文件夾。

生成了/content/so-vits-svc/configs/config.json 用于控制訓(xùn)練時(shí)的參數(shù)的配置文件。/content/so-vits-svc/filelists/test.txt(測試模型用),/content/so-vits-svc/filelists/train.txt(訓(xùn)練模型用),/content/so-vits-svc/filelists/val.txt(用于測試時(shí),與模型的輸出做對比,也就是說,test.txt與val.txt是一樣的。)

將數(shù)據(jù)備份到谷歌云盤。

可能實(shí)驗(yàn)不是一天能做完,就可以將上次備份的數(shù)據(jù)復(fù)制過來。

開始訓(xùn)練,第一次訓(xùn)練save_to_drive和pre_pth都要打勾。主要是要用到/content/so-vits-svc/logs/44k/G_0.pth和D_0.pth。以后訓(xùn)練訓(xùn)練出自己的記錄點(diǎn),比如1000steps后得到個(gè)G_1000.pth和D_1000.pth,pre_pth就不打勾。可以從該記錄點(diǎn)開始繼續(xù)訓(xùn)練。


然后就可以開始了。可以在config.json里面自定義參數(shù)。



因?yàn)橛凶髡叩囊绘I部署腳本,在Colab上運(yùn)行這個(gè)項(xiàng)目還是很簡單的。學(xué)習(xí)記錄而已,希望可以幫到一些伙伴。