關(guān)于優(yōu)香AI的使用教程
鑒于近來點(diǎn)歌的人增多,以及有人要sovits的教程,我先把教程放這里,未來各位可以自己動(dòng)手豐衣足食,順便擴(kuò)充優(yōu)香歌曲量
1.下載AI程序:
地址:https://github.com/innnky/so-vits-svc?
假如安裝有g(shù)it的話,可以使用git clone命令下載?
但是如果沒git的話請點(diǎn)擊右上角的code->Download ZIP下載程序?
記得左上角的分支選擇32k,因?yàn)槲业哪P筒蓸勇视?xùn)練的是32k?
2.安裝python環(huán)境,并安裝環(huán)境依賴?
安裝python:
強(qiáng)烈建議安裝anaconda或者miniconda,因?yàn)榭梢越o語音推理模型隔離一個(gè)單獨(dú)環(huán)境
(1):anaconda或者miniconda的安裝教程:https://blog.csdn.net/weixin_42855758/article/details/122795125
(2)安裝完畢后請創(chuàng)建虛擬環(huán)境:
首先進(jìn)入CMD(命令提示符),之后輸入命令
創(chuàng)建環(huán)境命令為:conda create -n env_name python=3.8
其中env_name為環(huán)境名,可任意輸入,python后面為版本號,這里使用3.8
比如conda create -n test?python=3.8
環(huán)境創(chuàng)建完成后,可使用activate env_name激活環(huán)境
其中env_name為你所創(chuàng)建環(huán)境名
比如activate test
詳細(xì)過程可查看:https://blog.csdn.net/Sir666888/article/details/124543883
安裝依賴:
首先進(jìn)入CMD(命令提示符),之后輸入命令
cd?[程序文件路徑]
比如筆者的程序路徑為D:\so-vits-svc-32k\so-vits-svc-32k
那么就是輸入cd?D:\so-vits-svc-32k\so-vits-svc-32k
如果無法跳轉(zhuǎn),請先輸入盤符
比如D:\
之后輸入pip?install -r ./requirements.txt
會(huì)自動(dòng)完成程序運(yùn)行依賴的安裝
如果下載速度過慢,那么需要換清華源
換源的命令為:
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
3.下載優(yōu)香生成器網(wǎng)絡(luò)模型參數(shù) 鏈接:https://pan.baidu.com/s/1N8J7auoGz44qW2IcwkUAaQ 提取碼:AAAA?
?地址在上面,里面應(yīng)該是倆文件,一個(gè)config一個(gè)G_37000?
4.進(jìn)入inference_main.py,隨后在17行將
model_path = "" ? ? ?設(shè)置成G_37000模型參數(shù)的路徑?
config_path = "" ? ? ?設(shè)置成config文件的路徑?
?25行這里改成?
spk_list = ['youka']?
剩下參數(shù)根據(jù)喜好自行調(diào)整?
歌曲干聲提取與推理過程可參考:https://www.bilibili.com/read/cv20533940
注意,歌曲推理可以不需要很好的GPU,實(shí)踐證明CPU也可以在有限的時(shí)間內(nèi)完成推理,經(jīng)測試AMD R7 3700平均一秒鐘推理一秒歌曲?
若使用CPU進(jìn)行推理,請進(jìn)入inference/infer_tool.py中,并在21行下加入: os.environ["CUDA_VISIBLE_DEVICES"] = "-1"?
5.可將模型推理出的聲音加載進(jìn)Adobe Audition進(jìn)行后處理,該加混響加混響,該調(diào)EQ調(diào)EQ,該加和聲加和聲,該做濾波做濾波?
6.與伴奏合成,完成
如果在推理過程中遇見bug,可參考文章:https://www.bilibili.com/read/cv20997087
未來可能發(fā)的優(yōu)香AI的少了,近來破事太多了