玩玩AI語音
上https://huggingface.co/lj1995/VoiceConversionWebUI弄了個AI的語音模型,但是這個作者沒寫readme,所以折騰了很久才跑起來:
首先是版本,我本地的3.10.6并沒有跑起來,換用conda的3.8才跑起來的,其他版本我也不知道能不能行

首先安裝庫前先確定2件事:
第一:安裝vc++:https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/
有幾個庫需要vc++編譯源代碼
第二:你的setuptools版本必須低于58.0,否則沒有2to3的腳本,有幾個庫安裝不了,我這里安裝的是57.5.0,如果你是命令行安裝則輸入pip install setuptools==57.5.0


接下來缺了不少庫,一個一個安裝:
先按裝ffmpeg吧,https://www.ffmpeg.org/download.html,下載到以后把ffmpeg加入PATH,至少要能讓找到ffprobe.exe

接下來安裝fairseq,gradio,torch,praat-parselmouth
我開始這里就被報錯騙了,報錯報的找不到parselmouth,結(jié)果裝上以后告訴我找不到Sound方法,后來在https://github.com/innnky/so-vits-svc/issues/73發(fā)現(xiàn)了一個跟我一樣被坑的人
接下來還有兩個地方的源代碼要修改:
第一個:
把urllib的__init__.py里加上from urllib.parse import quote
如果已經(jīng)有from urllib import quote,則把這句改成from urllib.parse import quote

第二個:
我搞忘了是哪個文件了,運(yùn)行到這里的時候會有個地方的
報錯,你跟進(jìn)報錯的文件,把這里修改成:
即可
接下來不出意外的話就可以運(yùn)行起來了,直接運(yùn)行infer-web.py,

然后等一會會出現(xiàn)一個url,我這里是http://127.0.0.1:7860/,進(jìn)去以后就可以看到它的webui了

接下來就可以愉快的玩耍了,沒有n卡的話稍微慢一點(diǎn),但是也不會特別慢,我這里5600X頻率4.6G一首歌大概需要220秒