玩玩AI語音

2023-03-02 13:24 作者:橘里橘氣橘子花 0人讀過 | 我要投稿

上https://huggingface.co/lj1995/VoiceConversionWebUI弄了個AI的語音模型，但是這個作者沒寫readme，所以折騰了很久才跑起來：

首先是版本，我本地的3.10.6并沒有跑起來，換用conda的3.8才跑起來的，其他版本我也不知道能不能行

首先安裝庫前先確定2件事：

第一：安裝vc++：https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/

有幾個庫需要vc++編譯源代碼

第二：你的setuptools版本必須低于58.0，否則沒有2to3的腳本，有幾個庫安裝不了，我這里安裝的是57.5.0，如果你是命令行安裝則輸入pip install setuptools==57.5.0

接下來缺了不少庫，一個一個安裝：

先按裝ffmpeg吧，https://www.ffmpeg.org/download.html，下載到以后把ffmpeg加入PATH，至少要能讓找到ffprobe.exe

接下來安裝fairseq，gradio，torch，praat-parselmouth

我開始這里就被報錯騙了，報錯報的找不到parselmouth，結(jié)果裝上以后告訴我找不到Sound方法，后來在https://github.com/innnky/so-vits-svc/issues/73發(fā)現(xiàn)了一個跟我一樣被坑的人

接下來還有兩個地方的源代碼要修改：

第一個：

把urllib的__init__.py里加上from urllib.parse import quote

如果已經(jīng)有from urllib import quote，則把這句改成from urllib.parse import quote

第二個：

我搞忘了是哪個文件了，運(yùn)行到這里的時候會有個地方的

報錯，你跟進(jìn)報錯的文件，把這里修改成：

即可

接下來不出意外的話就可以運(yùn)行起來了，直接運(yùn)行infer-web.py，

然后等一會會出現(xiàn)一個url，我這里是http://127.0.0.1:7860/，進(jìn)去以后就可以看到它的webui了

接下來就可以愉快的玩耍了，沒有n卡的話稍微慢一點(diǎn)，但是也不會特別慢，我這里5600X頻率4.6G一首歌大概需要220秒

標(biāo)簽：

玩玩AI語音的評論 (共條)