解決aki秋葉整合包SD安裝sd-wav2lip-uhq遇到的各種問(wèn)題


最近在WIN11里使用秋葉SD整合包遇到了安裝sd-wAV2lip-uhq插件啟動(dòng)SD屢屢出問(wèn)題導(dǎo)致無(wú)法使用,例如提示pip安裝insightface無(wú)法編譯,啟動(dòng)git+https://github.com/suno-ai/bark.git一直報(bào)錯(cuò),wAV2lip點(diǎn)擊生成后報(bào)錯(cuò)等。
在SD的擴(kuò)展中安裝完sd-wAV2lip-uhq插件,啟動(dòng)SD,No module named 'insightface' ,一般會(huì)說(shuō)缺少insightface庫(kù),單獨(dú)在命令行中pip install?insightface進(jìn)行安裝,這是一個(gè)python的人臉識(shí)別插件,安裝需要依賴C++的編譯工具。一般終端會(huì)提醒你需要到https://visualstudio.microsoft.com/downloads/下載VS開(kāi)發(fā)工具,按網(wǎng)上的教程下載,估計(jì)需要6個(gè)多GB的空間占用,哭暈了要。
但老外給了一個(gè)比較好的方案,你需要先到前面的網(wǎng)址下載vs_buildtools.exe,在exe文件所在目錄的命令行中復(fù)制粘貼回車(chē)自動(dòng)安裝需要編譯的依賴工具就好,大概也就1個(gè)多GB大?。?/p>
vs_buildtools.exe --norestart --passive --downloadThenInstall --includeRecommended --add Microsoft.VisualStudio.Workload.NativeDesktop --add Microsoft.VisualStudio.Workload.VCTools --add Microsoft.VisualStudio.Workload.MSBuildTools

安裝完C++編譯環(huán)境后,重新命令行運(yùn)行pip install?insightface,則可以順利安裝。
另外再次啟動(dòng)SD可能還會(huì)告訴你缺少什么庫(kù),你就用pip繼續(xù)安裝。
2.此外還有兩個(gè)模型文件會(huì)告訴你丟失,無(wú)法下載。一個(gè)是detector.onnx,一個(gè)是classes。
目錄地址:C:\Users\[替換你的用戶名]\.ifnude
到https://www.123pan.com/s/ueDeVv-Xp0I.html,下載拷貝即可,如下圖。

3.啟動(dòng)終端遇到了git+https://github.com/suno-ai/bark.git一直報(bào)錯(cuò)
Failed to connect to github.com port 443: Timed out

怎么解決?打開(kāi)命令行關(guān)閉掉SSL驗(yàn)證即可。復(fù)制粘貼回車(chē),git config --global http.sslVerify false

命令行輸入:git clone https://github.com/suno-ai/bark.git

命令行輸入:pip install bark --prefer-binary

最后,你的AKI秋葉整合SD的終端啟動(dòng)狀態(tài)應(yīng)該是如下的信息,說(shuō)明成功咯。

但啟動(dòng)sd-wAV2lip-uhq的時(shí)候,可能你會(huì)遇到以下錯(cuò)誤,
Using cuda for inference.
Reading video frames...
Number of frames available for inference: 478
(80, 1807)
Length of mel chunks: 598
就卡死不動(dòng)了。


這個(gè)時(shí)候你關(guān)閉掉控制臺(tái),在命令行中運(yùn)行:pip install librosa==0.8.0

安裝完畢后,重新打開(kāi)控制臺(tái),就可以運(yùn)行,執(zhí)行速度稍微有點(diǎn)慢,剛開(kāi)始我以為又卡了,結(jié)果等待1分鐘左右就出現(xiàn)了繼續(xù)執(zhí)行的進(jìn)度條,RTX3060 12GB的顯卡。

運(yùn)行期間會(huì)檢查對(duì)應(yīng)的模型是否有安裝,否則還會(huì)報(bào)錯(cuò)哦,這個(gè)時(shí)候,你就需要根據(jù)上圖右側(cè)的路徑,下載模型,放到相應(yīng)的目錄。
WAV2Lip
https://iiitaphyd-my.sharepoint.com/:u:/g/personal/radrabha_m_research_iiit_ac_in/Eb3LEzbfuKlJiR600lQWRxgBIY27JZg80f7V9jtMfbNDaQ?e=TBFBVW
WAV2Lip + GAN
https://iiitaphyd-my.sharepoint.com/:u:/g/personal/radrabha_m_research_iiit_ac_in/EdjI7bZlgApMqsVoEUUXpLsBxqXbn5z8VTmoxp55YNDcIA?e=n9ljGW
s3fd
https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth
landmark predicator
https://github.com/numz/wAV2lip_uhq/blob/main/predicator/shape_predictor_68_face_landmarks.dat
重新運(yùn)行控制臺(tái),執(zhí)行生成,應(yīng)該就不會(huì)出現(xiàn)問(wèn)題咯。

完成執(zhí)行并成功導(dǎo)出mp4的界面!

講真,這種數(shù)字人的技術(shù),結(jié)合換臉,克隆聲音等,用的不好,就容易侵權(quán)或者用于詐騙,所以希望大家合法的使用,不要亂來(lái)哦。最后,如果能解決各位使用sd-wAV2lip-uhq遇到一些問(wèn)題,麻煩一鍵三連哦,寫(xiě)文章不易,支持原創(chuàng)人。
