最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

AutoDL平臺(tái)so-vits-svc常見(jiàn)問(wèn)題匯總

2023-03-11 16:12 作者:Delta_德塔  | 我要投稿

sovits使用規(guī)約:sovits使用規(guī)約

訓(xùn)練推理請(qǐng)務(wù)必保證素材來(lái)源以及使用方式合法合規(guī),任何由于使用非授權(quán)數(shù)據(jù)集進(jìn)行訓(xùn)練造成的問(wèn)題,需自行承擔(dān)全部責(zé)任和一切后果。

本專(zhuān)欄針對(duì)AutoDL平臺(tái)線(xiàn)上的sovits訓(xùn)練推理問(wèn)題。

本地訓(xùn)練推理可以參考下面的視頻和專(zhuān)欄:


數(shù)據(jù)集處理階段

Q1:訓(xùn)練需要多少/多長(zhǎng)的音頻素材?

A:數(shù)據(jù)集的數(shù)量和 長(zhǎng)度都沒(méi)有特別硬性的要求,每條長(zhǎng)度五秒十秒或者十幾秒都可以,太長(zhǎng)的素材可以用切片機(jī),切片機(jī)如果之前視頻教程下的切片機(jī)不會(huì)用,可以用上面懶人包的GUI版。數(shù)據(jù)集總長(zhǎng)度十幾分鐘,幾十分鐘一兩個(gè)小時(shí)都不是不可以,不過(guò)數(shù)據(jù)集量太少可能影響訓(xùn)練效果,所以可能的話(huà)推薦準(zhǔn)備一兩個(gè)小時(shí)的數(shù)據(jù)集,不過(guò)不建議復(fù)制音頻填充數(shù)量,那樣訓(xùn)練集會(huì)比較單一。

Q2:為什么我準(zhǔn)備的數(shù)據(jù)集按照視頻解壓/重采樣失敗了?

A:首先檢查你執(zhí)行指令的終端是否在數(shù)據(jù)集文件所在文件夾下,例如當(dāng)你的壓縮文件在dataset_raw文件夾下時(shí),務(wù)必保證終端輸入時(shí), :之后#之前有dataset_raw的字樣,如下圖。

:之后,#之前是當(dāng)前文件夾的路徑

壓縮文件在其他文件夾下時(shí)依此類(lèi)推。如果不在對(duì)應(yīng)文件夾下,請(qǐng)?jiān)谠撐募A下重新打開(kāi)終端,或者熟悉linux操作可以cd移動(dòng)過(guò)去。

其次,執(zhí)行unzip指令請(qǐng)保證你的壓縮文件是zip格式,改文件后綴為zip并不能把rar文件改成zip格式,請(qǐng)壓縮成zip格式。

最后請(qǐng)保證你的訓(xùn)練集是wav格式,改文件后綴為wav并不能把mp3文件改成wav格式,請(qǐng)自己找格式工廠(chǎng)之類(lèi)的音頻格式轉(zhuǎn)換軟件。

另外,文件名包含一些特殊符號(hào)有可能導(dǎo)致后續(xù)步驟出錯(cuò),保險(xiǎn)起見(jiàn)建議文件名改為純英文數(shù)字的形式,數(shù)據(jù)集量較大請(qǐng)自行百度文件名批量修改的方法。

Q3:數(shù)據(jù)集是純說(shuō)話(huà)/純唱歌/說(shuō)話(huà)和唱歌混在一起可以嗎?

A:可以。

Q4:同一個(gè)人多種聲線(xiàn)/多人說(shuō)話(huà)/有說(shuō)話(huà)聲以外的雜音可以嗎?

A:不可以,嚴(yán)重影響效果。

Q5:其他問(wèn)題報(bào)錯(cuò)。

A:線(xiàn)上平臺(tái)使用鏡像按照正常流程來(lái)理論上是不會(huì)有問(wèn)題的,如果出現(xiàn)什么奇怪的報(bào)錯(cuò),一般是某一個(gè)步驟沒(méi)有按照流程來(lái),或者沒(méi)有等之前的步驟執(zhí)行完就著急執(zhí)行了下一步之類(lèi)的,如果自己都沒(méi)注意到之前哪里做的和教程不一樣,那這種情況很難定位問(wèn)題原因,總之一律建議重置一下鏡像從頭開(kāi)始嚴(yán)格按照流程再?lài)L試一遍。

訓(xùn)練階段

Q6:為什么我執(zhí)行開(kāi)始訓(xùn)練沒(méi)有開(kāi)始訓(xùn)練?

A:如果是在終端執(zhí)行代碼開(kāi)始訓(xùn)練,同Q2,先檢查終端是否在so-vits-svc的項(xiàng)目文件夾下,不在的話(huà)請(qǐng)?jiān)陧?xiàng)目文件夾下打開(kāi)終端或者cd過(guò)去,再檢查執(zhí)行的指令前面帶沒(méi)帶感嘆號(hào),如果帶了感嘆號(hào)請(qǐng)將感嘆號(hào)去掉。

如果在readme文檔中執(zhí)行開(kāi)始訓(xùn)練,首先不推薦你在這兒執(zhí)行開(kāi)始訓(xùn)練,你如果一意孤行的話(huà),那你檢查下執(zhí)行的指令前面帶沒(méi)帶感嘆號(hào),如果沒(méi)帶感嘆號(hào)請(qǐng)加一個(gè)英文感嘆號(hào)。

Q7:我ctrl+c中止訓(xùn)練了,怎么重新開(kāi)始訓(xùn)練?

A:按照開(kāi)始訓(xùn)練的正常流程,重新執(zhí)行開(kāi)始訓(xùn)練的代碼。

Q8:我空間不夠了,可以擴(kuò)容嗎/可以刪掉之前比較早的版本的模型嗎?

A:可以。

Q9:我之前訓(xùn)練停了,為什么繼續(xù)訓(xùn)練又從頭開(kāi)始了?

A:首先,改一下config文件,把epochs改大點(diǎn)試試。如果是盤(pán)滿(mǎn)了停了的話(huà),有可能你最后保存的模型因?yàn)榭臻g不夠的原因保存的是損壞的模型,沒(méi)法讀取進(jìn)度繼續(xù)訓(xùn)練,把最后生成的模型刪掉保留倒數(shù)第二個(gè)再試試。

Q10:多久保存一個(gè)模型/多久一個(gè)epoch是正常的?

A:跟你數(shù)據(jù)集的量有關(guān)系,多久都是正常的。

Q11:我Epoch后面一直是0%是不是有問(wèn)題?

A:不是,那玩意不是進(jìn)度,不用管它。

Q12:我租的顯卡在訓(xùn)練,自己的電腦可不可以關(guān)機(jī)/網(wǎng)頁(yè)可不可以關(guān)掉?

A:可以,你甚至換電腦都行,你租的實(shí)例相當(dāng)于租了臺(tái)電腦主機(jī),開(kāi)個(gè)網(wǎng)頁(yè)相當(dāng)于連了下你自己的顯示器,你把顯示器關(guān)了主機(jī)該干什么肯定還在干什么。

Q13:我租配置和我自己的電腦配置有沒(méi)有關(guān)系?

A:沒(méi)有。

Q14:我Epoch后面一直是0%是不是有問(wèn)題?

A:不是,那玩意不是進(jìn)度,不用管它。

Q15:一般訓(xùn)練多少個(gè)Epoch/多長(zhǎng)時(shí)間效果會(huì)好?

A:沒(méi)有這種標(biāo)準(zhǔn),也是跟你數(shù)據(jù)集的情況有關(guān)系。訓(xùn)練過(guò)程中的那些losses可以看作是評(píng)估的數(shù)值,簡(jiǎn)單點(diǎn)說(shuō)那五個(gè)數(shù)都是數(shù)字越小越好,如果數(shù)字開(kāi)始不怎么繼續(xù)往下降了,甚至開(kāi)始反復(fù)橫跳了,那基本上訓(xùn)練能達(dá)到的效果就到這兒了。

losses可以看作是評(píng)估的數(shù)值

你也可以每隔一段時(shí)間就停一下訓(xùn)練,然后實(shí)際推理聽(tīng)聽(tīng)效果,如果你自己感覺(jué)訓(xùn)練出的模型已經(jīng)滿(mǎn)足預(yù)期了也不用再繼續(xù)了。

Q16:訓(xùn)練報(bào)錯(cuò)了怎么辦?

A:首先找報(bào)錯(cuò)信息,一般最下面幾行會(huì)有XXXXXErrorXXXX之類(lèi)的內(nèi)容,如下圖。

CUDA out of memory

OutOfMemoryError:CUDA out of memory這種就是最常見(jiàn)的,俗稱(chēng)炸顯存或者爆顯存,一般是你batch_size太大了,改小就能解決,還不行就再改小,直到行了為止。

如果是其他報(bào)錯(cuò),一樣,先到底下找Error這幾個(gè)字母,把那一行復(fù)制下來(lái)去百度,各種各樣的問(wèn)題一般肯定都有其他人遇到過(guò),并且成功解決的人會(huì)網(wǎng)絡(luò)上會(huì)分享出解決方案和心得,按照各路大佬的方案走一遍基本都能解決。有人遇到各種我沒(méi)見(jiàn)過(guò)的問(wèn)題來(lái)問(wèn)我,我基本也是走百度搜解決方案這個(gè)路子,有一定解決問(wèn)題的能力也沒(méi)必要經(jīng)過(guò)我這個(gè)中間商了。

如果說(shuō)你不具備問(wèn)題排錯(cuò)的基礎(chǔ)知識(shí)或者能力,那可以按照我下面的三板斧走一遍:

第一,關(guān)內(nèi)核重新來(lái)一遍。網(wǎng)頁(yè)左下角那個(gè)終端和芯片的按鍵,點(diǎn)進(jìn)去,把所有終端和內(nèi)核都關(guān)掉,重新開(kāi)新的終端再執(zhí)行一遍(適用于各種后臺(tái)占用性能導(dǎo)致的問(wèn)題)。

兩個(gè)數(shù)字分別是當(dāng)前終端和內(nèi)核的數(shù)量

第二,如果還是不管用,退出JupyterLab,關(guān)機(jī),重置鏡像,再開(kāi)機(jī),再試試(適用于各種不小心動(dòng)了依賴(lài)環(huán)境導(dǎo)致的問(wèn)題)。

重置鏡像

第三,還是不行的話(huà),原來(lái)這個(gè)實(shí)例關(guān)機(jī)釋放了吧,重新租一張別的型號(hào)的顯卡,比如A5000、3090之類(lèi)的,再試試(適用于各種顯卡型號(hào),cuda版本導(dǎo)致的問(wèn)題)。

俗話(huà)說(shuō)得好,重啟解決百分之九十,重裝系統(tǒng)解決百分之九十九,換電腦解決百分之百。這三板斧下去,操作再都正確的話(huà),基本上絕大部分的問(wèn)題都能解決。

Q17:訓(xùn)練好的模型怎么下載到我的電腦上?

A:右鍵下載,或者移動(dòng)到網(wǎng)盤(pán)文件夾后臺(tái)網(wǎng)盤(pán)下載,但是不太建議這么干,出問(wèn)題找我的人里面十個(gè)有六個(gè)是因?yàn)槟P湍玫絼e的地方用出的各種問(wèn)題,建議是在哪訓(xùn)練在哪推理。

推理階段

Q18:報(bào)錯(cuò)了怎么辦?

A:炸顯存的話(huà)把推理音頻剪短,其他絕大部分關(guān)內(nèi)核重新加載模型,耐心等加載完就能解決,剩下的大部分檢查下參數(shù)路徑文件名對(duì)不對(duì),不對(duì)的改過(guò)來(lái)也能解決,再剩下的轉(zhuǎn)一下wav文件類(lèi)型,改一下文件后綴wav的大小寫(xiě)基本也能解決。

其他問(wèn)題,同Q16,直接百度,或者走三板斧。

Q19:推理出來(lái)效果不好怎么辦?

A:多換幾個(gè)別的模型再試試(用G開(kāi)頭的模型,不要用D開(kāi)頭的,D模型是用來(lái)驗(yàn)證G模型的),多換幾首歌再試試,控制變量排除一下,定位問(wèn)題在哪。

如果是推理的那首歌的問(wèn)題,那就找干聲更清晰的歌推理,或者去找音頻處理教程看看有沒(méi)有解決雜音和聲之類(lèi)問(wèn)題的方法。

如果是訓(xùn)練出來(lái)的模型都不行,那建議重新篩選一下數(shù)據(jù)集,從頭開(kāi)始重新訓(xùn)練試試。

Q20:推理出來(lái)速度變快/慢了怎么辦?

A:一般是采樣率的問(wèn)題,在哪訓(xùn)練直接就地推理一般不會(huì)出現(xiàn)這樣的問(wèn)題,如果我的鏡像變速了,就換4.0webUI里面的32k3.0版本項(xiàng)目再試試,反之亦然,一般找不同版本的項(xiàng)目多試試總能找到一個(gè)不會(huì)變速的位置。

好像也有推理音頻的采樣率沒(méi)對(duì)上導(dǎo)致出這個(gè)問(wèn)題的情況,不過(guò)我沒(méi)遇到過(guò),如果試了幾次都不行,要不再試試把推理的音頻重新采樣一下。

Q21:我從別的地方拿來(lái)的模型為什么不能用?

A:首先,可能你拿的模型不是so-vits項(xiàng)目的模型,其次,可能模型訓(xùn)練的項(xiàng)目版本和鏡像的版本不一致。如果檢查文件名路徑之類(lèi)的都沒(méi)有錯(cuò)誤,就是推理不出來(lái),建議直接放棄,自己訓(xùn)練模型自己用。


AutoDL平臺(tái)so-vits-svc常見(jiàn)問(wèn)題匯總的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
德阳市| 高雄县| 济源市| 金寨县| 合肥市| 商河县| 罗江县| 淳化县| 色达县| 乡城县| 灵川县| 商都县| 玉树县| 天长市| 车致| 准格尔旗| 珲春市| 浮梁县| 新疆| 子洲县| 上饶市| 岚皋县| 湟源县| 建平县| 汶川县| 黎城县| 奉化市| 昌江| 安溪县| 乃东县| 卓资县| 屏边| 大理市| 阳春市| 土默特左旗| 旬阳县| 望都县| 报价| 紫云| 洮南市| 新田县|