開源tts測試結(jié)果
無論用項(xiàng)目自帶的模型還是有聲音克隆功能的自己去訓(xùn)練,短時間內(nèi)都出不了太好效果,啞音、發(fā)音不標(biāo)準(zhǔn)等情況是普遍存在,應(yīng)該是需要微調(diào)的。
我主要試了以下幾個開源倉庫:
1、vits:https://github.com/jaywalnut310/vits
我自己的測試效果(沒做微調(diào),啞音是肯定的),二次元感覺明顯,中文帶日文口音,英文很多發(fā)音都不太好??戳似渌说男Ч杏X就是適合二次元的。

2、bark:https://github.com/suno-ai/bark
emmmm,聲音克隆功能下線了,使用已有的模型測試了一下,情緒或者語氣詞之類的確實(shí)比vits處理的好,聽說更新是支持長音頻了,但是我沒測試出來,可以自己試試。

3、https://github.com/CjangCjengh/vits

需要做聲音克隆的可以考慮以下幾個開源倉庫:

①so-vits
做二次元的效果相對會好一點(diǎn),但是不帶tts功能,只能音頻轉(zhuǎn)音頻。

②DDSP-SVC

③MockingBird
感覺效果還不如vits。

結(jié)論:等待浙大項(xiàng)目開源

標(biāo)簽: