語音AI測試記錄
我目前試過的可用方法:
diff-svc,音頻變聲,只需要訓練一個角色,優(yōu)點:轉換較長的聲音很快,對于存在音高變化的人聲歌唱轉換后的效果很好。?缺點:如果轉換的是音調變化較少的語音,比如普通說話,當原音與需要變聲的角色音調、音色差距很大時,結果也會比較糟,轉換后經(jīng)常會有電流音。
so?vits,?用插件實時變聲+音頻變聲,只需要訓練一個角色 實時變聲很香,其他待測
VITS,TTS文字轉聲音+音頻變聲,?需要訓練兩個音色然后1對1轉換?,優(yōu)點:可以文字轉語音,音頻變聲基于1對1轉換,只要兩個音色訓練到位,轉換效果很好。缺點:文字轉語音的效果與訓練素材有很高的相關性,特別是缺少某些比較少見的句子時,合成的語音會有較大瑕疵。情感可調,但并不使用與多角色,遺憾,要是能多角色通用就好了。日語訓練素材轉到中文說話時,會有很濃厚的大佐音,目前的解決辦法是用語音轉換后再訓練,效果還行。
標簽:學習