DiffSinger全流程教程(二)
歌聲合成
這一部分主要為只是想體驗(yàn),不打算自己訓(xùn)練的同學(xué)準(zhǔn)備,訓(xùn)練請直接看(三)
聲庫共享表格:https://www.yuque.com/sunsa-i3ayc/sivu7h/vgbdclc62qnccd55
最新的語雀更新:https://www.yuque.com/sunsa-i3ayc/sivu7h

這里以氧氣老師Fork的適用于DiffSinger的OpenUTAU為例
一、下載適用于DiffSinger的OpenUtau
https://github.com/xunmengshe/OpenUtau/releases
推薦帶有DiffsingerPack的整合包
如果加載過慢可以右鍵復(fù)制鏈接使用https://d.serctl.com/搭配idm等多線程下載程序進(jìn)行加速下載

二、下載音源,拖入OpenUTAU窗口安裝
安裝時(shí)右上角選擇能正常顯示的編碼,如utf-8



三、選擇歌手
在音軌左側(cè)的歌手菜單的“DiffSinger”分類中找到你安裝的歌手,選擇
注:歌詞支持漢字或拼音輸入,連音符為加號(hào)+,呼吸音為AP,停頓為SP
說明
OpenUTAU默認(rèn)開啟自動(dòng)預(yù)渲染,即你每進(jìn)行一筆編輯,都會(huì)立即渲染音頻并緩存。如果OpenUTAU卡頓,可在“工具→使用偏好→渲染”中關(guān)閉自動(dòng)預(yù)渲染
DiffSinger相關(guān)設(shè)置可在“工具→使用偏好→渲染”中編輯:
渲染加速倍數(shù):默認(rèn)為50倍。降低加速倍數(shù)可提高音質(zhì),但會(huì)使合成速度變慢
默認(rèn)使用CPU渲染,使用DirectML渲染速度更快。請將“機(jī)器學(xué)習(xí)運(yùn)行器”設(shè)置為directml,GPU選擇你的獨(dú)顯(NVIDIA和AMD顯卡均支持),然后重新啟動(dòng)OpenUTAU

參數(shù)
DiffDinger支持以下參數(shù)
音高曲線
音素長度
DYN(音量曲線)
GENC(性別,需音源支持,默認(rèn)可調(diào)范圍±100相當(dāng)于?12半音,正方向?yàn)槟新暎ü舱穹褰档停?/span>
參數(shù)的可調(diào)范圍可在鋼琴窗左下角的齒輪圖標(biāo)設(shè)置

音素器
目前OpenUTAU for Diffsinger包含4個(gè)用于Diffsinger的音素器:
DIFFS ZH 位于ZH分類,基于OpenUTAU內(nèi)置的vogen音素模型,無需配置,支持漢語普通話
DIFFS RHY 位于ZH分類,基于 Diffsinger rhythmizer音素模型,效果更好
ENUNU X 位于General分類,基于NNSVS音素模型,需要音源開發(fā)者適配。適用于ENUNU支持的各種自定義語言。使用方法
ENUNU X EN 位于EN分類,基于NNSVS音素模型,需要音源開發(fā)者適配。適用于使用CMUDict的英文音源。使用方法
目前限制
暫不支持多說話人混合
