手機(jī)站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 生活 »日常 » DiffSinger全流程教程（二）

DiffSinger全流程教程（二）

2023-02-25 19:59 作者:孫颯_TS 0人讀過 | 我要投稿

歌聲合成

這一部分主要為只是想體驗(yàn)，不打算自己訓(xùn)練的同學(xué)準(zhǔn)備，訓(xùn)練請直接看（三）

聲庫共享表格：https://www.yuque.com/sunsa-i3ayc/sivu7h/vgbdclc62qnccd55

最新的語雀更新：https://www.yuque.com/sunsa-i3ayc/sivu7h

這里以氧氣老師Fork的適用于DiffSinger的OpenUTAU為例

一、下載適用于DiffSinger的OpenUtau

https://github.com/xunmengshe/OpenUtau/releases

推薦帶有DiffsingerPack的整合包

如果加載過慢可以右鍵復(fù)制鏈接使用https://d.serctl.com/搭配idm等多線程下載程序進(jìn)行加速下載

二、下載音源，拖入OpenUTAU窗口安裝

安裝時(shí)右上角選擇能正常顯示的編碼，如utf-8

三、選擇歌手

在音軌左側(cè)的歌手菜單的“DiffSinger”分類中找到你安裝的歌手，選擇

注：歌詞支持漢字或拼音輸入，連音符為加號(hào)+，呼吸音為AP，停頓為SP

說明

OpenUTAU默認(rèn)開啟自動(dòng)預(yù)渲染，即你每進(jìn)行一筆編輯，都會(huì)立即渲染音頻并緩存。如果OpenUTAU卡頓，可在“工具→使用偏好→渲染”中關(guān)閉自動(dòng)預(yù)渲染
DiffSinger相關(guān)設(shè)置可在“工具→使用偏好→渲染”中編輯：

渲染加速倍數(shù)：默認(rèn)為50倍。降低加速倍數(shù)可提高音質(zhì)，但會(huì)使合成速度變慢
默認(rèn)使用CPU渲染，使用DirectML渲染速度更快。請將“機(jī)器學(xué)習(xí)運(yùn)行器”設(shè)置為directml，GPU選擇你的獨(dú)顯（NVIDIA和AMD顯卡均支持），然后重新啟動(dòng)OpenUTAU

參數(shù)

DiffDinger支持以下參數(shù)

音高曲線
音素長度
DYN（音量曲線）
GENC（性別，需音源支持，默認(rèn)可調(diào)范圍±100相當(dāng)于?12半音，正方向?yàn)槟新暎ü舱穹褰档停?/span>

參數(shù)的可調(diào)范圍可在鋼琴窗左下角的齒輪圖標(biāo)設(shè)置

音素器

目前OpenUTAU for Diffsinger包含4個(gè)用于Diffsinger的音素器：

DIFFS ZH 位于ZH分類，基于OpenUTAU內(nèi)置的vogen音素模型，無需配置，支持漢語普通話
DIFFS RHY 位于ZH分類，基于 Diffsinger rhythmizer音素模型，效果更好
ENUNU X 位于General分類，基于NNSVS音素模型，需要音源開發(fā)者適配。適用于ENUNU支持的各種自定義語言。使用方法
ENUNU X EN 位于EN分類，基于NNSVS音素模型，需要音源開發(fā)者適配。適用于使用CMUDict的英文音源。使用方法

目前限制

暫不支持多說話人混合

標(biāo)簽：