散文網(wǎng) » 動畫 »動畫技術(shù) » 【AI塔菲2.0】永雛塔菲歌聲轉(zhuǎn)換模型2.0版本模型發(fā)布

【AI塔菲2.0】永雛塔菲歌聲轉(zhuǎn)換模型2.0版本模型發(fā)布

2022-12-03 12:33 作者:極黑的紳士君 0人讀過 | 我要投稿

? ? ? ? 非常感謝大家對于AI塔菲2.0的關(guān)注和支持！看到AI塔菲后你是否創(chuàng)意迸發(fā)，也想要嘗試歌聲轉(zhuǎn)換模型，卻又擔(dān)心不熟悉深度學(xué)習(xí)或電腦配置跟不上？不用煩惱，本文將手把手教你如何玩轉(zhuǎn)AI塔菲模型！

? ? ? ? 什么？你還不知道什么是歌聲轉(zhuǎn)換模型？那就點(diǎn)開下方視頻看看吧！

? ? ? ? 所謂AI歌聲轉(zhuǎn)換，是利用模型將源音頻的歌聲洗為永雛塔菲的音色，保留歌詞，唱法等細(xì)節(jié)，相比調(diào)音來說AI轉(zhuǎn)換更加自然，也更快（只需5分鐘?。?。

準(zhǔn)備工作

如果你有一個(gè)能訪問谷歌服務(wù)的網(wǎng)絡(luò)環(huán)境，那太好了！利用Google Colab里的GPU運(yùn)行時(shí)可以在任何設(shè)備上進(jìn)行模型推理，你所有要做的只有準(zhǔn)備一個(gè)無伴奏的純干聲音頻文件，將其丟入Colab即可。
如果你無法訪問谷歌服務(wù)，但你有一塊超過8GB顯存，擁有cuda加速的顯卡（AMD：那我呢），你也可以在你的電腦上進(jìn)行推理，這要求你擁有能夠配置python運(yùn)行環(huán)境的能力。
如果你什么都沒有，那UP這里還是建議想點(diǎn)辦法改善自己的網(wǎng)絡(luò)環(huán)境，相比來說是成本最低，也是最方便的解決方案。因此本文將以Google Colab為例，展示如何快速使用AI塔菲模型。

使用模型

? ? ? ?如何獲取純凈干聲不在本文的討論范圍內(nèi)，假設(shè)你已經(jīng)擁有了一個(gè)純干聲，采樣率高于16KHZ的wav格式音頻文件，使用下方鏈接進(jìn)入Google Colab。

https://colab.research.google.com/drive/1ZTT2XBZKOmfef91-WfvQgww3oUI9x5fD

? ? ? ? 登錄你的谷歌賬號，只需按順序點(diǎn)擊單元格里的執(zhí)行按鈕即可快速在谷歌的虛擬機(jī)（GPU運(yùn)行時(shí)）中搭建運(yùn)行環(huán)境。

? ? ? ? 執(zhí)行到上傳源音頻階段時(shí)，請點(diǎn)擊網(wǎng)頁左側(cè)的文件夾圖標(biāo)，打開文件目錄，并將你準(zhǔn)備好的干聲音頻文件傳入Colab的raw文件夾中（如果直接上傳不穩(wěn)定你也可以先傳入Google Drive）。

? ? ? ? 聲音轉(zhuǎn)換階段，填寫需要升降的半音（視情況而定，想要更夾一點(diǎn)可以考慮升一點(diǎn)音高，多聽多試），并填入你上傳的文件名即可開始模型推理。

? ? ? ? 一首5分鐘的歌推理約需3分鐘，推理完成后在results文件夾中即可看到輸出的文件。你也可以執(zhí)行最后一個(gè)單元格進(jìn)行在線預(yù)覽。

注意事項(xiàng)

本模型由@14-26AA的diff-svc項(xiàng)目訓(xùn)練而來，因此同樣遵循原項(xiàng)目的許可：

本項(xiàng)目是基于學(xué)術(shù)交流目的建立，并非為生產(chǎn)環(huán)境準(zhǔn)備，不對由此項(xiàng)目模型產(chǎn)生的任何聲音的版權(quán)問題負(fù)責(zé)。
如將本倉庫代碼二次分發(fā)，或?qū)⒂纱隧?xiàng)目產(chǎn)出的任何結(jié)果公開發(fā)表(包括但不限于視頻網(wǎng)站投稿)，請注明原作者及代碼來源(此倉庫)。
如果將此項(xiàng)目用于任何其他企劃，請?zhí)崆奥?lián)系并告知本倉庫作者,十分感謝。

哦對了，如果你想要在自己的電腦上進(jìn)行模型推理，想要下載模型，或者在使用過程中有任何問題，歡迎點(diǎn)擊下方鏈接加入QQ頻道-永雛塔菲！

https://pd.qq.com/s/g72sabmlu

標(biāo)簽：vtb 永雛塔菲 vtuber taffy 歌聲轉(zhuǎn)換 diff-svc AI 語音合成深度學(xué)習(xí)虛擬UP主