【AI塔菲2.0】永雛塔菲歌聲轉(zhuǎn)換模型2.0版本 模型發(fā)布

? ? ? ? 非常感謝大家對于AI塔菲2.0的關(guān)注和支持!看到AI塔菲后你是否創(chuàng)意迸發(fā),也想要嘗試歌聲轉(zhuǎn)換模型,卻又擔(dān)心不熟悉深度學(xué)習(xí)或電腦配置跟不上?不用煩惱,本文將手把手教你如何玩轉(zhuǎn)AI塔菲模型!
? ? ? ? 什么?你還不知道什么是歌聲轉(zhuǎn)換模型?那就點(diǎn)開下方視頻看看吧!

? ? ? ? 所謂AI歌聲轉(zhuǎn)換,是利用模型將源音頻的歌聲洗為永雛塔菲的音色,保留歌詞,唱法等細(xì)節(jié),相比調(diào)音來說AI轉(zhuǎn)換更加自然,也更快(只需5分鐘?。?。

準(zhǔn)備工作
如果你有一個(gè)能訪問谷歌服務(wù)的網(wǎng)絡(luò)環(huán)境,那太好了!利用Google Colab里的GPU運(yùn)行時(shí)可以在任何設(shè)備上進(jìn)行模型推理,你所有要做的只有準(zhǔn)備一個(gè)無伴奏的純干聲音頻文件,將其丟入Colab即可。
如果你無法訪問谷歌服務(wù),但你有一塊超過8GB顯存,擁有cuda加速的顯卡(AMD:那我呢),你也可以在你的電腦上進(jìn)行推理,這要求你擁有能夠配置python運(yùn)行環(huán)境的能力。
如果你什么都沒有,那UP這里還是建議想點(diǎn)辦法改善自己的網(wǎng)絡(luò)環(huán)境,相比來說是成本最低,也是最方便的解決方案。因此本文將以Google Colab為例,展示如何快速使用AI塔菲模型。

使用模型
? ? ? ?如何獲取純凈干聲不在本文的討論范圍內(nèi),假設(shè)你已經(jīng)擁有了一個(gè)純干聲,采樣率高于16KHZ的wav格式音頻文件,使用下方鏈接進(jìn)入Google Colab。
https://colab.research.google.com/drive/1ZTT2XBZKOmfef91-WfvQgww3oUI9x5fD
? ? ? ? 登錄你的谷歌賬號,只需按順序點(diǎn)擊單元格里的執(zhí)行按鈕即可快速在谷歌的虛擬機(jī)(GPU運(yùn)行時(shí))中搭建運(yùn)行環(huán)境。

? ? ? ? 執(zhí)行到上傳源音頻階段時(shí),請點(diǎn)擊網(wǎng)頁左側(cè)的文件夾圖標(biāo),打開文件目錄,并將你準(zhǔn)備好的干聲音頻文件傳入Colab的raw文件夾中(如果直接上傳不穩(wěn)定你也可以先傳入Google Drive)。

? ? ? ? 聲音轉(zhuǎn)換階段,填寫需要升降的半音(視情況而定,想要更夾一點(diǎn)可以考慮升一點(diǎn)音高,多聽多試),并填入你上傳的文件名即可開始模型推理。

? ? ? ? 一首5分鐘的歌推理約需3分鐘,推理完成后在results文件夾中即可看到輸出的文件。你也可以執(zhí)行最后一個(gè)單元格進(jìn)行在線預(yù)覽。


注意事項(xiàng)
本模型由@14-26AA的diff-svc項(xiàng)目訓(xùn)練而來,因此同樣遵循原項(xiàng)目的許可:
本項(xiàng)目是基于學(xué)術(shù)交流目的建立,并非為生產(chǎn)環(huán)境準(zhǔn)備,不對由此項(xiàng)目模型產(chǎn)生的任何聲音的版權(quán)問題負(fù)責(zé)。
如將本倉庫代碼二次分發(fā),或?qū)⒂纱隧?xiàng)目產(chǎn)出的任何結(jié)果公開發(fā)表(包括但不限于視頻網(wǎng)站投稿),請注明原作者及代碼來源(此倉庫)。
如果將此項(xiàng)目用于任何其他企劃,請?zhí)崆奥?lián)系并告知本倉庫作者,十分感謝。
哦對了,如果你想要在自己的電腦上進(jìn)行模型推理,想要下載模型,或者在使用過程中有任何問題,歡迎點(diǎn)擊下方鏈接加入QQ頻道-永雛塔菲!
https://pd.qq.com/s/g72sabmlu

