草履蟲都能看懂的AI阿夸使用指北
目錄
疑難解答
如何使用AI阿夸進(jìn)行二創(chuàng)
如何使用voicemeeter進(jìn)行聲卡跳線
結(jié)語

疑難解答
配置要求
推薦內(nèi)存16g,推薦顯卡1060?6g及以上,僅限支持CUDA的n卡。低于此推薦配置并非完全不能使用,但是要求具備一定的動(dòng)手能力。
運(yùn)行流程
我需要使用推理圖形界面:雙擊推理圖形界面.bat,待出現(xiàn)一個(gè)網(wǎng)頁鏈接時(shí)ctrl+鼠標(biāo)左鍵進(jìn)入,不要關(guān)掉窗口!請(qǐng)使用wav格式音頻作為輸入。
我需要使用變聲器:雙擊變聲器自動(dòng)變調(diào)(beta).bat,按y同意協(xié)議,不要關(guān)掉窗口,打開你的DAW,新建項(xiàng)目,采樣率44.1khz,在軌道上掛載對(duì)應(yīng)VST插件,打開實(shí)時(shí)錄制和監(jiān)聽。
.bat文件運(yùn)行閃退/無法運(yùn)行
首先檢查你的bat文件內(nèi)容是否與視頻內(nèi)一致,包括空格、換行,有沒有錯(cuò)誤刪除部分內(nèi)容。
確保無誤后重新安裝anaconda,如果你電腦沒有安裝過python相關(guān)環(huán)境全部保持默認(rèn)一路點(diǎn)下來就行,如果你電腦安裝過python請(qǐng)移除,并在安裝anaconda時(shí)勾選add?python?to?path,如何移除python請(qǐng)合理運(yùn)用搜索引擎。
運(yùn)行報(bào)錯(cuò)No module named xxx
在bat最前面加上一行set PYTHONPATH=.并回車
我有多個(gè)GPU,如何指定在特定GPU上運(yùn)行?/為什么程序在我的集顯上跑?
在bat最前面加上一行set CUDA_VISIBLE_DEVICES=n,n的值為你任務(wù)管理器內(nèi)英偉達(dá)顯卡對(duì)應(yīng)的編號(hào),比如我任務(wù)管理器內(nèi)顯示的是GPU0

所以我就填set CUDA_VISIBLE_DEVICES=0
變聲器有輸入無輸出
首先如果沒有正常提取到人聲是不會(huì)輸出的!這樣可以避免各種底噪被當(dāng)成怪叫輸出,所以測(cè)試請(qǐng)用正常人聲,要不然沒有聲音!
然后如果還是沒聲音看看這篇
https://www.bilibili.com/read/cv21741150?spm_id_from=333.999.list.card_article.click
確保沒有以上問題,但還是無法運(yùn)行
請(qǐng)檢查有沒有壞包,即進(jìn)行SHA256校驗(yàn)
依賴包SHA256:?ef5f2c239cf5ff7c0dee223ca22a17abe429f5690a16204292d3c0c00fc41fb9
程序SHA256:?7b1bc93465cf2a33f4b567c19c6011bfc9de783416fa7b526816ab3bb94a5f03
還是無法解決問題
可以向up主私信,請(qǐng)完整的描述問題

絕大多數(shù)的問題應(yīng)該都是環(huán)境問題,實(shí)際上,直接詢問搜索引擎或者chatGPT要比詢問up主有效許多。

二創(chuàng)指北
GUI參數(shù)詳解

GPU加速:裝飾功能,默認(rèn)開著就好
自動(dòng)變調(diào):會(huì)自動(dòng)調(diào)整音高防止破音,但是對(duì)過于低的音效果不佳,需要手動(dòng)矯正
加速倍率:常用數(shù)值:1(僅再輸入非常干凈追求極限效果時(shí)用,推理速度很慢)、10(推薦,推理較慢,但是幾乎是無損音質(zhì))、20(默認(rèn),推理速度適中,如果不追求極致效果的推薦使用)、50(不推薦,全損音質(zhì),僅用作實(shí)時(shí)變聲器和預(yù)覽音頻,推理速度最快)
變調(diào):字面意思,升高/降低多少個(gè)半音
輸出有電音、噪聲、斷氣怎么辦
模型經(jīng)過測(cè)試,在絕對(duì)干凈的推理音頻輸入下(測(cè)試音頻來自diffsinger、synthesizer?v)生成的mel譜,與數(shù)據(jù)集mel譜及hololive提供的參考用聲卡直出音頻mel譜無明顯差異,可以認(rèn)為是與湊あくあ完全一致的聲線。模型經(jīng)過調(diào)整能夠保證中文不口糊不大舌頭。
音域測(cè)試覆蓋女聲常見音域,在極限音高附近音色可能會(huì)有泄露。
f0(基頻)提取算法使用crepe,無降噪
綜上,你應(yīng)該保證輸入音頻的純凈度
????推薦輸入音頻:
?歌聲合成引擎直出(如ACE Studio、DiffSinger、X Studio、Synthesizer V、OpenUTAU)
?錄制的自己的聲音(推薦設(shè)備iPhone7以上,不要使用藍(lán)牙設(shè)備,減少環(huán)境噪聲、環(huán)境混響、齒音、口水音、噴麥等情況出現(xiàn),與錄音設(shè)備保持合適的距離)
????不推薦的輸入音頻:
?消除bgm的原唱人聲(原因:大部分歌曲很難獲取干凈的人聲,并且直接拿原唱人聲轉(zhuǎn)換會(huì)有一種原唱套變聲器的感覺,沒有創(chuàng)作空間)
?明顯的有損音頻
?過于高/低的音高
歌聲合成引擎相關(guān)常用工具匯總
vsqx分享平臺(tái):https://www.vsqx.top/? ?(獲取常見引擎有參/無參的工程文件)
bowlroll:https://bowlroll.net/? ? (全能型配布網(wǎng)站)
niconico:https://www.nicovideo.jp/? ? ? (部分作者可能會(huì)在自己網(wǎng)站配布,請(qǐng)留意)
openvpi轉(zhuǎn)換工具:https://openvpi.github.io/? ? ? ? (可以轉(zhuǎn)換不同引擎的工程文件)
在線版轉(zhuǎn)換工具:https://sdercolin.github.io/utaformatix3/? ?(可以轉(zhuǎn)換不同引擎的工程文件)
*使用前請(qǐng)仔細(xì)閱讀創(chuàng)作者給出的協(xié)議,并標(biāo)明出處。
沒有我想做的歌怎么辦?
自己唱,或者將分離bgm的原唱放進(jìn)Melodyne,可以輕松的獲取音高,方便扒譜。
使用AI創(chuàng)作出好作品的秘訣
將創(chuàng)作的主導(dǎo)權(quán)掌握在自己手里,能少用AI就少用AI,AI是非常好用的工具,正因如此我們要學(xué)會(huì)合理的利用工具,不要被工具所利用。從頭到尾全部由AI制作的作品會(huì)被鑒定為電子垃圾,請(qǐng)不要讓這種情況出現(xiàn)。

用voicemeeter進(jìn)行聲卡跳線
這里使用voicemeeter基礎(chǔ)版作為示范

按照?qǐng)D中這樣子設(shè)置,將VIRTUAL INPUT設(shè)為獨(dú)奏,HARDWARE OUT設(shè)備選為你想要監(jiān)聽輸出的設(shè)備(必須為MME開頭的),音量盡量保持不動(dòng),因?yàn)閿?shù)據(jù)集已經(jīng)匹配EBU R128響度,擅自更改音量可能會(huì)導(dǎo)致炸麥(我的麥真的很差嗎.jpg),輸入音量隨意。

DAW以AU為例,依次點(diǎn)開編輯-首選項(xiàng)-音頻硬件,按照上圖設(shè)置,輸入為你的麥克風(fēng)名(不要使用虛擬麥克風(fēng)),輸出為VoiceMeeter Input,類型MME,其他保持默認(rèn)。
然后在系統(tǒng)設(shè)置中將你的默認(rèn)輸入設(shè)備選為VoiceMeeter Output,測(cè)試一下,然后你就可以愉快的使用阿夸聲線打游戲或者玩弄hxd了。


結(jié)語
阿夸是虛擬直播,正因?yàn)槭翘摂M的,所以二創(chuàng)會(huì)很大程度的影響到這個(gè)角色的形象,所以創(chuàng)作者們應(yīng)該認(rèn)真對(duì)待每一個(gè)二創(chuàng)作品。因?yàn)槿藷o完人,所以阿夸的扮演者(中之人)并不能完美的唱好每一首歌,這時(shí)候就可以使用AI彌補(bǔ)這個(gè)遺憾,讓這個(gè)虛擬形象更鮮活一些。當(dāng)然,如果你覺得阿夸這個(gè)角色你可以扮演的更好,你可以隨意使用AI阿夸,我沒有意見,前提是你真的可以扮演的更好。