【so-vits-svc】手把手教你老婆唱歌

我的實踐記錄(詳細(xì)見http://wangc.site/cbrain/share?nodeid=7d0a2650b37ca9db)
- 模型:so-vits-svc
- 云平臺:AutoDL-品質(zhì)GPU租用平臺-租GPU就上AutoDL
- A5000的一小時1.3元(2023年4月28日)
- MP3轉(zhuǎn)WAV - 在線轉(zhuǎn)換音頻文件 (aconvert.com)
實踐
- 訓(xùn)練語料:錄制清唱音頻800+條(每個10~20秒)
- 推理語料:中文干聲 | 我愛REMIX (woairemix.com),用插件下載試聽片段
- 模型訓(xùn)練與推理:
- 800條語料,訓(xùn)練一晚上,10個小時,到了36000步(后硬盤滿了停了)
- step:10000之后比較了下沒太大差別
- key:音高影響較大,調(diào)整到適合自己音域的,推理出的音色才更像
- slice_db:差別不大
- 推理材料:推理材料的質(zhì)量,影響還是比較大的,以上收集的都是分離出的干聲,有些不太干凈,如果能有專門錄制的清場會更好;另外和歌手因素關(guān)系也很大,唱法技巧,咬字發(fā)聲,個人特點很鮮明的,如果只是遷移下音色,那么還是會很像原素材。
- 最后發(fā)現(xiàn)影響最大的竟然是 音頻格式?下載的mp3效果很差,自動生成出的flac格式效果就比較好
成果
- 2023年4月30日
- 成品:曾經(jīng)的你,我的名字,雅俗共賞
- 其他不行主要是有好多“爆音”的地方,另外像周杰倫、林俊杰個人特點很突出的,出來效果還是有強烈的原曲風(fēng)格
標(biāo)簽: