語音轉中文轉音標wav-to-lab
2023.8.17學習記錄
在colab借助飛漿套件VTuberTalk標注音頻(colab用cpu模式完成就可以)
https://github.com/jerryuhoo/VTuberTalk

#下載VTuberTalk官方文件安裝依賴
%cd /content
!git clone https://github.com/jerryuhoo/VTuberTalk.git
%cd /content/VTuberTalk
!pip install -r requirements_cpu.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

#安裝paddlespeech套件一下是在colab安裝必須的
!pip install paddleocr
!pip install pytest-runner
!pip install paddlespeech
!pip install "paddlepaddle<2.5" -i https://mirror.baidu.com/pypi/simple
!pip install "paddlenlp<2.6" -i https://mirror.baidu.com/pypi/simple
!pip install "ppdiffusers<0.16" -i https://mirror.baidu.com/pypi/simple
!wget http://nz2.archive.ubuntu.com/ubuntu/pool/main/o/openssl/libssl1.1_1.1.1f-1ubuntu2.19_amd64.deb
!sudo dpkg -i libssl1.1_1.1.1f-1ubuntu2.19_amd64.deb
!pip install numpy==1.23 -i https://pypi.tuna.tsinghua.edu.cn/simple
!pip install typeguard==2.13.3
!pip install paddleaudio==1.0.1
!pip install ffmpeg

#開始轉換中文?/content/raw換成自己的音頻目錄
#/content/raw里的音頻是16000zh小于20秒其余不知道可以不
#執(zhí)行后會在音頻目錄出現同名txt文件里面是中文
%cd /content/VTuberTalk? ? ? #切換安裝VTuberTalk目錄
!python tools/split_audio.py --ag 3 --in_path /content/raw? ? ??

#可跳過下面兩步太多了
#收集所有txt文件內容到VTuberTalk文件夾內text.txt文件中查看修改
!python tools/glob_text.py --path /content/raw/
#將修改的好的從新傳回到每個txt文件
!python tools/revise_text.py --path /content/raw/

#把文件下所有txt中文漢字轉換成拼音
#如果不需要數字音標去掉hanzi_to_pinyin.py中
#[^a-zA-Z0-9]中的0-9這3個字符就可以在diffsinger中使用
#直接雙擊就可以在瀏覽器中修改VTuberTalktools/hanzi_to_pinyin.py
!python tools/hanzi_to_pinyin.py --path /content/raw

#轉換完成lab刪除不需要的txt文件
!rm -rf /content/raw/*.txt

標注完成/content/raw生成lab的diffsinger
可以直接進入MakeDiffSinger繼續(xù)
在colab可以繼續(xù)cpu使用MakeDiffSinger數據集制作部分