Vits數(shù)據(jù)集處理,文件的批量改名,修改音頻位寬,立體聲轉(zhuǎn)換,格式轉(zhuǎn)換,采樣率轉(zhuǎn)換。
2023-02-17 22:04 作者:這個(gè)彬彬就是xun啊 | 我要投稿

前置條件安裝ffmpeg(必須),sox(可選,用于轉(zhuǎn)換位數(shù))下載好安裝包解壓
此電腦(右鍵),屬性,高級(jí)系統(tǒng)設(shè)置,環(huán)境變量,找到Path,點(diǎn)擊編輯。

在編輯框中輸入ffmpeg解壓后安裝包的路徑

Win+R 輸入ffmpeg -v 如果出現(xiàn)下圖情況,表示安裝成功

代碼部分
解釋文件命名
%04d為設(shè)置格式為0000,四位。
解釋第一個(gè)cmd
ffmpeg -y 表示使用ffmpeg插件并且一路確定 ,
-ar 1 表示單通道,
-ar 22050 表示采樣率為22050Hz?
解釋第二個(gè)cmd
sox表示使用sox插件
-b 16 表示改文件為16bit
效果如下:

s如果沒(méi)有安裝的話,sox可以注釋掉。
標(biāo)簽: