離線語音識別Whisper整合包下載及使用教程
離線語音識別Whisper整合包下載及使用教程
本次的離線語音識別安裝包基于OpenAI的Whisper是一種基于深度學(xué)習(xí)的語音識別模型,它是一種通用的語音識別模型,可以用于語音識別、語音翻譯和語言識別等任務(wù)。

離線安裝包
下載地址:https://xueshu.fun/2787/
安裝包內(nèi)容組成如下圖:

其中
exe
后綴為啟動(dòng)文件bin
后綴為模型文件,模型文件越大,合成效果越好,速度越慢
使用教程
雙擊exe打開軟件,軟件界面如下,操作步驟: 1- 選擇模型文件,就是上圖中的bin文件 2- 選擇是否GPU合成 設(shè)置好后,點(diǎn)擊OK進(jìn)入下一步

3- 選擇要識別的音頻文件 4- 選擇輸出字幕還是txt文件

標(biāo)簽: