OpenAI Whisper簡單測試
2022-10-15 13:22 作者:bili_29889125298 | 我要投稿
測試環(huán)境:
1.Windows 10 企業(yè)版
2.Intel Core i3-10100 CPU
3.Python 3.9.13
測試日期:
2022-10-15
測試目的:
1.嘗試開源語音識別項(xiàng)目
2.如果可能的話,把自己保存的英文電影加上字幕
安裝說明:
1.按照https://github.com/openai/whisper上的說明一步一步來就行
2.git很麻煩,我是直接下載源代碼的zip包,解壓后執(zhí)行python setup.py install
3.必須要有ffmpeg,我是用chocolatey下載的
4.第一次運(yùn)行程序會對應(yīng)下載模塊,tiny包大小72M,base包大小138M
? ?再大的模塊我沒有試
測試結(jié)果:
1.測試音頻I Love Spring Best(網(wǎng)上隨便找到的朗讀語音)
2.識別率還可以
? 單詞best,使用tiny模式識別為bed,使用base模式識別為past
? 有一個單詞plant,發(fā)音不太準(zhǔn),使用tiny模式識別為plet,使用base模式識別為pledge
3.速度可以,88秒的音頻11秒
4.報(bào)錯UserWarning: FP16 is not supported on CPU; using FP32 instead,
? ?但是不影響,應(yīng)該是需要NVIDIA的顯卡加速,我沒有顯卡,僅用核顯UHD 630
5.我看這個項(xiàng)目熱度挺高的,估計(jì)會有人開發(fā)“生成電影字幕”的功能吧,我就躺著等現(xiàn)成的吧,自己不做了
標(biāo)簽: