最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

命令行批量處理OpenAI Whisper語(yǔ)音識(shí)別

2023-08-17 17:39 作者:山風(fēng)入谷  | 我要投稿

通過(guò)批處理腳本.bat實(shí)現(xiàn)音視頻文件的批量語(yǔ)音識(shí)別_(:3」∠)_

功能如下

  • 輸入命令行(也可使用預(yù)設(shè):令第一個(gè)字符為12

  • 使用通配符來(lái)選取文件

  • 統(tǒng)計(jì)文件數(shù)量及類型

  • 文件自動(dòng)分組(避免命令行超出8191個(gè)字符的限制)

  • 運(yùn)行時(shí)間統(tǒng)計(jì)(24小時(shí)以內(nèi),如超出則自行計(jì)算天數(shù)即可)

OpenAI Whisper運(yùn)行結(jié)果
Whisper-CTranslate2運(yùn)行結(jié)果

上面第二張圖片是Whisper-CTranslate2的運(yùn)行結(jié)果,它基于Faster-Whisper項(xiàng)目,與舊OpenAI Whisper命令行兼容。在保證精度的同時(shí),占用內(nèi)存更少,運(yùn)行速度更快,且支持用彩色顯示單詞置信度,非常推薦哦。倉(cāng)庫(kù):https://github.com/Softcatala/whisper-ctranslate2

腳本使用方面,復(fù)制代碼到文本文檔,改后綴為.bat,將其與待處理文件放在同一個(gè)目錄下,直接運(yùn)行就可以了

如果嫌要把.bat文件移來(lái)移去太麻煩的話,可以把它放在一個(gè)固定的位置,比如D:\cmd_AutoRun\Process.bat,然后在cmd中用doskey命令給調(diào)用.bat的命令(call)設(shè)置一個(gè)別名,比如

這樣就可以在cmd中輸入“wbat”來(lái)直接調(diào)用腳本文件了,但是這個(gè)命令只對(duì)當(dāng)前窗口有效。如果要每次打開(kāi)cmd都可以使用別名的話,需要修改注冊(cè)表,具體請(qǐng)搜索“cmd命令別名”
修改成功之后,在文件目錄shift+右鍵,“在此處打開(kāi)命令窗口”,再輸入定義的別名可以調(diào)用了。當(dāng)然,在資源管理器的地址欄輸入“cmd”也是同樣的效果

Process.bat

一些關(guān)于腳本的說(shuō)明

1.輸入命令行

可以直接輸入Whisper命令,并用%i來(lái)代替文件名,例如

也準(zhǔn)備了兩種預(yù)設(shè),方法是使第一個(gè)輸入的字符為1或2,腳本會(huì)將1或2替換為對(duì)應(yīng)的不完整命令,所以后面還需要補(bǔ)充參數(shù)。如“1medium”、“2small -f txt”等等

2.通配符

*表示任意數(shù)量的字符,?表示單個(gè)字符

*.wav表示所有的wav文件,??x.ogg表示所有結(jié)尾為x的三字符ogg文件

要選取多種文件,只需將表達(dá)式用半角逗號(hào)空格隔開(kāi)。如*.ogg,*.mp4 *.flac

如果當(dāng)前目錄下全部文件都需要處理,只要輸入一個(gè)*就可以了

更詳細(xì)的cmd通配符用法請(qǐng)搜索“cmd通配符”

3.臨時(shí)文件

腳本在運(yùn)行過(guò)程中會(huì)創(chuàng)建名為“process_output.txt的文件來(lái)存放信息,并在運(yùn)行完成后刪除

如果當(dāng)前目錄下正好有同名文件,請(qǐng)一定一定要將其轉(zhuǎn)移或備份,否則會(huì)被刪掉的哦

4.腳本思路

核心思路來(lái)源于OpenAI Whisper官網(wǎng)的這句示例

一條whisper命令可以輸入多個(gè)文件名,只要把他們用空格隔開(kāi)就好了。腳本所做的事情其實(shí)就是將這些文件名整合到形式變量%i中。并且考慮到命令行有8191個(gè)字符限制,所以要將過(guò)多的文件分組。

看似比較繁瑣,不如用for循環(huán)遍歷所有文件,然后每個(gè)文件執(zhí)行一次命令來(lái)得方便
但是經(jīng)過(guò)測(cè)試,多文件合并輸出的方法相較單文件,處理的速度要快上不少。尤其是在大模型、多個(gè)小文件的情況下。推測(cè)是每次執(zhí)行命令就會(huì)加載一次模型,而后者將太多時(shí)間花在模型的加載上,所以速度較慢。

下面是驗(yàn)證過(guò)程

OpenAI Whisper,5樣本,medium模型處理結(jié)果,時(shí)間比1.6344
OpenAI Whisper,5樣本,large-v2模型處理結(jié)果,時(shí)間比1.6768
Whisper-CTranslate2,5樣本,large-v2模型處理結(jié)果,時(shí)間比3.6985

可以看出,在large-v2模型,5個(gè)短音頻(galgame角色語(yǔ)音)的條件下
OpenAI Whisper合并輸出能節(jié)省40%左右的時(shí)間
Whisper-CTranslate2合并輸出甚至能節(jié)省73%左右的時(shí)間

當(dāng)然,如果處理長(zhǎng)音頻,并且樣本數(shù)量比較少的話,兩者的差距并不會(huì)有上面這樣顯著。但無(wú)論如何,合并輸出的速度都是比單獨(dú)輸出要快的

命令行批量處理OpenAI Whisper語(yǔ)音識(shí)別的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
西乌珠穆沁旗| 罗定市| 灵寿县| 元朗区| 赞皇县| 安阳市| 丁青县| 金秀| 红桥区| 石棉县| 玛曲县| 平果县| 平舆县| 库尔勒市| 三河市| 江源县| 靖宇县| 错那县| 丘北县| 开封市| 鲜城| 桃园市| 贵德县| 汉源县| 石首市| 巴马| 宁河县| 台南市| 水富县| 怀宁县| 长乐市| 连平县| 长阳| 伊金霍洛旗| 碌曲县| 宜州市| 崇左市| 海口市| 敖汉旗| 葫芦岛市| 甘谷县|