最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

語音識別工具,Constme-Whisper軟件體驗

2023-03-14 12:10 作者:果核剝殼  | 我要投稿

在隔壁小眾軟件看到了一款有意思的工具-“Const-me/Whisper”。

原版Whisper是OpenAI做的一個神經(jīng)網(wǎng)絡(luò)模型,它可以在本地實時語音轉(zhuǎn)文字,用來翻譯和做字幕等等,而Const-me的版本將Whisper做成了Windows的版本,還添加了GPU加速。

在官方的GitHub頁面上,可以看到這個工具還有不少特點,比如說項目采用純C++實現(xiàn),除了系統(tǒng)基本組件沒有運行依賴、內(nèi)存占用低、支持大多數(shù)音頻和視頻格式、支持大多數(shù)音頻捕獲設(shè)備、比OpenAI的實現(xiàn)還快。


主要的使用限制是系統(tǒng)版本,Windows 8.1以下和32位的系統(tǒng)是用不了的。

軟件的使用很簡單,一個用于啟動的界面環(huán)境,解壓出來1MB不到,一個用于識別的語言模型,模型有多個版本,想要正常使用得用1G以上的模型,下載文件之后,直接運行啟動器即可。


打開之后就能看見這樸實無華的界面,軟件沒有幾個按鈕,雖然是英文的,但是模型路徑和高級設(shè)置一看就明白。

在高級設(shè)置里面可以設(shè)置要調(diào)用的GPU,這個保持默認(rèn)就行。

之后就能看到軟件的主界面了,點開選擇語言,可以看到支持的語言還是挺多的,這里就先來試試中文。

在測試的時候發(fā)現(xiàn)用1.42GB的模型,默認(rèn)出來的是繁體,用2.88GB模型出來的是簡體,這個也可能是系統(tǒng)環(huán)境的原因,大家可以自己測試一下。

測試用的顯卡是GTX1660,轉(zhuǎn)換速度在可接受范圍之內(nèi),上面這種簡短的句子,用大的識別模型,在某些簡單的語境條件下,以及加上最重要的因素——運氣好的話,竟然有100%的準(zhǔn)確度。

除了音頻文件,直接放視頻也是可以的,但是只要涉及的內(nèi)容一廣,這個在本地運行的缺點就暴露出來了,生成的文本一言難盡,在有數(shù)字的時候會自己轉(zhuǎn)換成阿拉伯?dāng)?shù)字,有英文混雜的時候也會自己嘗試首字母大寫,但是在轉(zhuǎn)換效果上,一眼望過去有不少同音字錯誤,對于中文的前后文聯(lián)想能力比較差。

支持實時錄制音頻。

這個比Windows自帶的語言輸入效果要好一點,同樣的音頻速度,這個工具不會出現(xiàn)丟字的情況。

官方給出的Whisper識別能力圖如下,主要還是用來識別英文。

其他功能上,可以添加時間標(biāo)記和直接翻譯成英文。


想要控制具體的參數(shù),也可以使用控制臺的版本,還會展示對應(yīng)數(shù)值的置信度。


輸出中文的話會出現(xiàn)一堆問號,這個不是控制臺的編碼顯示問題,但是在輸入轉(zhuǎn)換指令后,在對應(yīng)路徑下面的文本生成是沒有問題的。

有了這個,就可以配合像是Quicker一類的快捷工具,做到本地一鍵轉(zhuǎn)換成文本了。

比較遺憾的是,這個小工具目前只支持將轉(zhuǎn)換的音頻轉(zhuǎn)換為英文,要是未來可以轉(zhuǎn)換成任意語言的話,那可玩性就很高了。

最后,附上軟件的體驗地址。

在 果核剝殼 公眾號

回復(fù)20230314獲取最新鏈接

語音識別工具,Constme-Whisper軟件體驗的評論 (共 條)

分享到微博請遵守國家法律
上栗县| 南城县| 图们市| 甘肃省| 敦煌市| 东乡族自治县| 平谷区| 定陶县| 威海市| 南康市| 车致| 潮州市| 北安市| 乐都县| 桃江县| 鄂托克前旗| 西乌珠穆沁旗| 兴化市| 蒙自县| 玉山县| 太保市| 新津县| 黄骅市| 清新县| 凤山市| 台北市| 南丰县| 鄂州市| 策勒县| 信丰县| 昭平县| 银川市| 吕梁市| 邹城市| 红原县| 鄯善县| 开鲁县| 哈尔滨市| 雷州市| 蒲江县| 惠水县|