macOS 終于迎來(lái)免費(fèi)音頻/視頻轉(zhuǎn)文字

OpenAI 在 2022 年 9 月推出了一款非常強(qiáng)勁的免費(fèi)程序,可以讓一些有技術(shù)水平的人把聲音和視頻文件變成非常精確的文字。問(wèn)題是它對(duì)于一般用戶來(lái)說(shuō)并不是很便利,因?yàn)橛脩粜枰檬褂媒K端應(yīng)用的指令。

但是有了 MacWhisper (文章末尾獲取下載鏈接),這個(gè)問(wèn)題就解決了。MacWhisper 是一個(gè)圖形用戶界面,基于 OpenAI 的 Whisper 開(kāi)發(fā),把所有復(fù)雜的技術(shù)細(xì)節(jié)藏在后面,讓用戶只需要拖拽聲音文件,就可以很快得到一個(gè)文本文件。而且 MacWhisper 非常精確,因?yàn)?OpenAI 的 Whisper 已經(jīng)在網(wǎng)絡(luò)上的 680,000 小時(shí)的聲音數(shù)據(jù)上進(jìn)行過(guò)訓(xùn)練。

MacWhisper 的一個(gè)優(yōu)點(diǎn)是不需要把想要轉(zhuǎn)寫(xiě)的聲音或視頻文件上傳到網(wǎng)絡(luò)上。這對(duì)于任何對(duì)上傳個(gè)人文件到云端有所擔(dān)心的人來(lái)說(shuō)非常重要。
再次強(qiáng)調(diào),MacWhisper 只是 OpenAI 在去年底推出的一個(gè)免費(fèi)程序的一個(gè) GUI 版本,但它真的會(huì)讓聲音轉(zhuǎn)錄效率更高。
使用 OpenAI 官網(wǎng)的 Whisper,以前每次想要轉(zhuǎn)錄一個(gè)文件,就要在Mac的終端應(yīng)用程序中輸入“whisper audiofilename.mp3 —model tiny.en”。有了 MacWhisper,我只需要拖拽聲音文件,它就會(huì)自動(dòng)完成轉(zhuǎn)錄,無(wú)需多余的輸入。
如何使用 MacWhisper 將語(yǔ)音或視頻轉(zhuǎn)換為文字
首次打開(kāi) MacWhisper 需要選擇識(shí)別模型,自上而下 Tiny、Base、Small 屬于免費(fèi)模型,后面標(biāo)有 “PRO” 的屬于收費(fèi)模型。
這些模型體積越大,識(shí)別精確率越高。經(jīng)過(guò)測(cè)試,在免費(fèi)的識(shí)別模型中,Small 識(shí)別率是最精確的,當(dāng)然體積也是最大的,將近 500 MB 左右。

識(shí)別模型下載完成之后,關(guān)閉窗口即可看到 MacWhisper 主界面。

在主界面的右上方可以選擇識(shí)別音頻的目標(biāo)語(yǔ)言和識(shí)別模型。

MacWhisper 支持 MP3、WAV、M4A、MP4 和 MOV 格式文件的語(yǔ)音轉(zhuǎn)文字,只需將音頻文件拖到窗口中即可開(kāi)始轉(zhuǎn)錄。

轉(zhuǎn)錄完成后,將自動(dòng)顯示識(shí)別結(jié)果,同時(shí)上方菜單會(huì)發(fā)生變化,點(diǎn)擊上方選項(xiàng)可以分別查看純文本或帶有時(shí)間碼的字幕。
如果只需要純文本,只需要點(diǎn)擊上方的“Transcript”按鈕,在該界面將會(huì)顯示一個(gè)“Copy”按鈕,點(diǎn)擊即可完成復(fù)制,然后再將復(fù)制的文本粘貼到其他文本軟件。
如果需要導(dǎo)出帶有時(shí)間碼的字幕文件,點(diǎn)擊右上角的“Export”將彈出導(dǎo)出界面。

MacWhisper 免費(fèi)版支持導(dǎo)出 srt 和 vtt 標(biāo)準(zhǔn)的字幕格式,這些格式可以直接導(dǎo)入 Adobe Premiere 或者 Final Cut Pro。

怎么樣?有需求的小伙伴還在等什么?抓緊時(shí)間去下載吧。
微信公眾號(hào)“傻大個(gè)黑科技”回復(fù)"230620"獲取鏈接