僅語音識別輸入軟件
????????寫一個比較長的文檔的時候,或者你覺得打字比較的煩躁,那么語音輸入就是一個非常好的選擇。
????????但是現(xiàn)在市面上的語音輸入實在是太爛,當(dāng)然了,如果你本來用的是搜狗輸入法或者是訊飛輸入法,那么語音輸入應(yīng)該并不是很麻煩,因為他們一般自帶語音輸入準(zhǔn)確率還可以.在這里我要特別批評一下這個搜狗輸入法,是真的惡心,非要把自己設(shè)置成默認(rèn)輸入法,是真甜美把自己當(dāng)回事.訊飛的輸入法,因為它的安裝包普遍比另外兩個大2倍.我不是很懂,我就沒裝.
????????如果你是用的windows自帶的微軟拼音,那么當(dāng)你僅想要使用一個語音輸入的時候,微軟自帶的語音輸入就非常的垃圾了,主要當(dāng)然是我的普通話不標(biāo)準(zhǔn),導(dǎo)致他識別的不好,所以主要還是怪我自己,那么現(xiàn)在應(yīng)該有一款這種語音輸入軟件來填補這一個小小的空缺呢?
????????當(dāng)然其實你只要稍微搜索一下,你也能找到這個軟件,我這里只是寫出來,特別要批評一下,搜狗輸入法是真的惡心,還是和以前一樣惡心,一點都沒有改,真的是甜美惡心.
????????capwriter 直接在下面這個網(wǎng)站下載就可以了,非常的簡單.
????????哦,他可能沒有這么的簡單,就是他并不是只要安裝就可以,他還要去阿里云稍微的配置一下,當(dāng)然了,這個B站他自己已經(jīng)出了一個視頻,一般來說都是看得懂的.
?????? 它基本上達(dá)到的效果就是當(dāng)你用語音輸入的時候,你就按一個鍵。然后你說話說完,你把這個鍵松掉,它就輸入完畢了.我目前看過來準(zhǔn)確率還是挺高的,修修改改的地方挺少的,然后這整篇文章都是用這玩意寫的,我基本上只修改了甜美的這幾個詞,用起來非常的舒心.現(xiàn)在我甜美都不想打字了.
????????然后我還是要說一句,搜狗是真的,甜美垃圾!

下面從是作者的發(fā)布界面復(fù)制來的簡介(詳情)
簡介
這是一款電腦端語音輸入工具。顧名思義,Caps Writer 就是按下大寫鎖定鍵來打字的工具。它的具體作用是:當(dāng)你長按鍵盤上的大寫鎖定鍵后,軟件會開始語音識別,當(dāng)你松開大寫鎖定鍵時,識別的結(jié)果就可以立馬上屏。
對于聊天時候進(jìn)行快捷輸入、寫代碼時快速加入中文注釋非常的方便。
目前軟件內(nèi)置了對阿里云一句話識別 API 的支持。如果你要使用,就需要先在阿里云上實名認(rèn)證,申請語音識別 API,在設(shè)置頁面添加一個語音識別引擎。
添加其它服務(wù)商的引擎也是可以做的,只是目前阿里云的引擎就夠用,還沒有足夠的動力添加其它引擎。
具體使用效果、申請阿里云 API 的方法,可以參考我這個視頻:?CapsWriter 2.0 使用視頻
添加上引擎后,在主頁面選擇一個引擎,點擊啟用按鈕,就可以進(jìn)行語音識別了!
啟用后,在實際使用中,只要按下 CapsLock 鍵,軟件就會立刻開始錄音:
如果只是單擊 CapsLock 后松開,錄音數(shù)據(jù)會立刻被刪除;
如果按下 CapsLock 鍵時長超過 0.3 秒,就會開始連網(wǎng)進(jìn)行語音識別,松開 CapsLock 鍵時,語音識別結(jié)果會被立刻輸入。
所以你只需要按下 CapsLock 鍵,無需等待,就可以開始說話,因為當(dāng)你按下按下 CapsLock 鍵的時候,程序就開始錄音了,只要你按的時長超過 0.3 秒,就肯定能識別上。說完后,松開,識別結(jié)果立馬上屏。

?技巧
在設(shè)置界面,將?點擊關(guān)閉按鈕時隱藏到托盤
?選項勾選,就可以將軟件隱藏到托盤欄運行:

?? 背景
對于直到 0202 年,仍然沒有開發(fā)者做過一個好用的語音輸入工具,我又生氣又無奈,畢竟這東西不賺錢,自然沒有人做。
有人建議用搜狗輸入法、訊飛輸入法的語音輸入,但這幾個方面是真讓人受不了:
廣告太多的軟件,拒絕安裝
速度慢,訊飛在手機上的語音輸入挺快的,但是在 PC 上的語音識別速度超級慢
就以搜狗輸入法為例,它的語音輸入快捷鍵只能是
Ctrl + Shift + A/B/C……
,有以下槽點:這個快捷鍵會和許多軟件的快捷鍵沖突,且不好記
打字時,按這樣三個快捷鍵,手指很別扭,不爽
訊飛語音輸入法的快捷鍵是 F6,只能換成 F 功能鍵,離手指太遠(yuǎn),不好夠,同時和許多軟件快捷鍵沖突
?? 開箱即用
Windows 小白用戶,只需要在?Gitee Releases?或?Github Releases?界面下載打包好的壓縮文件,解壓,執(zhí)行里面的 exe 文件,就可以運行了,在設(shè)置界面新建引擎,填入你在阿里云中申請的:
擁有?管理智能語音交互(NLS)?權(quán)限的?RAM訪問控制?用戶的?Accesskey Id、Accesskey Secret
智能語音交互語音識別項目的?appkey
就可以正常使用了。
詳細(xì)申請、填寫 API 的步驟請到?CapsWriter 2.0 使用視頻?查看視頻教程。
Mac 和 Linux 用戶,你們也可以使用,只是我沒有 Mac 和 Linux 的電腦,無法打包。需要你們下載源代碼、安裝依賴庫,再打包或者直接運行。
?? 源代碼使用
小白下載的 Release 其實是用 pyinstaller 導(dǎo)出的 exe 文件,如果你需要在源碼基礎(chǔ)上使用,就需要安裝以下模塊:
keyboard (用于監(jiān)聽鍵盤輸入)
pyaudio (用于接收錄音)
PySide2 (圖形界面框架)
aliyun-python-sdk-core (阿里云 sdk)
alibabacloud-nls-java-sdk (阿里云智能語音引擎 sdk)
其中:
pyaudio 在 windows 上不是太好安裝,可以先到?這個鏈接?下載 pyaudio 對應(yīng)版本的 whl 文件,再用 pip 安裝,Mac 和 Linux 上需要先安裝 port audio,才能安裝上 pyaudio
alibabacloud-nls-java-sdk 是指阿里云官方 java sdk 的 python 實現(xiàn),它不是通過 pip 安裝的(官方?jīng)]有上傳到 pypi ),而是通過?阿里云官方文檔的方法?進(jìn)行安裝。
其它模塊使用 pip 安裝即可
本文件夾內(nèi)有一個?安裝指南
?文件夾,在里面可以找到詳細(xì)的安裝指南,還包括了提前下載的?alibabacloud-nls-python-sdk
?和?pyaudio
?的 whl 文件。
? 打賞
?? 交流
如果有軟件方面的反饋可以提交 issues,或者加入 QQ 群:1146626791