語音與文字的轉(zhuǎn)換

一 起因
ChatGPT的大火,讓許多人意識到或許我們能夠與AI直接進行交互,而不會出現(xiàn)之前那種答非所問的畫面。因此,筆者再想,是否能夠?qū)⑽覀兊恼Z音和文字實現(xiàn)無縫切換呢?如果可以的話,那是不是以后借助ChatGPT的API,我們也能實現(xiàn)個人的語音版本賈維斯呢?
一番搜尋之后,發(fā)現(xiàn)python的確是有文字轉(zhuǎn)語音的包,因此,我們就嘗試自制一個吧。
二?正文
下面,我們就將用一段代碼展示如何讀文本與收音。
通過上述代碼,我們能夠?qū)崿F(xiàn)將‘this is a good question’這句話從電腦上讀出來,也能夠通過myrecording實現(xiàn)麥克風(fēng)語音的實時錄入與保存。不過嘛,缺點感情。
看來得自己訓(xùn)練一個語音庫了。
不得不說,除了吃穿用,其他的都能在python上實現(xiàn)了。
三?慣例小結(jié)
其實,筆者演示的只是一個非常簡單的例子。對于那些互聯(lián)網(wǎng)大廠而言,這種類型的應(yīng)用可能已經(jīng)在做了。不久的將來,我們每個人或許都能夠擁有各自的語音小助手了。
不過,不建議讀者在這個方向嘗試太多時間,畢竟我們僅僅實現(xiàn)最簡單的部分,其余的包括語音轉(zhuǎn)文字,還需要借助深度學(xué)習(xí)和語料庫,這些都是本文未展示的,并且這些也是需要消耗計算資源的。
本推文主要是給大家一個簡單的示例,讓讀者知道語音技術(shù)的細節(jié),僅此而已。
四 公眾號其他資源(方便讀者使用)
本公眾號開發(fā)的相關(guān)軟件,Multi-omics Hammer軟件和Multi-omics Visual軟件歡迎大家使用。
Multi-omics Hammer軟件下載地址:
https://github.com/wangjun258/Multi-omics-Hammer
Multi-omics Visual軟件下載地址:https://github.com/wangjun258/Multi_omics_Visual/releases/tag/Multi_omics_Visual_v1.03
PS:因為本軟件是用python腳本撰寫,調(diào)用了部分依賴包,用戶首次使用需要安裝python以及對應(yīng)的包,安裝之后便可永久使用。
下面是本號在其他平臺的賬戶,也歡迎大家關(guān)注并多提意見。
簡書:WJ的生信小院
公眾號:生信小院
博客園:生信小院
最后,也歡迎各位大佬能夠在本平臺上:1傳播和講解自己發(fā)表的論文;2:發(fā)表對某一科研領(lǐng)域的看法;3:想要達成的合作或者相應(yīng)的招聘信息;4:展示自己以尋找博后工作或者博士就讀的機會;5:博導(dǎo)提供博后工作或者博士攻讀機會,都可以后臺給筆者留言。希望本平臺在進行生信知識分享的同時,能夠成為生信分析者的交流平臺,能夠?qū)崿F(xiàn)相應(yīng)的利益互補和雙贏(不一定能實現(xiàn),但是夢想總得是有的吧)。?
五 封面圖
