技術(shù)應(yīng)用 | TransWAI:高效實(shí)現(xiàn)語音轉(zhuǎn)文字,減少視頻翻譯周期
語音識(shí)別技術(shù)(Automatic Speech Recognition),也被稱為自動(dòng)語音識(shí)別,目的在于將語音中的聲音內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可識(shí)別的輸入符號(hào),例如二進(jìn)制編碼或字符串等。
從開始研究至今,語音識(shí)別技術(shù)的發(fā)展已經(jīng)有半個(gè)多世紀(jì)的歷史。從20世紀(jì)80年代開始,國(guó)內(nèi)對(duì)語音識(shí)別技術(shù)的研究取得了許多成果,并在接下來的時(shí)間里迅速發(fā)展。
作為語音識(shí)別技術(shù)得到重點(diǎn)應(yīng)用的領(lǐng)域之一,音視頻翻譯對(duì)于語音轉(zhuǎn)文字的需求可以說是不可或缺。早年間,在語音識(shí)別技術(shù)尚未完善的時(shí)候,譯員往往需要經(jīng)過長(zhǎng)時(shí)間的聽錄,來獲得視頻原聲中的文本,這期間會(huì)反復(fù)經(jīng)歷聽錄與校對(duì)的過程,大大拖慢了視頻翻譯的進(jìn)度。
TransWAI 字幕系統(tǒng)
為了實(shí)現(xiàn)人機(jī)協(xié)同的全新翻譯輔助模式,優(yōu)化大規(guī)模視頻翻譯效率,TransWAI 核心技術(shù)團(tuán)隊(duì)結(jié)合前沿尖端技術(shù),推出了音視頻轉(zhuǎn)寫,即語音轉(zhuǎn)文字功能。
嵌入高精度的HMM聲學(xué)模型,在聲學(xué)特征提取時(shí),TransWAI 系統(tǒng)兼具對(duì)音頻噪聲的抗干擾能力和高效準(zhǔn)確的壓縮編碼能力,可輕松從視頻原聲中提取出合適的聲學(xué)特征參數(shù),以供提升后續(xù)翻譯的準(zhǔn)確性。
HMM 以及與之相關(guān)的技術(shù)在語音識(shí)別系統(tǒng)中始終處于最核心的地位。TransWAI 對(duì)其的采用,能夠確保在后續(xù)的語言處理中,協(xié)助語言模型實(shí)現(xiàn)智能化語法、語義分析。
現(xiàn)行的語音識(shí)別技術(shù)仍然存在諸多限制因素。為了實(shí)現(xiàn)多語種混合系統(tǒng),TransWAI 正不斷改進(jìn)系統(tǒng)建模方法、提高搜索算法的效率,以做到詞匯量無限制和多重語言混合,減少詞匯量對(duì)語音識(shí)別系統(tǒng)的限制。
通過積攢的數(shù)十億句對(duì)行業(yè)專業(yè)語料,TransWAI有望在語音轉(zhuǎn)文字這一功能上取得持續(xù)性突破,未來還將增加更多語種,并不斷優(yōu)化識(shí)別準(zhǔn)確率和用戶體驗(yàn)。
任何技術(shù)的進(jìn)步都是為了更進(jìn)一步拓展我們?nèi)祟惖纳婧徒涣骺臻g,以使我們獲得更大的自由。為了更好地服務(wù)于跨語言需求,TransWAI 仍然有很長(zhǎng)的路要走,期冀在未來,全新的多語種自由交流系統(tǒng)帶給人類全新的生活體驗(yàn)。
TransWAI 為每個(gè)人提供了 30 分鐘的免費(fèi)使用時(shí)長(zhǎng),歡迎大家申請(qǐng)?jiān)囉谩?陕?lián)系小編加入產(chǎn)品交流群~
官網(wǎng):www.transwai.com