ASR語音識別技術(shù)在燃?xì)庑袠I(yè)多有用?
我們先來了解一下沃豐科技ASR語音識別
語音識別系統(tǒng)一般分訓(xùn)練和解碼兩階段。訓(xùn)練,就是通過大量標(biāo)注的語音數(shù)據(jù)訓(xùn)練聲學(xué)模型;解碼,就是通過聲學(xué)模型和語言模型將訓(xùn)練集外的語音數(shù)據(jù)識別成文字,訓(xùn)練的聲學(xué)模型好壞直接影響識別的精度。
沃豐科技GaussMind語音識別基于自研原心引擎語音語義融合方案,打通業(yè)務(wù)領(lǐng)域數(shù)據(jù),實現(xiàn)業(yè)務(wù)定制化的效果體驗,自然場景識別率超過95%,個性化詞匯識別超過97%,同時為語義模塊提供豐富的識別結(jié)果輸出,使語義識別率提升5個點以上。
沃豐科技ASR語音識別功能優(yōu)勢
場景化識別
基于transformer結(jié)構(gòu)+self-attention機(jī)制的端到端語音識別模型,采用數(shù)萬小時行業(yè)精標(biāo)數(shù)據(jù),結(jié)合知識庫、FAQ等信息,重現(xiàn)對話情景,自動讓機(jī)器人在場景化領(lǐng)域做識別
多樣化信息
定制化場景豐富的識別結(jié)果輸出,不僅能夠輸出one-best結(jié)果,同時輸出n-best多候選以及音素,為自然語言理解提供豐富多樣化信息
可讀易懂
采用大規(guī)??头υ挃?shù)據(jù),基于深度學(xué)習(xí)的方法,對語音內(nèi)容理解并進(jìn)行智能斷句,讓結(jié)果更可讀與可懂
準(zhǔn)確率領(lǐng)先
基于上下文語義,采用大數(shù)據(jù)分析,對內(nèi)容實時動態(tài)糾錯,自動過濾敏感詞等;提供自定義聲學(xué)以及語言模型優(yōu)化
語音識別技術(shù)應(yīng)用在燃?xì)庑袠I(yè)哪些領(lǐng)域呢?
1、語音輸入系統(tǒng),更符合人的正常習(xí)慣,比鍵盤輸入更自然,更高效。
2.語音控制系統(tǒng),即用語音控制工作,比人工控制更快、更方便.可應(yīng)用于各個領(lǐng)域,如工業(yè)控制、語音撥號、智能家電、音響網(wǎng)絡(luò)玩具等。
基于客戶語音交流的智能對話信息檢索系統(tǒng)為用戶提供自然、友好的數(shù)據(jù)庫檢索服務(wù)