語音之家 AISHELL-1語音識別實戰(zhàn)
2023-01-31 14:54 作者:janet19961217 | 我要投稿
通常語音識別有兩種工作模式,喚醒模式和識別模式。所謂喚醒模式,即應(yīng)用處于待喚醒狀態(tài),此種狀態(tài)引擎會一直在后臺錄音,用于判別是否有【喚醒詞】,如果識別到喚醒詞,即轉(zhuǎn)為識別模式。所謂識別模式,是指我們說出的語音被轉(zhuǎn)為文字以及帶有特定格式的一段數(shù)據(jù),即對于所識別到的語音進行結(jié)構(gòu)化處理。處理后通常會以json的形式提供給外部應(yīng)用進行再次解析處理,用于滿足應(yīng)用自身功能。
比如一些支持語音功能的智能家居,首先把應(yīng)用喚醒(比如,小愛同學(xué)),然后說指令(比如,開空調(diào))。語音識別引擎識別出語義,把結(jié)果(json數(shù)據(jù))給到APP,APP把結(jié)構(gòu)化的語義進行分類處理。再比如,如果想查詢天氣,語音說“明天天氣如何”。識別引擎會根據(jù)位置信息,聯(lián)網(wǎng)檢索相關(guān)天氣信息提供給APP。
標簽: