最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

三分鐘科普 | 語音識別是如何發(fā)生的?

2022-06-30 23:09 作者:翻譯技術(shù)點津  | 我要投稿



導(dǎo)語:語音識別已運用于日常生活中的多種場景,那么語音識別是什么?語音識別是如何發(fā)生的?語音識別能為我們的生活提供什么幫助呢?本篇文章帶你一探究竟。


?? 語音識別是什么??

? ? ? ? 語音識別主要指語音轉(zhuǎn)文本,是一項綜合語言學(xué)、數(shù)學(xué)和統(tǒng)計學(xué)的技術(shù),通過機器識別,可將人類語音轉(zhuǎn)化為文本形式。為達到最自然、最精確的效果,語音識別常結(jié)合人工智能算法(AI)和機器學(xué)習(xí)算法(ML)來分析語法、句法、句子結(jié)構(gòu)、語音組成和聲音信號,使機器更好地理解及處理人類語音。?在實際工作中,不同項目有不同的語音識別要求,因此需要選用相應(yīng)功能來提高識別率,語音識別的常見功能包括:?

  • 語言權(quán)重:對特定場景中可能使用更頻繁的特定詞語(如產(chǎn)品或品牌名稱、行業(yè)術(shù)語)與更常用的表達進行權(quán)重計算,從而提高系統(tǒng)準(zhǔn)確性;

  • 說話人標(biāo)記:尤其適用于多人說話的場景,將每位說話者進行單獨標(biāo)記,從而更容易識別誰說了什么;

  • 聲學(xué)訓(xùn)練:確保系統(tǒng)能夠適應(yīng)對話過程中可能出現(xiàn)的外部聲音(例如陣風(fēng)、交通噪音、咳嗽),從而降低對文字識別的干擾;

  • 臟話過濾:顧名思義,使用過濾器來清除不文明用語。

?? 語音識別過程是如何發(fā)生的?

? ? ? ??語音識別包括:語音輸入、特征提取、特征向量、解碼器和單詞輸出。簡單來說,語音識別器利用算法通過以下步驟將口語轉(zhuǎn)化為文本:?

步驟一:系統(tǒng)分析音頻;

步驟二:將音頻分解為多個部分;

步驟三:將音頻數(shù)字化為計算機可讀格式;

步驟四:使用算法將音頻與最合適的文本表示相匹配。?

? ? ? ??其中步驟四由解碼器完成,解碼器利用聲學(xué)模型、發(fā)音詞典和語言模型來確定適當(dāng)?shù)妮敵觥?/span>?語音識別的質(zhì)量基于轉(zhuǎn)化準(zhǔn)確率來衡量,發(fā)音、口音、音高、音量、背景噪音等因素都有可能增加錯誤率,因此必須添加聲學(xué)和語言模型:?聲學(xué)模型:用以表示語音和音頻信號的語言單位之間的關(guān)系。語言模型:將語音與單詞序列相匹配,以區(qū)分發(fā)音相似的單詞。?因此,AIML通過各種算法或計算技術(shù)將語音識別為文本,以幫助提高系統(tǒng)準(zhǔn)確性。最常見的技術(shù)包括:自然語言處理(NLP)、隱馬爾可夫模型、n元文法、神經(jīng)網(wǎng)絡(luò)、聲紋分割聚類。

?

?? 語音識別常用場景?

汽車:較新的車型中往往有多種聲控導(dǎo)航工具,允許駕駛員在不轉(zhuǎn)移視線或不用手的情況下改變導(dǎo)航系統(tǒng)等方面,從而提高整體道路安全性;?

客戶服務(wù):虛擬助理越來越常見,如在電話中為客戶提供幫助;?

日常技術(shù):例如我們智能手機或其他設(shè)備上使用的虛擬助理(如?Siri?和?Alexa);?

教育:使用語音識別來加強與發(fā)音相關(guān)的語言教學(xué);?

情緒識別:通過對聲音特征的分析確定某人試圖傳達的具體情緒。情緒識別與情緒分析結(jié)合時尤其有用,能幫助我們了解客戶對某種產(chǎn)品或服務(wù)的感受;?

免提通信:類似于汽車語音辨識的用途,也可以進一步提升,如無需接聽智能手機即可接聽電話;?

安全性:基于語音的身份驗證可確保日常活動中的安全。


總結(jié)

?? ? ? ??語音識別可以帶來許多好處,但要使語音識別效果好,需要收集大量高質(zhì)量的培訓(xùn)數(shù)據(jù),數(shù)據(jù)多樣性也很重要哦!

? ? ? ??特別說明:本文編譯自 TAUS 官網(wǎng),原文標(biāo)題“What is Speech Recognition and how to do it?”,部分內(nèi)容有改動。


編譯:馮春霈

本文來源于微信公眾號“翻譯技術(shù)教育與研究”、微信公眾號“語言服務(wù)行業(yè)”,致力于語言服務(wù)行業(yè)資訊、洞察、洞見~ 關(guān)注我們,了解更多精彩內(nèi)容~?


三分鐘科普 | 語音識別是如何發(fā)生的?的評論 (共 條)

分享到微博請遵守國家法律
罗平县| 招远市| 南乐县| 平潭县| 尚义县| 沙河市| 同仁县| 盐池县| 拉萨市| 万盛区| 邛崃市| 临桂县| 缙云县| 锡林郭勒盟| 三门县| 射洪县| 缙云县| 贡嘎县| 巫溪县| 家居| 彭州市| 元氏县| 金堂县| 收藏| 永顺县| 东乌珠穆沁旗| 墨玉县| 社旗县| 临汾市| 华容县| 怀柔区| 中牟县| 阳曲县| 蒙自县| 静安区| 电白县| 元朗区| 乾安县| 祁东县| 清涧县| 邳州市|