最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

語音之家聲紋識別與音頻處理

2023-08-13 22:28 作者:bili_34604920956  | 我要投稿

識別類型

1. 按應(yīng)用場景分類

一對一:身份確認(rèn),即在知道是某人身份的情況下,判斷音頻是不是此人的聲音。例如在銀行app,當(dāng)前已經(jīng)登錄賬戶,在進(jìn)行轉(zhuǎn)賬或其它操作時(shí),需要判斷是否本人在操作,這時(shí)候就可以通過一對一場景下的聲紋識別,判斷是不是登錄的賬號本人。

一對多:身份辨認(rèn),在一個(gè)注冊了很多聲紋用戶組中,根據(jù)音頻判斷是其中的哪個(gè)人的聲音。比如很多人用微信注冊了聲紋,然后用聲紋鎖登錄時(shí),需要判斷在所有已注冊聲紋的用戶中,音頻對應(yīng)的是其中哪個(gè)人,在很多的注冊用戶中,找到音頻對應(yīng)的聲音身份。

多對多(聲紋聚類):在一些雜亂的音頻中,找出特征相似(某個(gè)人)的所有音頻,則可以通過音頻之間的對比,把相似的音頻歸為一類,從而選出特征相似(同一個(gè)人)所有音頻。

2. 按音頻內(nèi)容分類

文本相關(guān):文本相關(guān)指的是說出規(guī)定的短句(一般為4到6個(gè)字的短句),用于聲紋識別。例如在智能音箱喚醒的時(shí)候,可以根據(jù)音色判斷喚醒人的身份 ,如果是小孩子喚醒則可以開啟兒童模式,如果是未提前注冊的則不能進(jìn)行喚醒音箱。

文本半相關(guān)(隨機(jī)數(shù)字串):指的是隨機(jī)的6位或8位數(shù)字串,這是一種配合式的聲紋識別模式,需要讀出app或者其它客戶端生成的6位或8位數(shù)字串,也可以結(jié)合語音識別技術(shù)(ASR)判斷讀的數(shù)字串是否正確。目前文本半相關(guān)的聲紋識別模式在生活中接觸到的最多,許多銀行類的APP,以及微信和支付寶聲紋識別都采用的這種方式,方便讀、識別率也高。所以很多APP上的聲紋識別身份認(rèn)證一般都采用一對一的隨機(jī)數(shù)字串。


語音之家聲紋識別與音頻處理的評論 (共 條)

分享到微博請遵守國家法律
蒙自县| 滨海县| 灌阳县| 建宁县| 九江市| 温宿县| 合作市| 武胜县| 乐平市| 呈贡县| 东乌| 原平市| 南部县| 布拖县| 周口市| 沧州市| 栖霞市| 开平市| 彰化县| 汉寿县| 集安市| 天气| 靖远县| 临安市| 陕西省| 黄浦区| 墨竹工卡县| 肃北| 莫力| 和平县| 大兴区| 绥芬河市| 本溪| 中方县| 松阳县| 凤冈县| 山东省| 杨浦区| 江口县| 南宁市| 射洪县|