最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

一切“聽”你指揮,語音識別帶來沉浸式物聯(lián)網(wǎng)體驗

2020-07-24 09:24 作者:電堂科技  | 我要投稿


1952年,語音識別技術的雛形“Audrey”在貝爾實驗室問世。至今,已近80年,這其中有兩次技術性突破:一是,2009 年深度學習被系統(tǒng)應用到語音識別領域中,大幅提升識別精度,突破 90%,甚至在標準環(huán)境下逼近 98%;二是Amazon Echo?于2015年6月正式面世,它把近場語音交互變成了遠場語音交互,不僅引領了時尚生活風潮,還將語音識別技術從對算法不斷優(yōu)化的追求推向多樣化應用場景的落地以及更好的用戶體驗。

▲ 智能音箱帶來時尚家居新風潮

多傳感融合、大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等技術不斷驅動語音識別的發(fā)展,并持續(xù)創(chuàng)造著新的應用場景,覆蓋智能家居、汽車、客服、金融、教育、醫(yī)療多領域。據(jù)Tractica數(shù)據(jù)顯示,2017年全球語音和語音識別軟件市場規(guī)模達到11億美元,隨著人工智能技術的逐漸成熟,市場需求將不斷攀升,預計2025年全球語音和語音識別軟件市場規(guī)模將69億美元。

▲ 全球語音識別市場不斷攀升


從聽到、聽清到聽懂

語音識別主要趨于遠場化和融合化的方向發(fā)展,但遠場可靠性還面臨很多難點,比如多輪交互、多人噪雜等場景還有待突破,人聲分離技術尚需提高。只有徹底解決這些問題,機器聽覺才有可能超越人類的感知能力。這不能僅僅只是算法的進步,需要整個產(chǎn)業(yè)鏈的協(xié)同技術升級,包括更為先進的傳感器和算力更強的芯片。?從遠場語音識別技術來看,存在的挑戰(zhàn)包括:

  • 回聲消除技術。能否利用深度學習將非線性失真進行擬合,同時結合信號處理手段,可能是一個好的方向。

  • 解決噪聲問題。信號處理擅長處理線性問題,深度學習擅長處理非線性問題,兩者融合才有可能更好地解決噪聲下的語音識別問題。

  • 口音/方言識別。好的聲學模型易于識別,如何利用少量的方言數(shù)據(jù)得到一個好的方言聲學模型,這是待解決的難點。

  • 不但聽到還要聽懂。如何將語音識別和語義理解結合起來,可能是未來更為重要的一個方向。

  • “聲光電熱力磁”物理傳感手段的融合。機器必然要超越人類的五官,能夠看到人類看不到的世界,聽到人類聽不到的世界。

2019年2月,恩智浦推出了全球首款基于MCU的語音控制解決方案,已獲得亞馬遜Alexa語音服務(AVS)認證。該解決方案可幫助OEM快速、輕松、經(jīng)濟地為其產(chǎn)品添加語音控制,使客戶能夠使用Alexa獲得豐富的語音體驗。


這款基于MCU的AVS解決方案采用恩智浦i.MX RT跨界平臺,支持低延遲、遠場“喚醒詞”檢測;嵌入了所有必需的數(shù)字信號處理能力;在亞馬遜的FreeRTOS上運行;包含Alexa客戶端應用程序。這是一款經(jīng)濟高效、易于使用的解決方案,可嵌入家庭、商業(yè)和工業(yè)領域的各種產(chǎn)品,無需部署智能揚聲器或智能顯示器等獨立語音控制設備。

2020年2月,恩智浦進一步推出離線語音解決方案SLN-LOCAL-IOT。該解決方案包含一個完整的硬件模塊設計和必要的相關軟件,用于通過可自定義的喚醒詞和本地命令來實施遠場語音控制。該解決方案基于i.MX RT106L跨界微控制器(MCU),可滿足廣泛的智能家居、商用和工業(yè)市場對嵌入式語音控制的需求。


OEM可以利用這款“交鑰匙”解決方案大幅降低系統(tǒng)成本并縮短上市時間,為最終用戶提供私密、安全、低延遲、無需動手操作的體驗。此外,本地語音控制解決方案無需進行復雜、高成本的云連接,并且由于支持直接在設備上處理音頻,可以幫助保護用戶的隱私。為實現(xiàn)這一目標,恩智浦還與Sonos合作開發(fā)了基于機器學習的集成自動語音識別 (ASR)技術。


恩智浦語音識別技術專場直播

2020年8月4日恩智浦語音識別技術專場直播將開播,特邀恩智浦半導體專家為大家講解基于恩智浦RT106A/RT106L?的語音識別解決方案


?直 播?內(nèi) 容?

主題:基于恩智浦 RT106A/RT106L?的語音識別解決方案


RT106A/RT106L是一款核心是Arm Cortex-M7, 主頻600MHz 的MCU,借助于主頻高、成本低、功耗低、外圍設備接口簡單的優(yōu)勢在多個應用領域完美替代MPU?;赗T106F 開發(fā)的面部識別方案,在硬件上可以省去傳統(tǒng)MPU+PMIC,替換掉昂貴的DDR, 大大降低產(chǎn)品的整體成本。RT106A可選內(nèi)置Alexa協(xié)議方案,官方認證程序支持云端喚醒,以及亞馬遜家庭網(wǎng)絡套件。其兄弟產(chǎn)品RT106L是一套低成本的本地語音方案,內(nèi)置NXP自主研發(fā)喚醒引擎,集成Codec,可支持3個麥克風和360°遠場拾音。

?

基于RT106A 和 RT106L 的語音識別方案可廣泛應用于智能家電,工業(yè)控制,智能玩具以及醫(yī)療等領域。

?

為方便客戶的二次開發(fā),恩智浦準備了完整的開發(fā)套件,包括開發(fā)主板,攝像頭插件,免費易用的開發(fā)環(huán)境,完備的開發(fā)文檔以及示例代碼。


內(nèi)容安排:

  1. 基于RT106A和RT106L的語音識別方案及市場攻略

  2. 全新在線和本地語音方案設計

  3. 語音識別參考設計及開發(fā)套件

  4. 問答環(huán)節(jié)

?主 講 嘉 賓?

王廣寧先生擔任恩智浦半導體無線充電及物聯(lián)網(wǎng)方案產(chǎn)品經(jīng)理,負責無線充電以及物聯(lián)網(wǎng)產(chǎn)品的定義涵蓋消費類,工業(yè)及汽車級,市場策略以及產(chǎn)品的培訓與管理。

王文生先生擔任恩智浦半導體 AI IoT 方案部門系統(tǒng)工程師,負責Voice Solution SDK的代碼修復, 軟件系統(tǒng)開發(fā)及重要客戶的技術支持。


?直 播 信 息?

時間:?8月4日14點-16點?


直播獎品?

點擊鏈接,預約直播:

https://nxp.51diantang.com/livedetail?id=9e40de9898e14581a4c91e83f0a57d47


一切“聽”你指揮,語音識別帶來沉浸式物聯(lián)網(wǎng)體驗的評論 (共 條)

分享到微博請遵守國家法律
哈巴河县| 肇州县| 沙湾县| 灌阳县| 内江市| 贺兰县| 丹棱县| 丹江口市| 铁岭县| 江陵县| 南阳市| 大余县| 托克托县| 呼图壁县| 安徽省| 若羌县| 新野县| 东乌珠穆沁旗| 稻城县| 武平县| 日喀则市| 莆田市| 武山县| 通州市| 大姚县| 五大连池市| 嘉黎县| 肇源县| 邯郸县| 泰兴市| 从化市| 苗栗市| 无为县| 会同县| 德阳市| 马关县| 冕宁县| 波密县| 东阿县| 临澧县| 六枝特区|