大咖面對(duì)面 | 智能語(yǔ)音專場(chǎng)——陳果果博士
智能語(yǔ)音是人工智能的重要分支與熱門領(lǐng)域。隨著語(yǔ)音識(shí)別技術(shù)的落地,智能語(yǔ)音已成為人與機(jī)器交互的重要方式,被廣泛應(yīng)用于智能手機(jī)、智能家居、智能機(jī)器人、智能汽車等智能化終端設(shè)備中。
那么,未來(lái)語(yǔ)音技術(shù)的發(fā)展方向是什么?實(shí)際落地中又有哪些困難?本期《深藍(lán)&大咖面對(duì)面》特邀陳果果博士聊聊你關(guān)心的智能語(yǔ)音相關(guān)問(wèn)題~

分享嘉賓
陳果果
SEASALT.AI聯(lián)合創(chuàng)始人,約翰霍普金斯大學(xué)博士,清華大學(xué)本科。
師從當(dāng)前最流行的開(kāi)源語(yǔ)音識(shí)別工具Kaldi之父Daniel Povey,以及美國(guó)人類語(yǔ)言技術(shù)卓越中心(HLTCOE)和約翰霍普金斯語(yǔ)言語(yǔ)音處理中心(CLSP)的Sanjeev Khudanpur教授,主要研究方向是語(yǔ)音識(shí)別以及關(guān)鍵詞檢索方向。
博士期間為Google開(kāi)發(fā)了Google的喚醒詞Okay Google的原型,現(xiàn)在已經(jīng)用到的數(shù)以億計(jì)的安卓設(shè)備上。博士期間同時(shí)也參與開(kāi)發(fā)語(yǔ)音識(shí)別開(kāi)源系統(tǒng)Kaldi,以及神經(jīng)網(wǎng)絡(luò)開(kāi)源工具CNTK。
博士畢業(yè)后,聯(lián)合創(chuàng)辦KITT.AI,致力于語(yǔ)音喚醒和自然語(yǔ)音交互技術(shù)的研究開(kāi)發(fā),公司曾被CBInsights評(píng)選為首屆AI 100公司,2017年被百度收購(gòu)后加入百度度秘事業(yè)部,擔(dān)任主任架構(gòu)師。2020年離開(kāi)百度,聯(lián)合創(chuàng)辦Seasalt.AI以及http://Vobil.com,聚焦于語(yǔ)音識(shí)別和自然語(yǔ)言處理相關(guān)的企業(yè)服務(wù)。2020年同時(shí)發(fā)起志愿者組織SpeechColab,并發(fā)布GigaSpeech數(shù)據(jù)集,包括10000小時(shí)帶標(biāo)注的英文語(yǔ)音識(shí)別數(shù)據(jù),以及33000小時(shí)半監(jiān)督、無(wú)監(jiān)督英文語(yǔ)音識(shí)別數(shù)據(jù)。
分享內(nèi)容
1.目前語(yǔ)音領(lǐng)域的進(jìn)展,以及實(shí)際落地中遇到的困難;
2.智能語(yǔ)音在嵌入式設(shè)備端落地時(shí),相比于服務(wù)器端,有哪些是需要特別考慮的因素?
3.對(duì)于從事語(yǔ)音領(lǐng)域的科研同行以及在校學(xué)生,有哪些建議?
4.發(fā)布的英文版語(yǔ)音識(shí)別數(shù)據(jù)集介紹。
直播時(shí)間
10月10日13:00-15:00
報(bào)名方式
點(diǎn)擊下方即可免費(fèi)觀看
https://www.shenlanxueyuan.com/page/116