Talk預(yù)告 | 中科院房慶凱、字節(jié)算法工程師葉蓉:更好的語音表示,更強的語音翻譯

本期為TechBeat人工智能社區(qū)第419期線上Talk,也是ACL 2022系列Talk第③彈!
北京時間7月5日(周二)20:00,中國科學(xué)院計算技術(shù)研究所在讀博士生——房慶凱、字節(jié)跳動AI Lab算法工程師——葉蓉的Talk將準(zhǔn)時在TechBeat人工智能社區(qū)開播!他與大家分享的主題是: “更好的語音表示,更強的語音翻譯”,屆時將介紹兩種方法——STEMM和ConST。這兩種方法都獲得了不錯的語音翻譯效果,并分別發(fā)布在ACL22和NAACL22主會上。
Talk·信息
主題:更好的語音表示,更強的語音翻譯
嘉賓:中科院計算所在讀博士?房慶凱字節(jié)跳動AI Lab算法工程師?葉蓉
時間:北京時間?7月5日?(周二) 20:00
地點:TechBeat人工智能社區(qū)

完整版怎么看?
掃描下方二維碼,或復(fù)制鏈接https://datayi.cn/w/a9a0BGAo至瀏覽器,一鍵完成預(yù)約!上線后會在第一時間收到通知哦
Talk·介紹
為了更快速、更方便的部署,端到端語音翻譯獲得了很大的關(guān)注,它有助于緩解傳統(tǒng)級聯(lián)語音翻譯系統(tǒng)的不足,但是缺少有標(biāo)注的訓(xùn)練數(shù)據(jù)是端到端語音翻譯的一大挑戰(zhàn)。一個商用的中到英文本機器翻譯系統(tǒng)則需要上億條平行句對訓(xùn)練得到,而目前可用于語音翻譯模型訓(xùn)練的音頻-翻譯標(biāo)注數(shù)據(jù)只有十萬數(shù)據(jù)級。我們的想法是希望利用成熟的文本翻譯模型幫助端到端語音翻譯建模,而顯然,語音和文本兩個模態(tài)之間的表示存在差距,這便使得文本翻譯無法高效幫助語音翻譯,所以如何學(xué)習(xí)更好的、和文本表示更接近的語音表示?本次talk將會以此為出發(fā)點,介紹兩種方法——STEMM和ConST。這兩種方法都獲得了不錯的語音翻譯效果,并分別發(fā)布在ACL22和NAACL22主會上。
具體分享提綱如下:
端到端語音翻譯和語音表示的背景介紹
STEMM:利用Mixup方法縮小詞級別語音-文本表示鴻溝
ConST:利用對比學(xué)習(xí)方法縮小句級別語音-文本表示鴻溝
總結(jié)和展望
Talk·預(yù)習(xí)資料
[1]?[INTERSPEECH21]XSTnet:https://arxiv.org/pdf/2104.10380;
code:https://github.com/ReneeYe/XSTNet
[2]?[ACL22]STEMM:?https://arxiv.org/abs/2203.10426;
code:https://github.com/ictnlp/STEMM
[3]?[NAACL22]ConST:?https://arxiv.org/abs/2205.02444;
code:https://github.com/ReneeYe/ConST
Talk·提問交流
通過以下兩種方式提問都將獲得微信現(xiàn)金紅包獎勵哦!
方式 ①在Talk界面下的【交流區(qū)】參與互動!留下你的打call??和問題??,和更多小伙伴們共同討論,被講者直接翻牌解答!

你的每一次貢獻,我們都會給予你相應(yīng)的i豆積分,還會有驚喜獎勵哦!
方式 ②
在本文留言區(qū)直接提出你的問題,或掃描下方二維碼提問!

Talk·嘉賓介紹

中國科學(xué)院計算技術(shù)研究所在讀博士生
房慶凱,中國科學(xué)院計算技術(shù)研究所一年級博士生,導(dǎo)師為馮洋研究員。主要研究方向為自然語言處理、機器翻譯,曾在ACL上發(fā)表多篇論文。
個人主頁:
https://fangqingkai.github.io

字節(jié)跳動AI Lab算法工程師
字節(jié)跳動AI Lab算法工程師,碩士畢業(yè)于復(fù)旦大學(xué)。她主要研究方向為語音翻譯和文本生成,并以第一作者/主要作者在ICLR/AAAI/ACL等發(fā)表論文。
個人主頁:
https://github.com/ReneeYe


關(guān)于TechBeat人工智能社區(qū)
TechBeat (www.techbeat.net) 是一個薈聚全球華人AI精英的成長社區(qū)。 我們希望為AI人才打造更專業(yè)的服務(wù)和體驗,加速并陪伴其學(xué)習(xí)成長。 期待這里可以成為你學(xué)習(xí)AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據(jù)地!
更多詳細介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ