Talk預(yù)告 | 字節(jié)跳動(dòng)AI Lab葉蓉&董倩倩: 端到端語(yǔ)音翻譯中的知識(shí)融合方法

本期為TechBeat人工智能社區(qū)第335期線上Talk。
北京時(shí)間8月18日(周三)晚8點(diǎn),字節(jié)跳動(dòng)AI Lab 算法工程師—葉蓉和字節(jié)跳動(dòng)AI Lab 算法研究員—董倩倩的Talk將準(zhǔn)時(shí)在TechBeat人工智能社區(qū)開播!
她們與大家分享的主題是: “端到端語(yǔ)音翻譯中的知識(shí)融合方法”,屆時(shí)將介紹她們?cè)诶萌诤隙嘣粗R(shí)提升系統(tǒng)性能過(guò)程中所遇到的挑戰(zhàn)和進(jìn)展。
Talk·信息
主題:端到端語(yǔ)音翻譯中的知識(shí)融合方法
嘉賓:字節(jié)跳動(dòng)AI Lab 算法工程師
葉蓉
字節(jié)跳動(dòng)AI Lab 算法研究員
董倩倩
時(shí)間:北京時(shí)間?8月18日 (周三) 20:00
地點(diǎn):TechBeat人工智能社區(qū)
http://www.techbeat.net/
完整版怎么看?
掃描下方二維碼,或復(fù)制鏈接https://datayi.cn/w/kojkdLw9至瀏覽器,一鍵完成預(yù)約!上線后會(huì)在第一時(shí)間收到通知哦~
Talk·提綱
端到端建模緩解了傳統(tǒng)級(jí)聯(lián)語(yǔ)音翻譯方法的不足,但是缺少有標(biāo)注的訓(xùn)練數(shù)據(jù)嚴(yán)重制約了這一研究領(lǐng)域的發(fā)展。一個(gè)可商用的中、英語(yǔ)音識(shí)別系統(tǒng)需要使用上萬(wàn)小時(shí)音頻-轉(zhuǎn)寫平行數(shù)據(jù)訓(xùn)練得到,而一個(gè)商用的中到英文本機(jī)器翻譯系統(tǒng)則需要上億條平行句對(duì)訓(xùn)練得到,而目前可用于語(yǔ)音翻譯模型訓(xùn)練的音頻-翻譯標(biāo)注數(shù)據(jù)的量級(jí)只有幾百小時(shí)。如何融合多源知識(shí)來(lái)提升系統(tǒng)性能是目前亟需考慮的問(wèn)題。
端到端語(yǔ)音翻譯的背景介紹:
· LUT:學(xué)習(xí)單語(yǔ)預(yù)訓(xùn)練模型的知識(shí)
· COSTT:利用雙語(yǔ)平行數(shù)據(jù)的知識(shí)
· XSTnet:漸進(jìn)式融合多源知識(shí)
Talk·參考資料
這是本次分享中將會(huì)提及的資料,建議提前預(yù)習(xí)哦!
[1]?LUT
https://arxiv.org/abs/2009.09704
[2] COSTThttps://arxiv.org/abs/2009.09737
[3] XSTnet
https://arxiv.org/pdf/2104.10380
Talk·提問(wèn)交流
通過(guò)以下兩種方式提問(wèn)都將獲得微信現(xiàn)金紅包獎(jiǎng)勵(lì)哦!
方式 ①
在Talk界面下的【交流區(qū)】參與互動(dòng)!留下你的打call??和問(wèn)題??,和更多小伙伴們共同討論,被講者直接翻牌解答!

你的每一次貢獻(xiàn),我們都會(huì)給予你相應(yīng)的i豆積分,還會(huì)有驚喜獎(jiǎng)勵(lì)哦!
方式 ②
在本文留言區(qū)直接提出你的問(wèn)題,或掃描下方二維碼提問(wèn)!

Talk·嘉賓介紹

字節(jié)跳動(dòng)AI Lab 算法工程師
葉蓉,字節(jié)跳動(dòng)AI Lab算法工程師,碩士畢業(yè)于復(fù)旦大學(xué)。她主要研究方向?yàn)檎Z(yǔ)音翻譯和文本生成,并以第一作者/主要作者在ICLR/AAAI/InterSpeech等發(fā)表論文。
個(gè)人主頁(yè):
https://github.com/ReneeYe

字節(jié)跳動(dòng)AI Lab 算法研究員
董倩倩,現(xiàn)在是字節(jié)跳動(dòng) AI Lab研究員,博士畢業(yè)于中科院自動(dòng)化所聽覺(jué)模型和認(rèn)知計(jì)算實(shí)驗(yàn)室,導(dǎo)師為徐波研究員,曾獲第一屆AI Challenger比賽機(jī)器同聲傳譯賽道冠軍。她主要研究興趣為語(yǔ)音翻譯、機(jī)器翻譯、語(yǔ)音識(shí)別,并以第一作者/主要作者在AAAI、ACL、COLING、IWSLT等自然語(yǔ)言處理/機(jī)器學(xué)習(xí)的會(huì)議上發(fā)表論文數(shù)篇,并長(zhǎng)期擔(dān)任相關(guān)會(huì)議的審稿人。
個(gè)人主頁(yè):
https://github.com/dqqcasia

關(guān)于TechBeat人工智能社區(qū)
TechBeat (www.techbeat.net) 是一個(gè)薈聚全球華人AI精英的成長(zhǎng)社區(qū)。 我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其學(xué)習(xí)成長(zhǎng)。 期待這里可以成為你學(xué)習(xí)AI前沿知識(shí)的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級(jí)打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ