【活動(dòng)通知】SFFAI 128 機(jī)器翻譯專題
傳統(tǒng)機(jī)器翻譯讀入完整的源端句子之后一次性輸出翻譯,而機(jī)器同聲傳譯 (Simultaneous Machine Translation) 在閱讀整個(gè)源句子的同時(shí)進(jìn)行翻譯,因此其性能由翻譯質(zhì)量和延遲兩方面來(lái)評(píng)估。機(jī)器同傳在不同的場(chǎng)景下往往有不同的延時(shí)需求,例如實(shí)時(shí)直播往往需要更低延時(shí)以提供更加流暢的翻譯,而正式會(huì)議則側(cè)重更高的翻譯質(zhì)量而允許稍高的延時(shí)。本期我們邀請(qǐng)到了來(lái)自計(jì)算技術(shù)研究所的張紹磊同學(xué),介紹其構(gòu)建的通用機(jī)器同傳模型,使用一個(gè)模型在多個(gè)延時(shí)下完成高質(zhì)量的翻譯。

講者介紹
張紹磊,中國(guó)科學(xué)院計(jì)算技術(shù)研究所直博生,主要研究方向?yàn)闄C(jī)器翻譯、同聲傳譯。以第一作者在 EMNLP、AAAI 等國(guó)際會(huì)議上發(fā)表論文3篇;參加全球第二屆同聲傳譯測(cè)評(píng)比賽并在流式輸入賽道獲得冠軍;擔(dān)任中國(guó)中文信息學(xué)會(huì)青年工作委員會(huì)學(xué)生執(zhí)委,組織開展各項(xiàng)學(xué)術(shù)活動(dòng)。
會(huì)議題目
多延時(shí)下的通用機(jī)器同聲傳譯方法
會(huì)議摘要
現(xiàn)有的機(jī)器同聲傳譯方法通常需要為每個(gè)延時(shí)訓(xùn)練并維護(hù)多個(gè)同傳模型,導(dǎo)致計(jì)算成本很高和難以部署。在本文中,我們提出多專家混合Wait-k 策略以構(gòu)建通用機(jī)器同傳模型,僅使用一個(gè)模型在多個(gè)延時(shí)下完成高質(zhì)量的翻譯。在三個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)表明,我們的方法可以僅使用一個(gè)通用模型在不同延遲下優(yōu)于所有強(qiáng)基線,并且在高效性和魯棒性上取得可喜的結(jié)果。
會(huì)議亮點(diǎn)
1、本文開發(fā)了一種能夠在多延時(shí)下完成高質(zhì)量翻譯的通用機(jī)器同傳方法;
2、本文探索了通過混合專家模型(Mixture-of-Expert)劃分神經(jīng)元以提升模型表征能力的具體方法;
3、本文提出的通用模型可以被當(dāng)做一個(gè)機(jī)器同傳內(nèi)核,具有很強(qiáng)的拓展性。
直播時(shí)間
2021年11月14日(周日)20:00—21:00 線上直播
關(guān)注微信公眾號(hào):人工智能前沿講習(xí),對(duì)話框回復(fù)“SFFAI128”,獲取入群二維碼

現(xiàn)代科學(xué)技術(shù)高度社會(huì)化,在科學(xué)理論與技術(shù)方法上更加趨向綜合與統(tǒng)一,為了滿足人工智能不同領(lǐng)域研究者相互交流、彼此啟發(fā)的需求,我們發(fā)起了SFFAI這個(gè)公益活動(dòng)。SFFAI每周舉行一期線下活動(dòng),邀請(qǐng)一線科研人員分享、討論人工智能各個(gè)領(lǐng)域的前沿思想和最新成果,使專注于各個(gè)細(xì)分領(lǐng)域的研究者開拓視野、觸類旁通。
SFFAI目前主要關(guān)注機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、自然語(yǔ)言處理等各個(gè)人工智能垂直領(lǐng)域及交叉領(lǐng)域的前沿進(jìn)展,將對(duì)線下討論的內(nèi)容進(jìn)行線上傳播,使后來(lái)者少踩坑,也為講者塑造個(gè)人影響力。SFFAI還在構(gòu)建人工智能領(lǐng)域的知識(shí)森林—AI Knowledge Forest,通過匯總各位參與者貢獻(xiàn)的領(lǐng)域知識(shí),沉淀線下分享的前沿精華,使AI Knowledge Tree枝繁葉茂,為人工智能社區(qū)做出貢獻(xiàn),歡迎大家關(guān)注SFFAI論壇:https://bbs.sffai.com。
