字節(jié)跳動AI實驗室李磊:如何用算法幫助內(nèi)容在不同語言里互通
“聚焦如何利用AI為用戶、創(chuàng)作者建設(shè)更好的內(nèi)容創(chuàng)作平臺和分發(fā)平臺?!?/p>

作者|涂鴉君
編輯|tuya
據(jù)公司情報專家《財經(jīng)涂鴉》消息,7月11日下午,在2020世界人工智能大會WAIC“《新一代中國人工智能》全景論文背后的故事及AI產(chǎn)業(yè)在中國的發(fā)展和世界的領(lǐng)導(dǎo)力”圓桌論壇中,參與撰寫論文的七位作者討論了論文的意義和背后的故事。
字節(jié)跳動人工智能實驗室的總監(jiān)李磊博士作為作者之一,分享了字節(jié)跳動AI實驗室和他本人在人工智能方向最近的工作。
字節(jié)跳動AI實驗室近期聚焦在幾個方向,核心圍繞如何利用人工智能技術(shù)為用戶、創(chuàng)作者建設(shè)更好的內(nèi)容創(chuàng)作平臺和分發(fā)平臺。李磊及其團(tuán)隊研究方向主要集中在機(jī)器學(xué)習(xí)、文本生成、機(jī)器翻譯、魯棒性的機(jī)器學(xué)習(xí)優(yōu)化算法方面的研究。

李磊介紹,做機(jī)器學(xué)習(xí)和文本生成的目的是為作者提供更好的一些內(nèi)容生成技術(shù),幫助創(chuàng)作者創(chuàng)作更好內(nèi)容,“比如我們最近剛剛發(fā)表的一篇論文。在ACL上我們闡述了從2016年開始研發(fā)的一個系統(tǒng),智能寫稿機(jī)器人小明BOT。它可以從數(shù)據(jù)出發(fā),分析例如足球比賽這樣的視頻,通過文本生成的技術(shù),生成一篇全方位的比賽報道,再利用文本摘要的技術(shù),把它摘要成簡短的文字,利用機(jī)器翻譯成多種語言。最后我們通過語音合成技術(shù)把文本可以生成語音讀出來。我們也通過AR的技術(shù)去生成一個虛擬的形象、虛擬的播音員,他可以帶有表情、帶有動作的把整個文章播報出來?!?/p>
機(jī)器翻譯方面,李磊指出,他們希望通過技術(shù)去幫助內(nèi)容在不同語言里的互通,其中有很多難點:內(nèi)容產(chǎn)生的量非常大,而且用戶在創(chuàng)作這些內(nèi)容的時候,有些是比較正規(guī)的文章,有些是帶有社交屬性的語句,并不一定是完整的句子。
在機(jī)器翻譯研究過程當(dāng)中,李磊團(tuán)隊側(cè)重的方向一個是多語言是否能夠可以統(tǒng)一地來學(xué)習(xí)。比如可以研發(fā)一個統(tǒng)一的機(jī)器翻譯模型,直接可以翻譯五十甚至上百種模型,而不是像之前一樣,每個語對之間必須研發(fā)一個單一的模型。
第二個方向是,能否通過一些非監(jiān)督的方法研發(fā)出很好的翻譯模型。這樣可以用來幫助很稀有的語種之間做翻譯,比如中文和印地語(平行語料非常少),團(tuán)隊要研究如何在很少的平行語料基礎(chǔ)上,利用其他語種上的大量語料信息研發(fā)出比較好的翻譯模型。另外還有多模態(tài)的翻譯,要嘗試?yán)蒙舷挛男畔?、圖片信息、語音信息更好地做翻譯。
另一個方向是最近比較火熱的語音同傳。例如在開會時,AI同傳的目標(biāo)是把演講者中文直接實時地、無損地翻譯成英文或者其他語言。
李磊表示,所有提到的文本生成和機(jī)器翻譯內(nèi)容背后依賴于快速的機(jī)器學(xué)習(xí)的訓(xùn)練算法,所以他的團(tuán)隊也非常關(guān)注自適應(yīng)的優(yōu)化算法,尤其是像深度學(xué)習(xí)這樣里面涉及到的一些非凸的,非光滑的一些比較復(fù)雜的函數(shù)的優(yōu)化?!拔覀冏罱沧隽思铀俚亩A算法,以及自適應(yīng)的優(yōu)化算法,希望加速在深度網(wǎng)絡(luò)里的訓(xùn)練和干預(yù)。”