2022國際大數(shù)據(jù)競賽開賽,教AI當好“一帶一路”翻譯官
8月10日, 聯(lián)合國國際教科文組織國際工程科技知識中心(IKCEST)第四屆“一帶一路”國際大數(shù)據(jù)競賽暨第八屆百度&西安交大大數(shù)據(jù)競賽(以下簡稱“國際大數(shù)據(jù)競賽”)正式啟動,本屆賽題聚焦“低資源語言機器翻譯”行業(yè)難題,向全球開發(fā)者發(fā)出邀請。
百度發(fā)布稀缺語種任務(wù) 挑戰(zhàn)機器翻譯難題
截至今年5月,我國簽署的“一帶一路”合作文件已涉及110多種語言,沿線國家和地區(qū)在經(jīng)濟發(fā)展、民生改善等方面的合作日趨深入,對多語言翻譯的需求快速增長。
本屆大賽賽題——“一帶一路”低資源語言翻譯,重點關(guān)注法、俄、泰、阿與中文的互譯,突破了國際機器翻譯以英文為中心的評測慣例,旨在鼓勵全球青年挑戰(zhàn)低資源機器翻譯任務(wù),融入“一帶一路”建設(shè)。
“幫助人們跨越語言鴻溝,與世界自由溝通”是百度翻譯一直以來的愿景。自2010年開始研發(fā)機器翻譯以來,百度在多語言翻譯、多模態(tài)機器翻譯等核心技術(shù)以及產(chǎn)品方面持續(xù)創(chuàng)新。如今,百度翻譯已經(jīng)支持超過200種語言互譯,可以支持文本、語音、圖片與文檔翻譯,每日翻譯超過千億字符,服務(wù)全球用戶。百度技術(shù)委員會主席吳華表示,“百度翻譯致力于幫助人們與世界自由溝通”,這正是本屆賽題的技術(shù)基因。
頂級賽事 邀請逐夢青年推動全球互聯(lián)互通
國際大數(shù)據(jù)競賽于2015年由百度和西安交通大學聯(lián)合創(chuàng)辦,鼓勵選手用AI技術(shù)解決現(xiàn)實問題。2019年,百度與IKCEST、西安交通大學、絲綢之路大學聯(lián)盟合作,將大賽升級為國際賽事。

啟動儀式上,中國工程院國際合作局局長、IKCEST常務(wù)副主任田琦指出,本屆大賽致力于提升“一帶一路”重要語言的機器翻譯質(zhì)量,意義重大,他期待越來越多逐夢青年加入到推動全球互聯(lián)互通、創(chuàng)新發(fā)展的行列中來。
印度科學院院士、IKCEST理事會成員N.巴拉克里斯南(Narayanaswamy Balakrishnan)表示,“這次比賽將讓全球更加靠近‘類人機器翻譯’的目標。”
回顧大賽8年歷程,西安交通大學常務(wù)副校長鄭慶華教授以“三個飛躍”概括:從國內(nèi)競賽到全球大賽的級別飛躍,從幾十所高校到上萬支隊伍的規(guī)模飛躍,從單一的人工智能大數(shù)據(jù)算法到綜合型、創(chuàng)新型、設(shè)計型的內(nèi)容飛躍。
以賽促創(chuàng) 產(chǎn)學研合力完善AI人才培養(yǎng)生態(tài)
本屆大賽采用機器翻譯主流的BLEU評價指標。初賽階段,選手們將得到中法、中俄、中泰各10萬句對作為訓(xùn)練數(shù)據(jù)。復(fù)賽階段,以中阿5萬句作為訓(xùn)練數(shù)據(jù)。復(fù)賽排名前16的隊伍,進入決賽,現(xiàn)場答辯。

百度將為選手提供基于“PaddlePaddle”的基準模型以及免費、高性能算力支持,由國內(nèi)知名語言服務(wù)解決方案提供商譯馬網(wǎng)提供部分語料數(shù)據(jù)。本屆大賽的所有數(shù)據(jù)集均會于賽后在“千言開源數(shù)據(jù)集”平臺(https://www.luge.ai/#/)持續(xù)開放,助力更多AI人才投入產(chǎn)業(yè)研發(fā),促進技術(shù)進步。
國際大數(shù)據(jù)競賽初賽報名截止時間為2022年9月30日,詳情請登錄競賽官網(wǎng)(https://www.ikcest.org/bigdata2022)。