最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

專訪 | 黃書劍:如何評(píng)價(jià)機(jī)器翻譯質(zhì)量的好壞?

2022-03-09 22:53 作者:翻譯技術(shù)點(diǎn)津  | 我要投稿


? ? ? ? 如今,人工智能的時(shí)代大勢(shì)引發(fā)了深刻的技術(shù)革命、教育變革和數(shù)據(jù)革命,同時(shí)翻譯技術(shù)也成為了翻譯教學(xué)和實(shí)踐中不可分割的部分,進(jìn)一步推動(dòng)了語言服務(wù)行業(yè)和高校教育的創(chuàng)新變革,促進(jìn)了技術(shù)與人的和諧共生。為提升語言服務(wù)行業(yè)各方對(duì)翻譯技術(shù)的認(rèn)識(shí)和應(yīng)用能力,加強(qiáng)語言服務(wù)人才的技術(shù)素養(yǎng),加速語言技術(shù)成果的高效轉(zhuǎn)化,整合當(dāng)前優(yōu)質(zhì)和有效的翻譯技術(shù)資源,推動(dòng)翻譯技術(shù)與翻譯教學(xué)的融合發(fā)展,促進(jìn)政、產(chǎn)、學(xué)、研的協(xié)同創(chuàng)新,WITTA翻譯技術(shù)教育研究會(huì)(TTES)特別策劃了【大咖專欄】,本期專欄將聚焦“機(jī)器翻譯和譯后編輯”,對(duì)話業(yè)界和學(xué)界的專家教授,聆聽業(yè)內(nèi)名家的精彩觀點(diǎn),洞見未來翻譯技術(shù)發(fā)展趨勢(shì)。

? ? ? ? 本期專訪嘉賓是南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授,博士生導(dǎo)師黃書劍老師。讓我們來聽聽他對(duì)機(jī)器翻譯的看法。

問:

隨著機(jī)器翻譯的不斷發(fā)展,有關(guān)其譯文的質(zhì)量備受關(guān)注,您如何看待目前機(jī)器翻譯的譯文質(zhì)量呢?您認(rèn)為機(jī)器翻譯還存在哪些進(jìn)步空間呢?

答:

隨著資源的逐步上升,目前機(jī)器翻譯的質(zhì)量有了非常顯著的提升,技術(shù)上其實(shí)已經(jīng)達(dá)到非常成熟的程度。對(duì)于資源豐富的語言,比如在商業(yè)中使用的機(jī)器翻譯系統(tǒng)中,中英數(shù)據(jù)量已經(jīng)達(dá)到千萬甚至上億句對(duì)了,它的翻譯質(zhì)量已經(jīng)非常不錯(cuò)了。但是也存在一些資源相對(duì)稀缺的語言對(duì),這些語言對(duì)上的翻譯質(zhì)量可能還相對(duì)弱一些。總體上從翻譯結(jié)果來說,資源豐富的語言的質(zhì)量已經(jīng)能夠讓人接受了,而資源稀缺的語言就不太容易取得比較理想的效果,比如有些詞還不認(rèn)識(shí),有些句子還翻不對(duì)。

所以從提高機(jī)器翻譯的角度,現(xiàn)在學(xué)術(shù)界研究的主要問題是如何在這些資源相對(duì)匱乏的語言對(duì)上,也能構(gòu)建出比較成熟有效的機(jī)器翻譯系統(tǒng)。當(dāng)然,除了絕對(duì)的資源豐富和匱乏之外,也存在一些相對(duì)資源匱乏的場(chǎng)景。比如我們現(xiàn)在要做一個(gè)法律文書的翻譯系統(tǒng),雖然中英這個(gè)語言對(duì)上已經(jīng)有非常多的平行數(shù)據(jù)了,但是在法律文書這個(gè)特定領(lǐng)域上,可能也仍然存在資源相對(duì)比較少的情況,所以在這些相對(duì)比較少的領(lǐng)域上的翻譯質(zhì)量也還有進(jìn)一步提升的空間。

問:

目前可以采用哪些方法對(duì)機(jī)器翻譯質(zhì)量進(jìn)行評(píng)估呢?有沒有最佳方案?

答:

對(duì)于機(jī)器翻譯的質(zhì)量評(píng)估問題,目前這是一個(gè)學(xué)術(shù)界正在研究的問題。應(yīng)該說還沒有特別成熟可靠的方案。從學(xué)術(shù)的角度來看,質(zhì)量評(píng)估跟翻譯其實(shí)是并行的兩個(gè)問題。比如譯者如果有能力進(jìn)行翻譯,對(duì)應(yīng)的也應(yīng)該有能力去判斷翻譯好不好,這兩個(gè)能力其實(shí)應(yīng)該是相輔相成。

目前有一些比較常見的評(píng)估方法,比如對(duì)翻譯結(jié)果的句子是否通暢進(jìn)行一些評(píng)估,或者是根據(jù)某些特定的檢查點(diǎn),比如有些固定的單詞有沒有翻對(duì)等可以做一些評(píng)估。除此之外,學(xué)術(shù)界也在研究一些整體性的方案。現(xiàn)在深度學(xué)習(xí)在人工智能當(dāng)中比較火,學(xué)術(shù)界也在研究利用深度學(xué)習(xí)技術(shù)的一些方案,核心思想主要是利用大規(guī)模數(shù)據(jù)中包含的知識(shí)。假設(shè)中英我們有一千萬的平行句對(duì),利用這些句對(duì)當(dāng)中包含的翻譯知識(shí),也可能來幫我們檢查某個(gè)特定的翻譯結(jié)果是否正確。這些問題也還在研究當(dāng)中,有一些系統(tǒng)已經(jīng)能達(dá)到一定的評(píng)估效果,但目前就準(zhǔn)確性而言,還沒有達(dá)到非常成熟的地步。

問:

這些評(píng)估方法是否可靠呢?在具體案例中是否會(huì)受到其他因素影響呢?

答:

上述回答中已經(jīng)提到一些簡單的方法。其實(shí)這些簡單的方法,在實(shí)際應(yīng)用中往往是比較有效的。比如特定的命名實(shí)體翻譯是否正確,這一點(diǎn)很容易檢查,并且能接收到很好的效果。對(duì)于之前提到的相對(duì)比較復(fù)雜的方案,比如基于深度學(xué)習(xí)的方案,它可以整體上評(píng)估翻譯質(zhì)量,但是由于深度學(xué)習(xí)的可解釋性現(xiàn)在是一個(gè)比較大的問題(也就是說我們可以知道這個(gè)句子大概翻的不太好,但具體哪兒不好或者為什么不好,目前還沒能進(jìn)行特別有效的說明),所以這個(gè)方案還在研究當(dāng)中,那么什么時(shí)候能夠具體投入使用呢?我們也拭目以待。

問:

我們也了解到,針對(duì)以上提到的問題,有些公司提供了APE服務(wù)即自動(dòng)修正服務(wù)來進(jìn)一步提高機(jī)翻質(zhì)量,您認(rèn)為還可以采取哪些方法來進(jìn)一步提高機(jī)翻質(zhì)量呢?

答:

關(guān)于APE自動(dòng)修正服務(wù),它其實(shí)也是在訓(xùn)練一個(gè)翻譯系統(tǒng),只不過它的翻譯的輸入是一個(gè)機(jī)器翻譯系統(tǒng)的翻譯結(jié)果,輸出是一個(gè)更新或者修正過后的翻譯結(jié)果。原則上來說完成這樣一個(gè)自動(dòng)修正的系統(tǒng)也需要大量的知識(shí)和數(shù)據(jù),也就是說我們需要從數(shù)據(jù)中學(xué)習(xí)如何進(jìn)行改正。而學(xué)習(xí)的效果也受到數(shù)據(jù)的規(guī)模等方面的限制。目前可以看到APE有一定的效果,但是能否真正能達(dá)到實(shí)用的需求目前也處于在探索當(dāng)中,這里主要原因還是在于數(shù)據(jù)中包含的知識(shí)是否足夠的問題。

對(duì)于進(jìn)一步提高機(jī)器反應(yīng)的質(zhì)量,我認(rèn)為有三個(gè)角度。上面的回答也有涉及,第一是增大數(shù)據(jù)資源,第二是要針對(duì)性地開發(fā)特定領(lǐng)域的翻譯知識(shí),第三就是從技術(shù)上做一些提升以綜合各種不同的知識(shí)。比如說一本專業(yè)詞典能否對(duì)翻譯有很大幫助?這在人工翻譯過程中,答案是很顯然的。但是對(duì)機(jī)器來說,還存在一些技術(shù)上進(jìn)行提升的空間,這個(gè)問題在機(jī)器翻譯當(dāng)中也得到了廣泛的關(guān)注。

問:

隨著神經(jīng)機(jī)器翻譯不斷發(fā)展,機(jī)器翻譯質(zhì)量不斷提高,您認(rèn)為未來機(jī)器翻譯質(zhì)量評(píng)估會(huì)有什么發(fā)展呢?

答:

對(duì)于未來機(jī)器翻譯評(píng)估的發(fā)展,原則上來說,如同剛才提到過的:評(píng)估和翻譯是并行的兩個(gè)能力。一方面翻譯能力在增長,另一方面評(píng)估的能力也應(yīng)該在增長。所以我認(rèn)為隨著神經(jīng)機(jī)器翻譯不斷發(fā)展,不只是翻譯質(zhì)量提高,我們的評(píng)估能力也會(huì)相應(yīng)提高。翻譯和評(píng)估兩者之間應(yīng)該是有更好的補(bǔ)充或者輔助的關(guān)系。但這一點(diǎn)在目前還存在不足,我們希望這兩個(gè)共同提高的系統(tǒng)能夠有各自不同的關(guān)注方向,從而二者能夠更好的互補(bǔ),而現(xiàn)在看來,他們同質(zhì)性相對(duì)高了一些。

問:

在機(jī)器翻譯質(zhì)量不斷提高的同時(shí),您認(rèn)為譯者應(yīng)該具備什么樣的能力以適應(yīng)這種變化呢?

答:

其實(shí)這個(gè)問題我認(rèn)為從機(jī)器翻譯產(chǎn)生開始就已經(jīng)存在了。從機(jī)器翻譯加入到翻譯生產(chǎn)行業(yè)以來,譯者朋友們的工作方式就在不斷的發(fā)生變化。我覺得大的趨勢(shì)是大量重復(fù)的、簡單的工作將慢慢被機(jī)器所掌握。機(jī)器代替人來做這些重復(fù)勞動(dòng),而譯者就需要去解決更難的、更有挑戰(zhàn)性的、更復(fù)雜的或者更容易混淆的問題。這樣的趨勢(shì)對(duì)譯者本身的素質(zhì)水平有了更高的要求,當(dāng)然我想同時(shí)也給了譯者朋友們更廣闊的提升空間。


黃書劍

博士,南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授,博士生導(dǎo)師。畢業(yè)于南京大學(xué),獲得工學(xué)學(xué)士和博士學(xué)位?,F(xiàn)任中文信息學(xué)會(huì)青年工作委員會(huì)執(zhí)委,中文信息學(xué)會(huì)機(jī)器翻譯專委會(huì)副主任,中國計(jì)算機(jī)學(xué)會(huì)中文信息技術(shù)專委會(huì)委員,主要研究方向包括自然語言處理、機(jī)器翻譯、計(jì)算機(jī)輔助翻譯、知識(shí)發(fā)掘等。發(fā)表論文三十余篇,其中包括ACL,EMNLP,AAAI,IJCAI等頂級(jí)國際會(huì)議。曾擔(dān)任ACL,AAAI,IJCAI,EMNLP,NAACL等會(huì)議的PC或?qū)徃迦耍瑩?dān)任CCMT2019程序委員會(huì)主席,NLPCC2016、CCL2018機(jī)器翻譯領(lǐng)域主席,CWMT2017、CWMT2018評(píng)測(cè)委員會(huì)主席等。

本文來源于微信公眾號(hào)“語言服務(wù)行業(yè)”,致力于語言服務(wù)行業(yè)資訊、洞察、洞見~ 關(guān)注我們,了解更多精彩內(nèi)容~



專訪 | 黃書劍:如何評(píng)價(jià)機(jī)器翻譯質(zhì)量的好壞?的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
景德镇市| 海林市| 北海市| 洞头县| 桂东县| 河西区| 菏泽市| 佛学| 怀柔区| 内江市| 漳平市| 彭泽县| 邵武市| 巍山| 安阳县| 西藏| 田林县| 元江| 阿尔山市| 宜章县| 合阳县| 芒康县| 施甸县| 临安市| 芷江| 杭锦后旗| 科尔| 怀化市| 隆尧县| 合肥市| 湄潭县| 柳林县| 防城港市| 新民市| 宜州市| 涟源市| 临邑县| 卢氏县| 秦安县| 阿拉善左旗| 西平县|