專訪 | 曹首光:如何打造一款受歡迎的機器翻譯產(chǎn)品?

如今,人工智能的時代大勢引發(fā)了深刻的技術(shù)革命、教育變革和數(shù)據(jù)革命,同時翻譯技術(shù)也成為了翻譯教學(xué)和實踐中不可分割的部分,進一步推動了語言服務(wù)行業(yè)和高校教育的創(chuàng)新變革,促進了技術(shù)與人的和諧共生。為提升語言服務(wù)行業(yè)各方對翻譯技術(shù)的認識和應(yīng)用能力,加強語言服務(wù)人才的技術(shù)素養(yǎng),加速語言技術(shù)成果的高效轉(zhuǎn)化,整合當(dāng)前優(yōu)質(zhì)和有效的翻譯技術(shù)資源,推動翻譯技術(shù)與翻譯教學(xué)的融合發(fā)展,促進政、產(chǎn)、學(xué)、研的協(xié)同創(chuàng)新,WITTA翻譯技術(shù)教育研究會(TTES)特別策劃了【大咖專欄】,本期專欄將聚焦“機器翻譯和譯后編輯”,對話業(yè)界和學(xué)界的專家教授,聆聽業(yè)內(nèi)名家的精彩觀點,洞見未來翻譯技術(shù)發(fā)展趨勢。
本期專訪嘉賓是機譯應(yīng)用GT4T開發(fā)者、資深譯者曹首光老師,讓我們來聽聽他對機器翻譯的看法。

GT4T在業(yè)界應(yīng)用非常廣泛,取得了非常大的成功,請談?wù)勀侨绾伟?GT4T這個產(chǎn)品做的如此受歡迎的?
? ? ? ? 我是譯者出身,對譯者使用機譯時的需求和痛點比較了解。另外GT4T是我和用戶之間良性互動,經(jīng)多年打磨的結(jié)果。我和用戶之間的正負反饋都比較順暢,用戶有問題有建議都可得到及時的修正和回應(yīng)。我的想法是把每個用戶都當(dāng)唯一的用戶一樣認真對待,當(dāng)然目前用戶數(shù)量不多。即使日后用戶多到我忙不過來了,我也想把這個當(dāng)成我運營GT4T這個產(chǎn)品的第一原則。
? ? ? ??就GT4T本身來講,譯者翻譯時所用工具多樣,首先譯者需要一個可以方便在任何窗口下調(diào)用機譯的工具。GT4T可同時提供多個機譯結(jié)果供參考,且可在任何窗口內(nèi)使用。很多人在談人機結(jié)合,GT4T就是人機結(jié)合的一個簡單易用的實現(xiàn)。
? ? ? ??其次GT4T也是個深耕人工翻譯行業(yè)的MTPE工具。各機器翻譯公司提供的文件翻譯器往往是面對終端用戶的,僅可處理常見的如Office格式的文檔,GT4T則還支持Trados Studio 等大多數(shù)新老CAT格式的預(yù)翻譯。大家可能不知道,很多如蘋果等大型公司,內(nèi)部仍然在使用一些非常老的CAT工具,如Idiom WorldServer等。有些老譯者發(fā)現(xiàn)GT4T居然支持 Idiom WorldServer格式的預(yù)翻譯時,感到大為驚訝。
? ? ? ??另外GT4T還是個機譯外掛。解決了一些機譯讓譯者抓狂的小毛病。例如一些翻譯公司對譯文格式有一定要求,要求使用空格隔開中英文或數(shù)字。機譯的結(jié)果通常是無法滿足這些需求的。GT4T增加了相應(yīng)的選項,用戶可以選擇是否使用空格開隔開中英文。還有機器翻譯日語譯文輸出經(jīng)常一會是敬語,一會是簡語。通過GT4T使用機譯,用戶則可選擇譯文全部使用簡語。
? ? ? ??最后,GT4T積極與所有機器翻譯供應(yīng)商洽談,集成了幾乎全球所有主流機器翻譯引擎,目的是保證任何語言對及任何行業(yè)都能得到當(dāng)前最好的機器翻譯。
GT4T集成了多種機器翻譯引擎,提供了便利的同時,也給譯者選擇帶來了一定的影響,您是如何看待這個問題的?
? ? ? ??我做譯者時,隨著我越來越多地使用機譯,翻譯工作也變得越來越索然無味了。機譯的使用讓我翻譯時少了很多創(chuàng)作的快樂,思維上越來越懶惰。翻譯工作越來越像校對了,想的不再是我該怎么表達,而是不斷地去判斷機譯所呈現(xiàn)的表達哪個更好。
? ? ? ??目前機譯大都是以句為單位來單獨計算的,句子與句子之間缺乏整體性。一篇文章用機器翻譯,譯文往往就是看著沒錯,讀著則像嚼蠟。即使沒有硬傷,讀起來也缺乏些韻味,缺少些靈魂。
? ? ? ??理想狀態(tài)下,機譯可以像詞典一樣,僅供譯者參考,但現(xiàn)實中譯者最終生產(chǎn)的譯文實際很可能受了機譯結(jié)果的影響。由此可見機譯就是個參考工具這個說法,不足以描述譯員使用機譯時的實際情況。
? ? ? ??如何克服這兩個問題我也很困惑,沒什么好的想法。但對于職業(yè)譯者,不用機器翻譯,效率確實會大大低于同行,我的朋友老翻譯Michael Zhang甚至認為:到現(xiàn)在還不用機譯的譯者,無異于行為藝術(shù)了。
從職業(yè)譯者來看,您如何看待機器翻譯譯后編輯這種模式的利弊關(guān)系?
? ? ? ??這個問題我首先想到的是目前翻譯公司和譯者之間似乎尚未在譯后編輯服務(wù)上達成價格協(xié)議。翻譯公司想采用譯后編輯,驅(qū)動力當(dāng)然是想省錢。但許多譯者因為譯后編輯價格過低而拒絕接譯后編輯。譯后編輯難以定價,我想原因主要是機器翻譯質(zhì)量不穩(wěn)定,有時候甚至難以預(yù)料。不同語種,不同行業(yè)以及不同的材料機器翻譯質(zhì)量差距較大。對每個項目都需要分別評估譯后編輯工作量,無疑又給翻譯公司增加了流程上的復(fù)雜性。
? ? ? ??譯者在使用機器翻譯時,一般采用兩種方式:交互式使用和譯后編輯。無論使用哪種方式,譯者都需要增強品控意識,對機器翻譯給譯文品質(zhì)可能產(chǎn)生的影響有足夠的認識。
當(dāng)前機器翻譯應(yīng)用平臺不斷出現(xiàn),機器翻譯廠商競爭也日益激烈,您如何看待這種現(xiàn)狀?
? ? ? ??像Trados Studio這樣的現(xiàn)代輔助翻譯平臺一般集成了三種輔助翻譯技術(shù):
1) 統(tǒng)一的翻譯及項目管理環(huán)境。有了翻譯平臺,譯者則僅需把要翻譯的各種格式的文檔導(dǎo)入至輔助翻譯平臺, 即可獲得統(tǒng)一的,通常是原文譯文兩列對照的翻譯環(huán)境。
2) 翻譯記憶。翻譯記憶是CAT平臺的核心功能,即將譯者譯過的內(nèi)容記錄,用于按相似度匹配和預(yù)翻譯后的譯文。
3) 機器翻譯。在神經(jīng)機器系統(tǒng)出現(xiàn)之后,翻譯平臺也大都接入了機器翻譯。
? ? ? ??翻譯記憶技術(shù)的出現(xiàn),正是因為早期機器翻譯水平較差,不具備實用價值而退而求其次的產(chǎn)物。如今隨著AI及大數(shù)據(jù)技術(shù)的出現(xiàn),機器翻譯實現(xiàn)了質(zhì)的突破。我認為翻譯記憶技術(shù)終將落幕,被更好,更智能的機器翻譯所取代。也就是說CAT的技術(shù)革新的重任可能在機器翻譯身上。
? ? ? ??不過到底該如何將機器翻譯應(yīng)用于輔助翻譯中,目前還沒有一種被業(yè)界普遍接受的方式。但CAT行業(yè)已有一種風(fēng)雨欲來的感覺。去年年底,Translated收購了專注于機譯輔助人工的機器翻譯引擎ModernMT,不知這個收購會給CAT工具行業(yè)帶來何樣的變革。騰訊的TranSmart團隊也在著力開發(fā)交互式機譯輔助翻譯系統(tǒng),據(jù)TranSmart負責(zé)人黃國平說,2022年將是TranSmart開花結(jié)果的一年,產(chǎn)品將會密集發(fā)布,我們拭目以待。
? ? ? ??現(xiàn)代機器翻譯基于開源的AI框架,架設(shè)一套機器翻譯系統(tǒng)的門檻并不高,有一臺高性能的服務(wù)器,安裝上開源的程序,給系統(tǒng)喂一定量的語料,一個機器翻譯系統(tǒng)就可以上線了。雖然運營一套為公眾服務(wù)的機器翻譯系統(tǒng)成本并不低,但因為不存在技術(shù)難題,再加上未來無窮的潛力,各大互聯(lián)網(wǎng)公司都有了自己的機器翻譯團隊,僅騰訊就有4個獨立的機器翻譯團隊。
? ? ? ??但是各個機譯同質(zhì)化嚴重,變現(xiàn)能力差。因為門檻較低,一些需要機器翻譯的大客戶,往往更傾向于建立自己的機譯團隊而不是購買現(xiàn)有的機譯服務(wù)。同花順公司就是個典型的例子。同花順有機器翻譯需求,但并沒有購買現(xiàn)有服務(wù),而是通過挖人的手段建立了自己的機器翻譯團隊。
由此我認為未來能夠生存下來的機器翻譯團隊有以下幾種:
1)?所屬公司的產(chǎn)品對機譯需求較大,例如微信機器翻譯團隊。
2)?專注于某個或幾個垂直領(lǐng)域,產(chǎn)品質(zhì)量過硬,且被行業(yè)大客戶所接受的翻譯團隊。如專注于醫(yī)療的Atman公司,專注于主要垂直領(lǐng)域的深圳云譯。
3)?實現(xiàn)了技術(shù)突破,產(chǎn)品質(zhì)量明顯高于同行的機器翻譯團隊。
您認為未來機器翻譯技術(shù)有哪些更加廣闊的應(yīng)用場景和前景?
? ? ? ??即使是現(xiàn)在,機器翻譯的目標(biāo)應(yīng)用對象也不是人工翻譯行業(yè)。對于機器翻譯來講,傳統(tǒng)人工翻譯行業(yè)規(guī)模還是太小了。機器翻譯的目標(biāo)應(yīng)用是那些人工翻譯做不到的翻譯場景:機器翻譯與人工翻譯相比,不光是價格更便宜,現(xiàn)代基于互聯(lián)網(wǎng)的應(yīng)用需要大量即時性翻譯,這是人工翻譯無論如何也做不到的。機器翻譯現(xiàn)已廣泛應(yīng)用于人工智能產(chǎn)品、多語種文字或語音同傳、國際貿(mào)易平臺、需要即時翻譯的手機應(yīng)用等場景。據(jù)小牛翻譯的朱靖波所講,僅阿里巴巴的跨境平臺,每天接受用戶請求的自動翻譯量就超過1000億字符,據(jù)朱靖波老師估算,就是全國所有譯者都為阿里巴巴服務(wù),也無法滿足阿里巴巴一家的需求??梢娮詣臃g需求量是遠遠大于人工翻譯需求的。
? ? ? ??未來對大量、實時和低價的翻譯需求只會越來越多,這些需求本來就不是人工翻譯所能做到的。如果說機器翻譯擠壓了人工翻譯需求,也純屬誤傷。
您認為職業(yè)譯者如何借助技術(shù)提升翻譯生產(chǎn)率?
? ? ? ??如上所述,我覺得機譯目前有兩種用法,一種時交互式的,譯者翻譯過程中實時獲取機譯結(jié)果,用來參考、獲得靈感、減少打字工作。另一種則是現(xiàn)在較流行的MTPE譯后編輯。顯然MTPE更加高效。據(jù)譯者婁東來所講,使用MTPE,他一天可翻譯2到3萬字。這在以前是不可想象的。
? ? ? ??做好MTPE,也是需要練習(xí)的,其中有很多需要學(xué)習(xí)體會的東西。不過我在MTPE流行之前就不再做譯者了,對MTPE并沒有太多的心得。
隨著機器翻譯與翻譯流程不斷深度融合,您認為翻譯企業(yè)未來何去何從?
? ? ? ??隨著機譯越來越好,大眾對機譯越來越接受,一些原來使用人工翻譯服務(wù)的大客戶可能會部分或全部轉(zhuǎn)向使用自動翻譯。翻譯行業(yè)應(yīng)會受到一定的擠壓。與很多人的觀點相反,我認為越專業(yè)的領(lǐng)域反而越容易被機器翻譯侵蝕,醫(yī)療行業(yè)就是個明顯的例子。慢慢地醫(yī)療行業(yè)會發(fā)現(xiàn),由于專業(yè)性強,找到專業(yè)的高水平人工譯者并不容易,而經(jīng)過專門訓(xùn)練的機器翻譯則準(zhǔn)確率更高。同樣道理,處于翻譯行業(yè)塔尖的同聲傳譯,很快也會感受到來自機器翻譯的壓力。
? ? ? ??較不容易被機器翻譯侵蝕的有創(chuàng)意性翻譯、文學(xué)翻譯、對質(zhì)量要求較高、時間要求較寬裕的書籍翻譯、本地化改寫、游戲翻譯等。小型翻譯企業(yè)應(yīng)看清形式,早做打算,及時轉(zhuǎn)型。
? ? ? ??對于擁有高質(zhì)量大客戶的大型翻譯企業(yè),我認為與機譯公司深度合作或并購是一個重要方向。積極擁抱科技,探索機譯的使用方式,降低成本,提高效率,加快回稿時間,提供新型服務(wù),從而獲得更高的利潤。
面對機器翻譯沖擊,您認為學(xué)生譯者應(yīng)從哪些方面提高自身的競爭力?
? ? ? ??實際上無論是否有機器翻譯的沖擊,無論做哪個行業(yè),提高競爭力的最重要的方法是都是自主學(xué)習(xí)的能力和習(xí)慣。查理·芒格說,自我完善是你的道德責(zé)任,如能做到每天睡覺時都要比醒來時更智慧,日積越累,你最終能獲得超常的競爭力。
? ? ? ??作為一個90年代的老英專生,就我自己的經(jīng)歷來看,我深以為然。這些話聽起來雖然有點務(wù)虛,有點雞湯,但確實非常重要。
? ? ? ??具體來講,學(xué)生譯者首先要把英語學(xué)好?;仡^看自己的受教育經(jīng)歷,我一生受益最大的學(xué)科是英語。我37歲才開始寫代碼,100%全靠自學(xué),而英語就是我自學(xué)的最重要的工具。
? ? ? ??作為學(xué)生,不要因為日后翻譯行業(yè)可能會被自動翻譯所替代而整日憂心忡忡。我們每個人對自己未來的想象都不會有多準(zhǔn)確,況且相當(dāng)部分的翻譯專業(yè)的學(xué)生日后并不會去做翻譯。未來總是一件事導(dǎo)致另一件事的連鎖反應(yīng),是逐漸打開的。對于尚未發(fā)生的事情擔(dān)心發(fā)愁不光毫無用處,還會消磨你的精神。作為學(xué)生,時刻專注于個人成長,養(yǎng)成終身學(xué)習(xí)進步的習(xí)慣,才是重要的。
訪談人介紹
曹首光,自由譯員,廣受歡迎的機譯應(yīng)用GT4T開發(fā)者,ProZ.com 第四屆翻譯大賽英漢對冠軍獲得者。自2009年起開始從事機器翻譯輔助機譯應(yīng)用的開發(fā),2020年創(chuàng)建??诩诟5诳萍加邢薰?,繼續(xù)專注于走完機器翻譯的最后一公里,使機器翻譯更加易用。

編輯:黃丹彤
排版:黃丹彤
審校:李斯然

本文來源于微信公眾號“翻譯技術(shù)教育與研究”、微信公眾號“語言服務(wù)行業(yè)”,致力于語言服務(wù)行業(yè)資訊、洞察、洞見~ 關(guān)注我們,了解更多精彩內(nèi)容~
專訪 | 曹首光:如何打造一款受歡迎的機器翻譯產(chǎn)品?的評論 (共 條)
