最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

3分鐘科普|機(jī)器翻譯到底是個(gè)啥?

2022-05-02 21:50 作者:翻譯技術(shù)點(diǎn)津  | 我要投稿

? ? ? ? 近年來隨著機(jī)器翻譯技術(shù)的快速發(fā)展,出現(xiàn)了越來越多關(guān)于機(jī)器翻譯技術(shù)及應(yīng)用的討論,這篇文章將對機(jī)器翻譯原理及應(yīng)用進(jìn)行科普、對機(jī)器翻譯與人類翻譯關(guān)系進(jìn)行闡述,為大家解答疑惑!

Q1?機(jī)器翻譯學(xué)習(xí)語言跟人一樣嗎?

? ? ? ??和我們小時(shí)候?qū)W習(xí)英語不同,機(jī)器并不會(huì)學(xué)習(xí)明確的語言規(guī)則,例如什么是現(xiàn)在進(jìn)行時(shí),什么是狀語從句。相反,它更像你小時(shí)候看圖識字,學(xué)的是個(gè)對應(yīng)關(guān)系,還要學(xué)一些推導(dǎo)思維,比如相似的字,聲旁相同音相近,多看多記,它自然就學(xué)會(huì)了。例如,機(jī)器總是看到“Good luck ”被翻譯為“祝你好運(yùn)”,慢慢地,它就學(xué)會(huì)了把“Good luck ”翻譯成“祝你好運(yùn) ”。正所謂:“操千曲而后曉聲,觀千劍而后識器”。當(dāng)然,我們這里說的“多”,可不止“千曲”“千劍”這么簡單,一般需要千萬級甚至上億級的句子,數(shù)據(jù)是機(jī)器翻譯“智能”的關(guān)鍵。

Q2?機(jī)器翻譯就是指計(jì)算機(jī)自動(dòng)翻譯嗎?

? ? ? ??自行車就是自己會(huì)走路的車嗎?從實(shí)現(xiàn)形式上來看,“全自動(dòng)機(jī)器翻譯”確實(shí)是計(jì)算機(jī)在沒有人工干預(yù)的情況下自動(dòng)將源語言輸入轉(zhuǎn)換成為目標(biāo)語言輸出,但實(shí)際上這種“全自動(dòng)”的機(jī)器翻譯系統(tǒng)還是依賴于開發(fā)者在語言建模、算法優(yōu)化和語料訓(xùn)練等方面的工作的。

Q3?計(jì)算機(jī)輔助翻譯和機(jī)器翻譯到底區(qū)別在哪里?

? ? ? ??計(jì)算機(jī)輔助翻譯(computer-aided translation, CAT)≠機(jī)器翻譯(machine translation, MT),兩者是有本質(zhì)區(qū)別的。首先,計(jì)算機(jī)輔助誰做翻譯呢?答案是計(jì)算機(jī)輔助人工譯員來做翻譯。也就是說,設(shè)計(jì)一套計(jì)算機(jī)軟件系統(tǒng),在這個(gè)軟件里盡可能集成人工譯員在翻譯過程中所需要的各種資源(比如,術(shù)語詞典、翻譯記憶庫等)和輔助工具(比如,雙語句對齊工具、譯文質(zhì)量檢查工具等),人工譯員在這套軟件的輔助下進(jìn)行翻譯,翻譯這個(gè)活兒還是人來做。而機(jī)器翻譯則完全不同。機(jī)器翻譯追求的就是不用人參與、而是盡可能由機(jī)器來完成整個(gè)翻譯過程。大家通過訪谷歌翻譯、小牛翻譯等機(jī)器翻譯平臺,看到網(wǎng)頁上有兩個(gè)文本框,左邊輸入原文后,不需要你做任何其它事情,右邊就可以立即輸出譯文,這就是機(jī)器在工作。

Q4?實(shí)驗(yàn)室里開發(fā)的機(jī)器翻譯系統(tǒng)和實(shí)用的機(jī)器翻譯系統(tǒng)有何區(qū)別?

? ? ? ??實(shí)驗(yàn)室里開發(fā)的系統(tǒng)專注模型能力、理論數(shù)據(jù)支撐方面,而實(shí)用的系統(tǒng)要考慮到翻譯的真實(shí)場景,更關(guān)注計(jì)算效率、模型大小這些問題。一般情況下,實(shí)驗(yàn)室更多的是從理論上思考當(dāng)前系統(tǒng)的不足進(jìn)行優(yōu)化,或者進(jìn)行一些探索性的研究,這些研究可能短時(shí)間內(nèi)無法應(yīng)用到實(shí)際場景,但是擁有巨大的潛力。但是工業(yè)界不是這樣,工業(yè)界要保證用戶的使用體驗(yàn)。舉個(gè)栗子,通用系統(tǒng)本身并不算是一個(gè)產(chǎn)品,必須要通過與用戶的業(yè)務(wù)和場景相結(jié)合,才能發(fā)揮它的價(jià)值。而翻譯系統(tǒng)也并不是靜態(tài)的,比如說訓(xùn)練出來的模型,要用到某個(gè)業(yè)務(wù)場景里面,業(yè)務(wù)場景里產(chǎn)生新的數(shù)據(jù),這些數(shù)據(jù)進(jìn)一步提升翻譯模型的能力,再用到場景里面,這是一個(gè)閉環(huán)和不斷迭代的過程。一個(gè)成功的產(chǎn)品,還需要算法、數(shù)據(jù)、產(chǎn)品等非常多的人的參與,大家一起才能做出一個(gè)用戶體驗(yàn)完美的機(jī)器翻譯產(chǎn)品出來。


Q5?能通俗的聊聊著名的BLEU算法嗎?

? ? ? ??沒有規(guī)則,游戲就沒得玩。那么如何評判出系統(tǒng)產(chǎn)生的譯文質(zhì)量優(yōu)劣呢?有那么一幫人揣摩出一種自動(dòng)的譯文評價(jià)方法,大致就是看機(jī)器翻譯譯文里有多少個(gè)詞能在參考譯文里找到,找到的越多那譯文質(zhì)量就越好。很明顯,這種方法很容易自動(dòng)實(shí)現(xiàn)但又很不“科學(xué)”,后續(xù)研究者們不斷優(yōu)化和改進(jìn)這條游戲規(guī)則,但基本思路基本沒有變,這就是著名的BLEU算法。那么剛才所說的譯文最優(yōu)就是BLEU得分最高的譯文。但實(shí)用的機(jī)器翻譯的譯文優(yōu)劣不能完全用BLEU來評判(當(dāng)然也不能用信達(dá)雅來評判),可以理解為實(shí)用的機(jī)器翻譯系統(tǒng)都是服務(wù)于特定用戶的,那么用綜合人工評價(jià)和自動(dòng)評價(jià)方法是較為客觀和科學(xué)的。

Q6?目前機(jī)器翻譯已經(jīng)達(dá)到了什么程度?

? ? ? ??對于比較大的語種,比如中英互譯,目前成熟的商業(yè)機(jī)器翻譯系統(tǒng)在通用領(lǐng)域已經(jīng)不會(huì)輸給普通的譯員了。雖然機(jī)器翻譯技術(shù)現(xiàn)在已經(jīng)非常成熟了,但是和翻譯專家相比,翻譯質(zhì)量還是差了很多。用“信、達(dá)、雅”的標(biāo)準(zhǔn)來講,機(jī)器翻譯技術(shù)已經(jīng)達(dá)到了“信”和“達(dá)”的標(biāo)準(zhǔn)。但是在一些專業(yè)的領(lǐng)域,或者面對需要意譯的句子,比起專業(yè)譯員,機(jī)器翻譯還有很長的路要走。歡迎感興趣的同學(xué)們投身自然語言處理和機(jī)器翻譯,繼續(xù)推動(dòng)這個(gè)領(lǐng)域向前發(fā)展。加入小牛翻譯團(tuán)隊(duì),一起做偉大的事情。

Q7?都有機(jī)器翻譯了,我們還有必要學(xué)習(xí)語言嗎?

? ? ? ??舉個(gè)栗子:夏目漱石曾經(jīng)把【I love you】翻成【月が綺麗ですね】(月色真美),很顯然機(jī)器翻譯是達(dá)不到這個(gè)水平的。機(jī)器翻譯可以把海量的數(shù)據(jù)翻譯工作變得更加快捷高效,但因?yàn)闄C(jī)器最缺少的是人的感情、情緒、語言背后要表達(dá)的深層次含義,所以現(xiàn)階段還是無法代替人工。學(xué)習(xí)語言與其擔(dān)心,不如學(xué)其所愛,方能潛心求索,不負(fù)韶華。


轉(zhuǎn)載來源:小牛翻譯

轉(zhuǎn)載編輯:賀文惠,丁羽翔

審核:王琳

本文來源于微信公眾號“翻譯技術(shù)教育與研究”、微信公眾號“語言服務(wù)行業(yè)”,致力于語言服務(wù)行業(yè)資訊、洞察、洞見~ 關(guān)注我們,了解更多精彩內(nèi)容~?

3分鐘科普|機(jī)器翻譯到底是個(gè)啥?的評論 (共 條)

分享到微博請遵守國家法律
当阳市| 于都县| 尉氏县| 成安县| 镇安县| 汕头市| 扎囊县| 岚皋县| 新乐市| 抚顺市| 当涂县| 昭觉县| 桐梓县| 合阳县| 于田县| 奎屯市| 呼图壁县| 西青区| 黑河市| 阳东县| 县级市| 罗山县| 郧西县| 南平市| 田东县| 南召县| 上杭县| 象州县| 潢川县| 闽清县| 平江县| 齐齐哈尔市| 石狮市| 汶上县| 陈巴尔虎旗| 子长县| 井冈山市| 常德市| 蒲江县| 抚远县| 翼城县|