《中國大百科全書》中的“基于規(guī)則的機器翻譯”
01基于規(guī)則的機器翻譯| RBMT
《中國大百科全書》(第三版·網(wǎng)絡(luò)版)發(fā)布了黃國平博士撰寫的“基于規(guī)則的機器翻譯”詞條?,F(xiàn)轉(zhuǎn)錄如下,以資交流。
基于規(guī)則的機器翻譯(rule-based machine translation)是指利用語言學(xué)規(guī)則和詞典完成翻譯的機器翻譯技術(shù)。簡稱RBMT。
基于規(guī)則的機器翻譯最早出現(xiàn)在20世紀(jì)70年代初期,此類機器翻譯的代表有1970年喬治城大學(xué)研制的第一代自動翻譯系統(tǒng) Svstran和20世紀(jì)80年代歐共體贊助設(shè)計的多語翻譯系統(tǒng)Eurotra。典型的基于規(guī)則的機器翻譯方法包括轉(zhuǎn)化法(transfer based)、中間語法(interlingual)以及辭典法(dictionary-based)機器翻譯。語言學(xué)規(guī)則模塊主要包括源語言詞法分析器、源語言句法分析器、源語言語義分析器、轉(zhuǎn)換器、目標(biāo)語言詞法生成器等目標(biāo)語言句法分析器。詞典可以分為源語言單語詞典、目標(biāo)語言單語詞典和雙語詞典。
基于規(guī)則的機器翻譯具有可解釋性、形態(tài)準(zhǔn)確性的優(yōu)勢,因此在特定領(lǐng)域表現(xiàn)不錯,但明顯的不足是需要大量的專業(yè)人力。同時,針對不同語種的表示方式差異性較大,很難用統(tǒng)一的規(guī)則進行轉(zhuǎn)換,跨領(lǐng)域效果不好且難以遷移。因此,基于規(guī)則的機器翻譯已被摒棄,但其思想值得借鑒,例如基于中間語言的機器翻譯。同時,在形態(tài)層面、句法層面甚至語義層面的表征方面成果還被繼續(xù)使用。
02作者簡介
黃國平,博士,騰訊翻譯負(fù)責(zé)人,騰訊AI Lab專家研究員,畢業(yè)于中國科學(xué)院自動化研究所,研究方向為機器翻譯、自然語言處理。長年專注于交互翻譯的研究與應(yīng)用,在ACL、AAAI、IJCAI、EMNLP等人工智能領(lǐng)域頂級會議與TASLP等頂級期刊發(fā)表論文20余篇。
03文獻來源
原文發(fā)表于《中國大百科全書》第三版網(wǎng)絡(luò)版,歡迎各位學(xué)者閱讀、分享。
翻譯圈公眾號旨在為讀者提供名師和專家對口筆譯的真知灼見,CATTI考試和MTI入學(xué)考試信息,翻譯等語言服務(wù)就業(yè)資訊,以及口筆譯學(xué)習(xí)資源和知識,希望在翻譯之路上,為大家助上一臂之力。歡迎大家積極留言,為我們提供建設(shè)性意見,我們共同進步!
轉(zhuǎn)載來源:《中國大百科全書》第三版網(wǎng)絡(luò)版