翻譯百科|《中國(guó)大百科全書》中的“平行語(yǔ)料庫(kù)”
2023-06-25 13:31 作者:翻譯技術(shù)點(diǎn)津 | 我要投稿
01
平行語(yǔ)料庫(kù)|Parallel Corpus
《中國(guó)大百科全書》(第三版·網(wǎng)絡(luò)版)發(fā)布了黃國(guó)平博士撰寫的“平行語(yǔ)料庫(kù)”詞條?,F(xiàn)轉(zhuǎn)錄如下,以資交流。收錄某一源語(yǔ)語(yǔ)言文本及其對(duì)應(yīng)的目的語(yǔ)文本的語(yǔ)料庫(kù)。
關(guān)于平行語(yǔ)料庫(kù)的定義一直存在分歧。S.約翰松認(rèn)為平行語(yǔ)料庫(kù)是收錄具有可比關(guān)系的兩種語(yǔ)言文本的語(yǔ)料庫(kù),而M.貝克則主張平行語(yǔ)料庫(kù)收錄的文本是A語(yǔ)言文本及其B語(yǔ)言譯本。較之于前者,后者更被學(xué)界接受。學(xué)界普遍認(rèn)為平行語(yǔ)料庫(kù)是指收錄某一源語(yǔ)語(yǔ)言文本及其對(duì)應(yīng)的目的語(yǔ)文本的語(yǔ)料庫(kù),不同語(yǔ)言的文本之間構(gòu)成不同層次的平行對(duì)應(yīng)關(guān)系。
根據(jù)語(yǔ)料所涉及語(yǔ)種的數(shù)量,平行語(yǔ)料庫(kù)可分為雙語(yǔ)平行語(yǔ)料庫(kù)和多語(yǔ)平行語(yǔ)料庫(kù),前者由構(gòu)成翻譯或?qū)?yīng)關(guān)系的兩種語(yǔ)言文本組成,后者則收錄一-種語(yǔ)言文本和該文本的兩種以上語(yǔ)言的譯本。按照語(yǔ)料平行對(duì)應(yīng)的方向,平行語(yǔ)料庫(kù)可分為單向平行語(yǔ)料庫(kù)(如德語(yǔ)-英語(yǔ)文學(xué)平行語(yǔ)料庫(kù)、莎士比亞戲劇平行語(yǔ)料庫(kù)和漢英會(huì)議口譯平行語(yǔ)料庫(kù))、雙向平行語(yǔ)料庫(kù)(如通用漢英對(duì)應(yīng)語(yǔ)料庫(kù))和多向平行語(yǔ)料庫(kù)(如《圣經(jīng)》多語(yǔ)語(yǔ)料庫(kù))。
平行語(yǔ)料庫(kù)區(qū)別于其他語(yǔ)料庫(kù)最典型的特征是語(yǔ)料之間的平行對(duì)齊。平行對(duì)齊指源語(yǔ)文本和目的語(yǔ)文本具體單位之間的對(duì)應(yīng)關(guān)系或翻譯關(guān)系,分為詞匯、語(yǔ)句和段落等層面的對(duì)齊,對(duì)齊的層面越小,技術(shù)處理的難度越大。語(yǔ)料之間的平行對(duì)齊處理是一項(xiàng)技術(shù)難度較高而且耗費(fèi)時(shí)間和精力的工作。語(yǔ)句層面的對(duì)齊方法主要分為基于長(zhǎng)度的方法和基于詞匯的方法,后者的準(zhǔn)確率要比前者高,但更耗時(shí)耗力,不太適合大型平行語(yǔ)料庫(kù)的建設(shè)。
平行語(yǔ)料庫(kù)最大的優(yōu)勢(shì)在于能夠自動(dòng)呈現(xiàn)兩種或兩種以上語(yǔ)言的詞匯、語(yǔ)句和語(yǔ)篇之間的對(duì)應(yīng)關(guān)系。通過考察這些層面的對(duì)應(yīng)關(guān)系,可以比較不同語(yǔ)言之間的異同,分析不同語(yǔ)言詞匯之間的對(duì)應(yīng)關(guān)系,探討翻譯轉(zhuǎn)換規(guī)律。因而,平行語(yǔ)料庫(kù)對(duì)于語(yǔ)言對(duì)比、雙語(yǔ)詞典編纂、機(jī)器翻譯和翻譯策略與規(guī)范研究都具有很高的應(yīng)用價(jià)值。
02
作者簡(jiǎn)介
03
文獻(xiàn)來源
特別說明:本文僅用于學(xué)術(shù)交流,如有侵權(quán)請(qǐng)后臺(tái)聯(lián)系小編刪除。
- END -
轉(zhuǎn)載來源:翻譯圈
轉(zhuǎn)載編輯:王晨諭
審核:陳杲 王贇 Ethan 陳柯淼