三分鐘科普|翻譯多維質(zhì)量標準(MQM)如何給譯文打分?
翻譯多維質(zhì)量標準 Multidimensional Quality Metrics (MQM) 是一種翻譯質(zhì)量評估框架,可以對人工翻譯和機器翻譯進行翻譯質(zhì)量評測。作為歐盟資助的QTLaunchPad和QT21項目的一部分,最初由德國人工智能研究中心(DFKI)發(fā)布。本文將從MQM背景、錯誤維度、錯誤類型和記分卡設置四個方面對MQM進行簡單介紹。
1 MQM背景
MQM基于LISA QA Model、SAE J2450和ATA標準化錯誤標記框架,參考其錯誤類型,但采用了更加模塊化的方法。起初,TAUS和DFKI與LTAC Global合作,創(chuàng)建了DQF:MQM。DQF:MQM是一個基于初版MQM和TAUS動態(tài)質(zhì)量框架的錯誤類型集合。隨后,DQF錯誤類型成為 MQM 的一個子集,逐漸被MQM核心架構(MQM-Core)取代。
2 MQM錯誤維度
MQM將翻譯錯誤主要劃分為7個維度,分別為:
- 術語(Terminology)
- 準確性(Accuracy)
- 語言慣例(Linguistic conventions)
- 風格(Style)
- 區(qū)域慣例(Locale conventions)
- 受眾適應性(Audience appropriateness)
- 格式與標記(Design and markup)
3 MQM錯誤類型
MQM在七個錯誤維度的基礎上,又將其細分為了不同的錯誤類型:
(一)術語
- 與術語庫不一致(Inconsistent with terminology resource)
- 術語上下文不一致(Inconsistent use of terminology)
- 術語錯誤(Wrong term)
(二)準確性
- 誤譯(Mistranslation)
- 過譯(Over-translation)
- 欠譯(Under-translation)
- 增譯(Addition)
- 漏譯(Omission)
- 不應譯(Do not translate)
- 未譯(Untranslated)
(三)語言慣例
- 語法(Grammar)
- 標點(Punctuation)
- 拼寫(Spelling)
- 不可理解度(Unintelligible)
- 字符編碼(Character encoding)
(四)風格
- 組織風格(Organizational style)
- 第三方風格(Third-party style)
- 與外部參考不一致(In consistent with external reference)
- 語域(Register)
- 不自然(Awkward style)
- 不符合語言習慣(Unidiomatic style)
- 風格不一致(Inconsistent style)
(五)區(qū)域慣例
- 數(shù)字格式(Number format)
- 貨幣格式(Currency format)
- 測量格式(Measurement format)
- 時間格式(Time format)
- 日期格式(Date format)
- 地址格式(Address format)
- 電話格式(Telephone format)
- 快捷鍵格式(Shortcut key)
- 特定文化參考(Specific culture reference)
(七)格式與標記
- 字符格式(Character formatting)
- 排版(Layout)
- 標記標簽(Markup tag)
- 刪節(jié)或超出邊框(Truncation/text expansion)
- 缺少文本(Missing text)
- 鏈接不正確或無效(Link/cross-reference)
可見,MQM從文本和格式兩個維度都對翻譯錯誤進行了分類,且錯誤類型劃分較為全面、詳細,有助于對人工翻譯或機器翻譯進行細粒度的質(zhì)量評估。
4 MQM記分卡
MQM采用記分卡的形式對質(zhì)量評估結果進行量化,評估人員根據(jù)這些錯誤類型、嚴重性等將識別的翻譯錯誤分配數(shù)值,使評估結果更加直觀。
在MQM記分卡中,可以設置無錯誤(None)、輕微錯誤(Minor)、主要錯誤(Major)、嚴重錯誤(Critical)四個檔位的嚴重程度,分別可代表0分、1分、5分、10分的罰分分值(但該分值在具體評估過程中可適當調(diào)整),并可以對不同的錯誤類型分配權重(Weights)。評估流程根據(jù)評估人員統(tǒng)計出的錯誤數(shù)量,乘以罰分分值,自動得出總罰分,再根據(jù)所評估的總字數(shù),計算出字錯率,最后計算出譯文得分,根據(jù)所劃定閾值(Threshold)確定譯文是否通過質(zhì)檢。
公式為:錯誤率=錯誤數(shù)量*罰分值*權重值/總字數(shù)正確率=(1-錯誤率)*100

在這種方法中,MQM將錯誤數(shù)量、錯誤分值、評估字數(shù)、閾值等數(shù)值綜合考量,盡可能地保證了結果的科學、客觀。
由上可見,MQM質(zhì)量評估方法具備一定科學性、客觀性,從多維度對翻譯質(zhì)量進行考察,并量化評測結果,是對過于主觀的傳統(tǒng)質(zhì)量評測方法的改進;MQM質(zhì)量評估方法也具備一定創(chuàng)新性,在結合了多種評估模型后,不斷完善其錯誤類型和維度,將受眾適應性、語言風格、格式等均納入評測內(nèi)容,進一步形成了更為全面的評測體系;此外,MQM質(zhì)量評估方法也具備一定可操作性,在實際操作中,評估人員可以根據(jù)其設定的步驟(維度-方法-錯誤類型-評分-權重-公式-閾值-實行),再結合實際需求,調(diào)整具體的參數(shù),融入到具體的評測場景中,對翻譯質(zhì)量評估具有一定指導意義。
參考文獻
[1] Lommel, Arle et al. Multidimensional Quality Metrics (MQM): A Framework for Declaring and Describing Translation Quality Metrics[J]. German: German Research Center for Artificial Intelligence (DFKI), 2014: 455-463.
[2] Lommel, Arle et al. Using a New Analytic Measure for the Annotation and Analysis of MT Errors on Real Data[C]. Proceedings of the 17th Annual Conference of the European Association for Machine Translation, 2014: 165-172.
[3] “MQM Core Typology”. http://themqm.info/typology/.[4] “MQM (Multidimensional Quality Metrics)”. https://themqm.org/.
特別說明:本文僅用于學術交流,如有侵權請后臺聯(lián)系小編刪除。