最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

三分鐘科普|翻譯多維質(zhì)量標準(MQM)如何給譯文打分?

2022-12-12 14:13 作者:翻譯技術點津  | 我要投稿


本文約1200字,預計閱讀時間5分鐘

翻譯多維質(zhì)量標準 Multidimensional Quality Metrics (MQM) 是一種翻譯質(zhì)量評估框架,可以對人工翻譯和機器翻譯進行翻譯質(zhì)量評測。作為歐盟資助的QTLaunchPad和QT21項目的一部分,最初由德國人工智能研究中心(DFKI)發(fā)布。本文將從MQM背景、錯誤維度、錯誤類型和記分卡設置四個方面對MQM進行簡單介紹。


1 MQM背景

MQM基于LISA QA Model、SAE J2450和ATA標準化錯誤標記框架,參考其錯誤類型,但采用了更加模塊化的方法。起初,TAUS和DFKI與LTAC Global合作,創(chuàng)建了DQF:MQM。DQF:MQM是一個基于初版MQM和TAUS動態(tài)質(zhì)量框架的錯誤類型集合。隨后,DQF錯誤類型成為 MQM 的一個子集,逐漸被MQM核心架構(MQM-Core)取代。


2 MQM錯誤維度

MQM將翻譯錯誤主要劃分為7個維度,分別為:

  • 術語(Terminology)
  • 準確性(Accuracy)
  • 語言慣例(Linguistic conventions)
  • 風格(Style)
  • 區(qū)域慣例(Locale conventions)
  • 受眾適應性(Audience appropriateness)
  • 格式與標記(Design and markup)
這是最新版MQM的維度劃分,對第一版進行了一些改動,例如在第一版中,“語言慣例”為“流利度”(Fluency),“受眾適應性”為“真實性”(Verity)。


3 MQM錯誤類型




MQM在七個錯誤維度的基礎上,又將其細分為了不同的錯誤類型:
(一)術語
  • 與術語庫不一致(Inconsistent with terminology resource)
  • 術語上下文不一致(Inconsistent use of terminology)
  • 術語錯誤(Wrong term)

(二)準確性
  • 誤譯(Mistranslation)
  • 過譯(Over-translation)
  • 欠譯(Under-translation)
  • 增譯(Addition)
  • 漏譯(Omission)
  • 不應譯(Do not translate)
  • 未譯(Untranslated)

(三)語言慣例
  • 語法(Grammar)
  • 標點(Punctuation)
  • 拼寫(Spelling)
  • 不可理解度(Unintelligible)
  • 字符編碼(Character encoding)

(四)風格
  • 組織風格(Organizational style)
  • 第三方風格(Third-party style)
  • 與外部參考不一致(In consistent with external reference)
  • 語域(Register)
  • 不自然(Awkward style)
  • 不符合語言習慣(Unidiomatic style)
  • 風格不一致(Inconsistent style)

(五)區(qū)域慣例
  • 數(shù)字格式(Number format)
  • 貨幣格式(Currency format)
  • 測量格式(Measurement format)
  • 時間格式(Time format)
  • 日期格式(Date format)
  • 地址格式(Address format)
  • 電話格式(Telephone format)
  • 快捷鍵格式(Shortcut key)
(六)受眾適應性
  • 特定文化參考(Specific culture reference)

(七)格式與標記
  • 字符格式(Character formatting)
  • 排版(Layout)
  • 標記標簽(Markup tag)
  • 刪節(jié)或超出邊框(Truncation/text expansion)
  • 缺少文本(Missing text)
  • 鏈接不正確或無效(Link/cross-reference)

可見,MQM從文本和格式兩個維度都對翻譯錯誤進行了分類,且錯誤類型劃分較為全面、詳細,有助于對人工翻譯或機器翻譯進行細粒度的質(zhì)量評估。


4 MQM記分卡

MQM采用記分卡的形式對質(zhì)量評估結果進行量化,評估人員根據(jù)這些錯誤類型、嚴重性等將識別的翻譯錯誤分配數(shù)值,使評估結果更加直觀。



在MQM記分卡中,可以設置無錯誤(None)、輕微錯誤(Minor)、主要錯誤(Major)、嚴重錯誤(Critical)四個檔位的嚴重程度,分別可代表0分、1分、5分、10分的罰分分值(但該分值在具體評估過程中可適當調(diào)整),并可以對不同的錯誤類型分配權重(Weights)。評估流程根據(jù)評估人員統(tǒng)計出的錯誤數(shù)量,乘以罰分分值,自動得出總罰分,再根據(jù)所評估的總字數(shù),計算出字錯率,最后計算出譯文得分,根據(jù)所劃定閾值(Threshold)確定譯文是否通過質(zhì)檢。

公式為:錯誤率=錯誤數(shù)量*罰分值*權重值/總字數(shù)正確率=(1-錯誤率)*100



在這種方法中,MQM將錯誤數(shù)量、錯誤分值、評估字數(shù)、閾值等數(shù)值綜合考量,盡可能地保證了結果的科學、客觀。

由上可見,MQM質(zhì)量評估方法具備一定科學性、客觀性,從多維度對翻譯質(zhì)量進行考察,并量化評測結果,是對過于主觀的傳統(tǒng)質(zhì)量評測方法的改進;MQM質(zhì)量評估方法也具備一定創(chuàng)新性,在結合了多種評估模型后,不斷完善其錯誤類型和維度,將受眾適應性、語言風格、格式等均納入評測內(nèi)容,進一步形成了更為全面的評測體系;此外,MQM質(zhì)量評估方法也具備一定可操作性,在實際操作中,評估人員可以根據(jù)其設定的步驟(維度-方法-錯誤類型-評分-權重-公式-閾值-實行),再結合實際需求,調(diào)整具體的參數(shù),融入到具體的評測場景中,對翻譯質(zhì)量評估具有一定指導意義。

參考文獻
[1] Lommel, Arle et al. Multidimensional Quality Metrics (MQM): A Framework for Declaring and Describing Translation Quality Metrics[J]. German: German Research Center for Artificial Intelligence (DFKI), 2014: 455-463.
[2] Lommel, Arle et al. Using a New Analytic Measure for the Annotation and Analysis of MT Errors on Real Data[C]. Proceedings of the 17th Annual Conference of the European Association for Machine Translation, 2014: 165-172.
[3] “MQM Core Typology”. http://themqm.info/typology/.[4] “MQM (Multidimensional Quality Metrics)”. https://themqm.org/.
特別說明:本文僅用于學術交流,如有侵權請后臺聯(lián)系小編刪除。

三分鐘科普|翻譯多維質(zhì)量標準(MQM)如何給譯文打分?的評論 (共 條)

分享到微博請遵守國家法律
金乡县| 盐池县| 星子县| 广南县| 花莲市| 兰州市| 雷波县| 湖口县| 盐山县| 湟中县| 英山县| 西丰县| 定日县| 阳山县| 兴安盟| 长宁区| 华亭县| 辉县市| 平山县| 神农架林区| 江津市| 宁明县| 县级市| 鹤庆县| 休宁县| 赤壁市| 深水埗区| 万载县| 白银市| 响水县| 康定县| 噶尔县| 乌拉特后旗| 海伦市| 中江县| 屏东市| 景泰县| 龙川县| 稻城县| 新晃| 昌黎县|