機(jī)器翻譯正式語(yǔ)體和非正式語(yǔ)體
試想一下,您正在向朋友描述一部有趣的電影。接下來(lái),再試想一下您正在向一家大型公司的總裁講述同一部電影。在這兩個(gè)場(chǎng)景下,您是否會(huì)使用相同的語(yǔ)言表達(dá)?當(dāng)然不會(huì)。人類擅長(zhǎng)根據(jù)情境場(chǎng)合來(lái)選用符合時(shí)宜的語(yǔ)體。而機(jī)器翻譯 (MT) 引擎通常無(wú)法靈活應(yīng)對(duì)這種情況,除非使用其他輔助。
如果想要與您的目標(biāo)受眾建立牢固關(guān)系,則必須意識(shí)到 MT 的這一局限性,并采取相應(yīng)措施來(lái)克服它。
什么是語(yǔ)言正式性?
語(yǔ)域或語(yǔ)言風(fēng)格是指我們根據(jù)社會(huì)文化背景、習(xí)俗和溝通渠道使用語(yǔ)言的方式。換句話說(shuō),它可以展現(xiàn)我們表達(dá)自己想法時(shí)的語(yǔ)言正式程度。正如前文所述,在面對(duì)朋友與面對(duì)公司總裁時(shí),我們的表達(dá)方式必定有所不同。
語(yǔ)言正式性(正式語(yǔ)體與非正式語(yǔ)體)可用于奠定特定語(yǔ)篇的基調(diào)。不同的寫作風(fēng)格、習(xí)語(yǔ)、代詞變體和動(dòng)詞形態(tài)可能體現(xiàn)著不同的語(yǔ)言正式程度,具體因所用語(yǔ)言、所在國(guó)家/地區(qū)、面對(duì)的社會(huì)團(tuán)體或?qū)I(yè)環(huán)境而異。
如何確定書面內(nèi)容需要何種語(yǔ)言正式程度?
在撰寫內(nèi)容時(shí),請(qǐng)先考慮清楚以下問(wèn)題,從而幫助自己采用適宜的語(yǔ)體。
- 我與受眾溝通的意圖是什么?
- 我希望他們?cè)谑褂梦业漠a(chǎn)品時(shí)有何感受?
- 他們是否有具體畫像?
在將內(nèi)容翻譯成不同語(yǔ)言時(shí),客戶通常會(huì)為此創(chuàng)建語(yǔ)言風(fēng)格說(shuō)明,其中包括目標(biāo)受眾畫像、項(xiàng)目的背景以及要求的語(yǔ)氣和語(yǔ)言正式程度。
為什么機(jī)器翻譯引擎難以使用合適的用語(yǔ)正式程度?
MT 引擎產(chǎn)出的譯文很難確保前后一致的正式性。尤其是當(dāng)目標(biāo)語(yǔ)言的正式性區(qū)分細(xì)于源語(yǔ)言時(shí),想要通過(guò) MT 獲得正確譯文,則更是難上加難。?這是因?yàn)?MT 模型在處理每個(gè)輸入句段時(shí),通常只能返回一種譯文。當(dāng)輸入句段本身表意模糊時(shí),模型必須在眾多有效的譯文版本中選出一種,而不會(huì)顧及目標(biāo)受眾的感受。讓模型在不同的有效譯文版本中進(jìn)行選擇,就有可能導(dǎo)致譯文不一致或譯文正式程度不正確的情況。
為什么正式語(yǔ)體和非正式語(yǔ)體在翻譯中至關(guān)重要?
翻譯內(nèi)容必須要采用合適的語(yǔ)言正式程度。 因?yàn)樵谀承┪幕尘跋?,人們可能?huì)將用語(yǔ)正式程度不正確視為粗魯無(wú)禮。但這并不意味著在所有情景下都要使用正式語(yǔ)體。在許多情況下,使用正式語(yǔ)言可能反而是錯(cuò)的,不是因?yàn)檎秸Z(yǔ)言具有冒犯意味,只是因?yàn)椴缓蠒r(shí)宜。此類錯(cuò)誤會(huì)導(dǎo)致您與受眾之間心生嫌隙。在翻譯過(guò)程中,如果公司花費(fèi)時(shí)間與精力根據(jù)目標(biāo)語(yǔ)言采取適當(dāng)?shù)恼Z(yǔ)言風(fēng)格,則很能說(shuō)明他們重視客戶。這些努力可能會(huì)吸引更多潛在客戶。而與受眾建立有效聯(lián)系有助于您取得成功。
在翻譯過(guò)程中,尤其是在使用機(jī)器翻譯時(shí),為什么很難針對(duì)受眾采用合適的目標(biāo)語(yǔ)言正式程度?
在翻譯過(guò)程中,尤其是在使用 MT 時(shí),很難針對(duì)受眾采用合適的目標(biāo)語(yǔ)言正式程度。將英文內(nèi)容翻譯成正式性區(qū)分更細(xì)的語(yǔ)言并通過(guò)語(yǔ)法語(yǔ)域體現(xiàn)出來(lái)時(shí),問(wèn)題可能會(huì)相應(yīng)而生。?不同的語(yǔ)言可能會(huì)通過(guò)不同的語(yǔ)法和詞匯表達(dá)手段來(lái)體現(xiàn)用語(yǔ)正式程度。?有些語(yǔ)言的用語(yǔ)正式性十分明確,例如西班牙語(yǔ)明確區(qū)分了 "tú"(你)和 "usted"(您),德語(yǔ)明確區(qū)分了 "du"(你)和 "Sie"(您),法語(yǔ)明確區(qū)分了 "tu"(你)和 "vous"(您)等。而在簡(jiǎn)體或繁體中文中也存在這種差異。韓語(yǔ)至少有六種正式性區(qū)分。在日語(yǔ)和其他語(yǔ)言中,可能會(huì)通過(guò)主要?jiǎng)釉~的形態(tài)以及某些名詞、形容詞、特定用詞等形式區(qū)分用語(yǔ)正式與否。在其他情況下,如在英語(yǔ)中無(wú)法使用代詞來(lái)展現(xiàn)這些區(qū)別時(shí),我們必須依靠上下文來(lái)表達(dá)不同的正式程度。?MT 引擎無(wú)法一致地辨別前后文的語(yǔ)體風(fēng)格,因此僅依靠上下文進(jìn)行表達(dá)的方式讓大多數(shù) MT 引擎面臨新的問(wèn)題。?
應(yīng)用機(jī)器翻譯時(shí)可以如何控制語(yǔ)言正式程度??
以下幾種策略可以幫助 MT 系統(tǒng)生成正式程度不同的語(yǔ)言風(fēng)格。
基于規(guī)則的方法
基于規(guī)則的方法可以根據(jù)所需的語(yǔ)言風(fēng)格或正式性生成風(fēng)格一致的機(jī)器翻譯。?這些規(guī)則能夠可靠地使用第三方系統(tǒng)返回的恰當(dāng)翻譯替換掉確定不需要的語(yǔ)言風(fēng)格要素,同時(shí)保留源語(yǔ)言的含義。
不基于規(guī)則的方法
不基于規(guī)則的方法可用于開發(fā)自定義機(jī)器翻譯模型,以不斷產(chǎn)出一致地使用所需語(yǔ)言風(fēng)格或正式程度的譯文。此方法可使用受監(jiān)督訓(xùn)練和語(yǔ)料庫(kù)中的禮貌用語(yǔ)標(biāo)注來(lái)獲取禮貌用語(yǔ)特征,??其目標(biāo)是獲得經(jīng)過(guò)不同數(shù)據(jù)訓(xùn)練而成的單個(gè)系統(tǒng),該系統(tǒng)可以根據(jù)特定用語(yǔ)正式程度靈活地生成翻譯。?
哪些商用 MT 系統(tǒng)可提供控制正式語(yǔ)體和非正式語(yǔ)體的功能??
大多數(shù) MT 系統(tǒng)不支持語(yǔ)言正式性或陰陽(yáng)性參數(shù)。但是,部分引擎可提供此功能,并且我們預(yù)計(jì)對(duì)這些功能的需求會(huì)更勝以往。 目前,DeepL (API) 和 Amazon(控制臺(tái)和 SDK)都具備在有限語(yǔ)種翻譯過(guò)程中控制語(yǔ)言正式性的功能。?為了控制譯文正式性,此功能具有三種選項(xiàng):默認(rèn)、正式和非正式。在默認(rèn)選項(xiàng)下,引擎不會(huì)更改神經(jīng)機(jī)器翻譯 (NMT) 譯文的用語(yǔ)正式程度。正式/非正式功能允許用戶在正式或非正式語(yǔ)氣之間進(jìn)行選擇。具體來(lái)說(shuō),該功能用于設(shè)置翻譯中使用的代詞和相關(guān)詞語(yǔ)。?
Lionbridge 通過(guò)哪些解決方案產(chǎn)出用語(yǔ)正式性適宜的 MT 譯文?
Lionbridge 的 Smairt MT?,這是一款企業(yè)級(jí)機(jī)器翻譯解決方案,能夠?qū)⒄Z(yǔ)言規(guī)則應(yīng)用到目標(biāo)文本中,讓機(jī)器翻譯也能夠產(chǎn)出在語(yǔ)言風(fēng)格和語(yǔ)言正式性方面都令人滿意的譯文。 我們的專家正在維護(hù)一個(gè)新版規(guī)則數(shù)據(jù)庫(kù),這些規(guī)則會(huì)用于 MT 譯文分析以控制譯文用語(yǔ)的正式性。?只要擁有足夠的語(yǔ)料,我們即可將基于規(guī)則的策略與自定義機(jī)器翻譯模型相結(jié)合,以取得理想結(jié)果。
轉(zhuǎn)載來(lái)源:萊博智 Lionbridge