ChatGPT輔助長文本翻譯:immersive_translate
2023-08-11 19:14 作者:翻譯技術(shù)點津 | 我要投稿
基于ChatGPT的機(jī)輔翻譯
(三)ChatGPT輔助長文本翻譯:immersive_translate
各位小伙伴大家好呀!如今,隨著ChatGPT的普及和多場景靈活應(yīng)用,我們的工作學(xué)習(xí)獲得了更多的便利和效率。在語言領(lǐng)域,我們可以利用它進(jìn)行知識問答、文本翻譯、譯后編輯、輔助原文理解以及數(shù)據(jù)分析等。平時在翻譯方面,不管是文學(xué)還是非文學(xué)體裁文本,我們似乎也開始習(xí)慣經(jīng)常向ChatGPT投喂Prompt來處理譯文。
使用ChatGPT之后,我們可能都會發(fā)現(xiàn),一般情況下,ChatGPT這樣的大語言模型(LLM)翻譯優(yōu)勢明顯。正如今年2月由微軟團(tuán)隊發(fā)表的一篇論文How Good Are GPT Models at Machine Translation? ——A Comprehensive Evaluation指出的那樣: “GPT systems can produce highly fluent and competitive translation outputs even in the zero-shot setting especially for the high-resource language translations”,即——在零樣本設(shè)定下GPT系統(tǒng)也可為高資源語言生成高度流利且具優(yōu)勢的譯文。這里的高資源語言就包括漢語和英語等語言。
不過,由于ChatGPT字符數(shù)量的限制,平時我們使用ChatGPT進(jìn)行翻譯或分析時所輸入的文本字?jǐn)?shù)也比較有限。據(jù)OpenAI官網(wǎng)(https://platform.openai.com/docs/models/gpt-4)顯示,在GPT 3.5模型系列里,我們常用的GPT-3.5-turbo模型最大字符數(shù)為4096;在GPT-4模型系列里,付費版的GPT-4最大字符數(shù)為GPT-3.5-turbo的兩倍——8192字符。因此,在處理長文本時,或許很多伙伴會自行將文本分為好多部分,然后將每部分分別放在聊天框內(nèi)等待ChatGPT輸出結(jié)果。這樣一來,過程顯得繁瑣和費時。

那么,有沒有辦法一次性讓ChatGPT單次處理大量字符甚至為小說篇幅的文本呢?
答案是肯定的。
根據(jù)“ChatGPT在口筆譯中的應(yīng)用與實戰(zhàn)公益沙龍”中“基于ChatGPT的機(jī)輔翻譯”分享內(nèi)容,小編已經(jīng)推出了兩個系列推文:
ChatGPT|(二)ChatGPT輔助CAT翻譯
目前小編正在更新第三個系列ChatGPT輔助長文本翻譯,并分三次推文介紹三個有關(guān)ChatGPT的長文本翻譯工具——immersive_translate和bilingual_book-maker等兩個GitHub項目和Superpower ChatGPT擴(kuò)展插件。
今天的主題是(三)ChatGPT輔助長文本翻譯:immersive_translate
使用ChatGPT之后,我們可能都會發(fā)現(xiàn),一般情況下,ChatGPT這樣的大語言模型(LLM)翻譯優(yōu)勢明顯。正如今年2月由微軟團(tuán)隊發(fā)表的一篇論文How Good Are GPT Models at Machine Translation? ——A Comprehensive Evaluation指出的那樣: “GPT systems can produce highly fluent and competitive translation outputs even in the zero-shot setting especially for the high-resource language translations”,即——在零樣本設(shè)定下GPT系統(tǒng)也可為高資源語言生成高度流利且具優(yōu)勢的譯文。這里的高資源語言就包括漢語和英語等語言。
不過,由于ChatGPT字符數(shù)量的限制,平時我們使用ChatGPT進(jìn)行翻譯或分析時所輸入的文本字?jǐn)?shù)也比較有限。據(jù)OpenAI官網(wǎng)(https://platform.openai.com/docs/models/gpt-4)顯示,在GPT 3.5模型系列里,我們常用的GPT-3.5-turbo模型最大字符數(shù)為4096;在GPT-4模型系列里,付費版的GPT-4最大字符數(shù)為GPT-3.5-turbo的兩倍——8192字符。因此,在處理長文本時,或許很多伙伴會自行將文本分為好多部分,然后將每部分分別放在聊天框內(nèi)等待ChatGPT輸出結(jié)果。這樣一來,過程顯得繁瑣和費時。


那么,有沒有辦法一次性讓ChatGPT單次處理大量字符甚至為小說篇幅的文本呢?
答案是肯定的。
根據(jù)“ChatGPT在口筆譯中的應(yīng)用與實戰(zhàn)公益沙龍”中“基于ChatGPT的機(jī)輔翻譯”分享內(nèi)容,小編已經(jīng)推出了兩個系列推文:
ChatGPT|(二)ChatGPT輔助CAT翻譯
目前小編正在更新第三個系列ChatGPT輔助長文本翻譯,并分三次推文介紹三個有關(guān)ChatGPT的長文本翻譯工具——immersive_translate和bilingual_book-maker等兩個GitHub項目和Superpower ChatGPT擴(kuò)展插件。
今天的主題是(三)ChatGPT輔助長文本翻譯:immersive_translate
1. immersive_translate
本次介紹的是第一個基于ChatGPT的長文本翻譯工具——immersive_translate。該工具源于GitHub項目,為AI 驅(qū)動的雙語網(wǎng)頁翻譯擴(kuò)展插件,我們可直接使用其搭載的不同翻譯引擎進(jìn)行翻譯,也可調(diào)用ChatGPT和Deepl等工具的API KEY進(jìn)行翻譯。
主要特點如下:
Immersive_translate主要使用場景為網(wǎng)頁翻譯,如瀏覽外文網(wǎng)站時可實時生成雙語對照翻譯。也可用于制作雙語 ePub 電子書、翻譯本地 PDF 文件、翻譯HTML/txt 文件、翻譯本地字幕文件等。
需要翻譯網(wǎng)頁時,只需打開插件界面,選擇源語和目的語,以及翻譯引擎(如OpenAI),之后點擊“翻譯”按鈕便可進(jìn)行翻譯:
以下是利用immersive_translate插件的OpenAI引擎翻譯《經(jīng)濟(jì)學(xué)人》網(wǎng)頁一篇新聞效果:
如需翻譯txt/epub/pdf等文件,可點擊插件-更多選項,選擇相應(yīng)功能,如翻譯txt文本,可選擇“翻譯HTML/txt文件”:
并在跳出的顯示界面拖選進(jìn)待翻譯txt文本:
文本拖選后便會自動以網(wǎng)頁形式打開文本內(nèi)容:
之后以同樣方式點擊插件界面“翻譯功能”進(jìn)行翻譯:

若要保存譯文,可右鍵點擊“另存為”,以html格式保存。保存在桌面后,可修改“html”后綴名為“docx”,之后打開文件,便為可編輯的word格式雙語對照文件:

具體使用請看視頻操作教程:{點擊鏈接下拉文章至此處}
主要特點如下:

Immersive_translate主要使用場景為網(wǎng)頁翻譯,如瀏覽外文網(wǎng)站時可實時生成雙語對照翻譯。也可用于制作雙語 ePub 電子書、翻譯本地 PDF 文件、翻譯HTML/txt 文件、翻譯本地字幕文件等。
需要翻譯網(wǎng)頁時,只需打開插件界面,選擇源語和目的語,以及翻譯引擎(如OpenAI),之后點擊“翻譯”按鈕便可進(jìn)行翻譯:

以下是利用immersive_translate插件的OpenAI引擎翻譯《經(jīng)濟(jì)學(xué)人》網(wǎng)頁一篇新聞效果:

如需翻譯txt/epub/pdf等文件,可點擊插件-更多選項,選擇相應(yīng)功能,如翻譯txt文本,可選擇“翻譯HTML/txt文件”:

并在跳出的顯示界面拖選進(jìn)待翻譯txt文本:

文本拖選后便會自動以網(wǎng)頁形式打開文本內(nèi)容:

之后以同樣方式點擊插件界面“翻譯功能”進(jìn)行翻譯:


若要保存譯文,可右鍵點擊“另存為”,以html格式保存。保存在桌面后,可修改“html”后綴名為“docx”,之后打開文件,便為可編輯的word格式雙語對照文件:


具體使用請看視頻操作教程:{點擊鏈接下拉文章至此處}
https://mp.weixin.qq.com/s/-qOMn8obOAsjg6a7wBvMyA
本次分享內(nèi)容為基于ChatGPT的長文本翻譯擴(kuò)展插件immersive_translate,大家可觀看操作教程學(xué)習(xí)和進(jìn)一步探索immersive_translate的使用方法。
immersive_translate雖然是款網(wǎng)頁擴(kuò)展插件,但其是專門為翻譯不同形式文本而量身打造。不僅功能豐富,操作容易上手,也能為翻譯和處理大批量文本提供便利途徑。
下一期主題為:(三)ChatGPT輔助長文本翻譯:bilingual_book_maker小編將介紹如何使用bilingual_book_maker工具和python手段來翻譯長文本(甚至小說篇幅的文本也能夠進(jìn)行翻譯),與immersive_translate相比,該方式可以自動在目標(biāo)文件夾中生成雙語文件。敬請伙伴們期待!
推文編輯:李帥
immersive_translate雖然是款網(wǎng)頁擴(kuò)展插件,但其是專門為翻譯不同形式文本而量身打造。不僅功能豐富,操作容易上手,也能為翻譯和處理大批量文本提供便利途徑。
下一期主題為:(三)ChatGPT輔助長文本翻譯:bilingual_book_maker小編將介紹如何使用bilingual_book_maker工具和python手段來翻譯長文本(甚至小說篇幅的文本也能夠進(jìn)行翻譯),與immersive_translate相比,該方式可以自動在目標(biāo)文件夾中生成雙語文件。敬請伙伴們期待!
特別說明:本文僅供學(xué)習(xí)交流,如有不妥歡迎后臺聯(lián)系小編。- END -
翻譯技術(shù)教育與研究ChatGPT專題組致力于探索發(fā)掘ChatGPT為代表的AI工具在語言服務(wù)不同階段的應(yīng)用,進(jìn)而提高從業(yè)者的工作效率。專題小組目前的主要方向是探索提示詞(prompt)及流程變更如何提升交互效果;了解及推介Github等平臺上的AI應(yīng)用,AI應(yīng)用嵌入語言服務(wù)流程及其優(yōu)化方式。小組通過定期會議及討論確定選題方向并通過文章、視頻等形式分享探索結(jié)果,歡迎通過文章留言為大家提供建議意見!
原文作者:段明貴推文編輯:李帥