淺談GPT翻譯字幕的感受

在Bilibili, 甚至說整個互聯(lián)網(wǎng),“為愛發(fā)電”都是內(nèi)容產(chǎn)出的重要動力。昨天試用GPT翻譯一段40分鐘英文影片的字幕讓我感受到AI給UP帶來了前所未有的便捷。
背景:一個40分鐘的英文動畫視頻,人物對話居多,語言比較接地氣,已有英文字幕。然而,強如谷歌翻譯的質(zhì)量都十分堪憂,比如視頻開頭:
Peppy! James! It's been a long time. “Peppy, James, ”
谷歌翻譯結(jié)果為:活潑! 詹姆士! 已經(jīng)很久了。 “精力充沛,詹姆斯,”
短短一句打招呼就有兩個錯誤。
Peppy此處為人名,而非“活潑”,
兩處James的翻譯不一致。
于是,我轉(zhuǎn)向了ChatGPT (GPT3.5版)。首先,我向ChatGPT指定了翻譯任務(wù)。

接著,我向ChatGPT發(fā)送了5句英文臺詞。

GPT的回復(fù)如下。

是不是比谷歌翻譯好多了呢?注意,這里GPT已經(jīng)展現(xiàn)出了上下文推理的能力:Venom被翻譯為“維納斯星”。GPT如何知道Venom是一個星球?想必是因為第一句臺詞提到影片題材是“宇宙”。
然而,GPT在人物名稱的翻譯上仍然不盡人意。如果GPT知道這個影片是任天堂游戲“星際火狐”系列的二創(chuàng)作品,以及其中角色官方(或民間常用)翻譯,效果會不會更好呢?
為此,我們可以為GPT提供一些背景知識。其實,我們甚至不用手動提供。我們只需讓GPT自己“回憶”起星際火狐的相關(guān)知識即可。



讓我們再試一次,輸入前5句臺詞。GPT給出的翻譯如下。

翻譯質(zhì)量已經(jīng)基本讓人滿意。接下來,我們可以一次輸入更多臺詞(~20句)。但注意我們不能一次輸入太多,因為GPT的輸入/輸出單詞數(shù)是有限的;而且即便沒有達(dá)到輸入/輸出限制,翻譯質(zhì)量也會下滑。
GPT也并不完美。有的時候它會忘記自己的翻譯任務(wù),轉(zhuǎn)而不翻譯劇本直接輸出英文。這個時候,我們需要提醒GPT “不要忘記真正的任務(wù)”。

一個小貼士:在GPT-4(比當(dāng)前的ChatGPT更新的版本),我們可以設(shè)置“全局任務(wù)”。GPT-4會時刻牢記全局任務(wù)。
另外,當(dāng)對話已經(jīng)非常長的時候,GPT會忘記“專有名詞”的翻譯。這個時候,我們可以像一開始那樣提醒它。

有時候,GPT會從頭開始翻譯。我們可以提醒GPT:只需要翻譯我最后發(fā)送的段落。
……
總體上,GPT的翻譯偶爾會出現(xiàn)“小問題”,但都可以通過和GPT對話來指正這些錯誤。然而,這些“小問題”有一個比較大的影響——就是我不能把整個流程完全“自動化”。我需要時刻注意,GPT是否犯了奇怪的錯誤。我用一問一答的模式翻譯40分鐘,500句的短篇花費了大約90分鐘;但如果自動化,可能10分鐘就搞定了。本文僅作拋磚引玉,讓我們拭目以待GPT,基于GPT翻譯軟件,以及創(chuàng)作社區(qū)會如何發(fā)展并解決這些問題吧。

感覺我這個UP的成分越來越復(fù)雜了。