文心一言漢譯英畫圖?我要唱唱反調(diào)
(多圖預(yù)警)
????近期,百度的文心一言進入了測試階段,不過也被人質(zhì)疑是“套皮”,“鴻蒙第二”,遭到嗶站眾人的拷打。但是,說句不好聽的,大部分人根本不在乎文心一言到底是不是套皮,他們只是秉持著對百度的厭惡,看都不看一眼就給這件事定了性。我能理解大家對百度的厭惡,因為我自己對這家公司也及其厭惡,畢竟百度的吃相難看是眾所周知的。但這是兩回事,不能因為百度吃相難看,我們就可以拋開現(xiàn)實不談。因此我決定唱唱反調(diào),給漢譯英論者潑一桶冷水。
????許多網(wǎng)友在文心一言的作畫功能中輸入部分在英漢互譯中會產(chǎn)生歧義的詞,比如輸入“總線”,文心一言會畫出“巴士”,因為總線和巴士在英文中都是bus,從而“實錘”文心一言實質(zhì)上是把中文機翻成英文,拿去用已經(jīng)開源的SD生成圖畫,再返還給用戶說是自己生成的。

?? ?同樣的例子還有魚香肉絲

起重機(crane)

土耳其(Turkey)張開翅膀

這確實可以作為文心一言抄襲的一大有力證據(jù),“中譯英”確實可以解釋上面的現(xiàn)象,但是,中譯英無法解釋下面的現(xiàn)象(以下機翻全部使用百度翻譯)
胸有成竹的男人機翻是A man with a clear mind,胸有成竹機翻是have a well-thought-out plan,無論哪個都沒有竹

唐伯虎點秋香的機翻是Tang Bohu Dots Autumn Fragrance,沒有任何含“虎”的元素

車水馬龍的機翻是incessant stream of horses and carriages,有水(stream 流,溪流),但是沒有龍

機翻并沒有大家想象的那樣弱智,即使是百度翻譯,也能正確地翻譯以上內(nèi)容而不會出現(xiàn)像文心一言這樣“望文生義”的情況。
其實我們陷入了這樣的一個思維誤區(qū):為什么當英漢互譯出現(xiàn)歧義的時候,就能證明百度是“漢譯英”而非“英譯漢”?又或者其實我們都能意識到這樣一個思維誤區(qū),但是為了流量,或者單純?yōu)榱肆R百度,許多人選擇性地忽視了后一種可能。但事實上我們發(fā)現(xiàn),能用漢譯英解釋的,都能用英譯漢解釋,并且英譯漢可以解釋的更多,以前文提到的幾張圖舉例
唐伯虎

車水馬龍,當然這個并不是很完美,因為百度只保留了車水龍,馬不知道到哪里去了

當然也不排除那輛車是寶馬的可能

此外還有
熊熊烈火中的飛船,如果是漢譯英,熊熊烈火是raging flames,不會出現(xiàn)熊。但如果是英譯漢,百度翻譯會把bear flame翻譯成熊熊火焰,這樣就能解釋得通


由此我們可以看出,文心一言并非傳說的那樣是“漢譯英”而是“英譯漢”,漢譯英論者給出的這些證據(jù)非但不能證明文心一言是套皮的chatGPT,反而能證明它是自研的,只是使用了英文的數(shù)據(jù)集。
既然是這樣,那這也能說明為什么文心一言有時不能很好地理解中文了,因為用的就是英文的數(shù)據(jù)集。
但以上都只是猜測,有其他證據(jù)能證明嗎?
欸,還真有,百度早就把ERNIE - ViLG 2.0的論文放出來了,其中有提到他們使用的數(shù)據(jù)集,具體可以看https://arxiv.org/abs/2210.15257
當然我知道你們是不會看的,所以我就截出來了
The training data of ERNIE - ViLG 2.0 consists of 170M image - text pairs, including the publicly? available English datasets like LAION (Schuhmann et al.,2021) and a series of internal Chinese datasets.The image auto - encoder is trained on the same images. For images with English captions, we automatically translate them with Baidu Translate API3 to get the Chinese version.
翻譯成中文是
ERNIE-ViLG 2.0的訓(xùn)練數(shù)據(jù)由170M個圖像-文本對組成,包括公開可用的英語數(shù)據(jù)集,如LAION(Schuhmann等人,2021)和一系列內(nèi)部中文數(shù)據(jù)集。圖像自動編碼器在相同的圖像上訓(xùn)練。對于帶有英文字幕的圖像,我們會自動使用百度翻譯API3進行翻譯,以獲得中文版本。
有了這些證據(jù),我們就可以非常嚴謹?shù)氐贸鼋Y(jié)論:“文心一言出現(xiàn)英漢互譯的歧義問題是由于其使用了英譯漢的數(shù)據(jù)集,而并非是漢譯英拿去給別的軟件來畫圖。”
說真的,要是認為文心一言就是套皮的產(chǎn)品,那多少有點看不起百度了,百度雖然吃相難看,但實力還是有的??蒲兄凶畲蟮碾y點在于你不知道那條路是正確的,所以必須不斷試錯。美國研究出核彈之后,蘇聯(lián)立馬跟上也研制出了核彈;蘇聯(lián)研究出載人航天后,美國也緊跟著送了個人上去,因為一方已經(jīng)把可行的道路指了出來,后面的人只要跟上就行了。那為什么在計算機上蘇聯(lián)敗給了美國?除了國力的差距之外,蘇聯(lián)把前途賭在了電子管上,而美國選擇了晶體管,后來證明晶體管的道路才是正確的,蘇聯(lián)賭錯了,因而付出了巨大的代價。
而現(xiàn)在,ChatGPT已經(jīng)把路指了出來,既然已經(jīng)知道了這條路是可行的,百度要重走一遍這條路是不難的。
如果要對比老前輩GPT-4,文心一言的表現(xiàn)確實可以用令人失望來形容。你當然可以說它差勁,說它簡陋,畢竟文心一言的水平是我們有目共睹的。你也可以為它辯解,說文心一言起步晚,現(xiàn)在還處在嬰兒階段,或者說雖然文心一言交上的答卷并不令人滿意,但是其他同學都還是白卷,因此我們依然處于世界前列。但是這一切的一切都應(yīng)當建立在實事求是,而非胡亂猜測,輸出情緒的基礎(chǔ)上。縱使百度的污點再多,也不是你歪曲事實的理由。
當然百度的吃相還是不負眾望,昨天百度發(fā)布消息要推出文心千帆,可能收費,人家openAI都只有plus版收費,百度你是怎么敢的啊
(圖源自網(wǎng)絡(luò),侵刪)