散文網(wǎng) » 科技 »數(shù)碼 » 文心一言漢譯英畫圖？我要唱唱反調(diào)

文心一言漢譯英畫圖？我要唱唱反調(diào)

2023-03-28 20:09 作者:洛天鴿 0人讀過 | 我要投稿

（多圖預(yù)警）

????近期，百度的文心一言進入了測試階段，不過也被人質(zhì)疑是“套皮”，“鴻蒙第二”，遭到嗶站眾人的拷打。但是，說句不好聽的，大部分人根本不在乎文心一言到底是不是套皮，他們只是秉持著對百度的厭惡，看都不看一眼就給這件事定了性。我能理解大家對百度的厭惡，因為我自己對這家公司也及其厭惡，畢竟百度的吃相難看是眾所周知的。但這是兩回事，不能因為百度吃相難看，我們就可以拋開現(xiàn)實不談。因此我決定唱唱反調(diào)，給漢譯英論者潑一桶冷水。

????許多網(wǎng)友在文心一言的作畫功能中輸入部分在英漢互譯中會產(chǎn)生歧義的詞，比如輸入“總線”，文心一言會畫出“巴士”，因為總線和巴士在英文中都是bus，從而“實錘”文心一言實質(zhì)上是把中文機翻成英文，拿去用已經(jīng)開源的SD生成圖畫，再返還給用戶說是自己生成的。

?? ?同樣的例子還有魚香肉絲

起重機（crane）

土耳其（Turkey）張開翅膀

這確實可以作為文心一言抄襲的一大有力證據(jù)，“中譯英”確實可以解釋上面的現(xiàn)象，但是，中譯英無法解釋下面的現(xiàn)象（以下機翻全部使用百度翻譯）

胸有成竹的男人機翻是A man with a clear mind，胸有成竹機翻是have a well-thought-out plan，無論哪個都沒有竹

唐伯虎點秋香的機翻是Tang Bohu Dots Autumn Fragrance，沒有任何含“虎”的元素

車水馬龍的機翻是incessant stream of horses and carriages，有水（stream 流，溪流），但是沒有龍

機翻并沒有大家想象的那樣弱智，即使是百度翻譯，也能正確地翻譯以上內(nèi)容而不會出現(xiàn)像文心一言這樣“望文生義”的情況。

其實我們陷入了這樣的一個思維誤區(qū)：為什么當英漢互譯出現(xiàn)歧義的時候，就能證明百度是“漢譯英”而非“英譯漢”？又或者其實我們都能意識到這樣一個思維誤區(qū)，但是為了流量，或者單純?yōu)榱肆R百度，許多人選擇性地忽視了后一種可能。但事實上我們發(fā)現(xiàn)，能用漢譯英解釋的，都能用英譯漢解釋，并且英譯漢可以解釋的更多，以前文提到的幾張圖舉例

唐伯虎

車水馬龍，當然這個并不是很完美，因為百度只保留了車水龍，馬不知道到哪里去了

當然也不排除那輛車是寶馬的可能

此外還有

熊熊烈火中的飛船，如果是漢譯英，熊熊烈火是raging flames,不會出現(xiàn)熊。但如果是英譯漢，百度翻譯會把bear flame翻譯成熊熊火焰，這樣就能解釋得通

由此我們可以看出，文心一言并非傳說的那樣是“漢譯英”而是“英譯漢”，漢譯英論者給出的這些證據(jù)非但不能證明文心一言是套皮的chatGPT，反而能證明它是自研的，只是使用了英文的數(shù)據(jù)集。

既然是這樣，那這也能說明為什么文心一言有時不能很好地理解中文了，因為用的就是英文的數(shù)據(jù)集。

但以上都只是猜測，有其他證據(jù)能證明嗎？

欸，還真有，百度早就把ERNIE - ViLG 2.0的論文放出來了，其中有提到他們使用的數(shù)據(jù)集，具體可以看https://arxiv.org/abs/2210.15257

當然我知道你們是不會看的，所以我就截出來了

The training data of ERNIE - ViLG 2.0 consists of 170M image - text pairs, including the publicly? available English datasets like LAION (Schuhmann et al.,2021） and a series of internal Chinese datasets.The image auto - encoder is trained on the same images. For images with English captions, we automatically translate them with Baidu Translate API3 to get the Chinese version.

翻譯成中文是

ERNIE-ViLG 2.0的訓(xùn)練數(shù)據(jù)由170M個圖像-文本對組成，包括公開可用的英語數(shù)據(jù)集，如LAION（Schuhmann等人，2021）和一系列內(nèi)部中文數(shù)據(jù)集。圖像自動編碼器在相同的圖像上訓(xùn)練。對于帶有英文字幕的圖像，我們會自動使用百度翻譯API3進行翻譯，以獲得中文版本。

有了這些證據(jù)，我們就可以非常嚴謹?shù)氐贸鼋Y(jié)論：“文心一言出現(xiàn)英漢互譯的歧義問題是由于其使用了英譯漢的數(shù)據(jù)集，而并非是漢譯英拿去給別的軟件來畫圖。”

說真的，要是認為文心一言就是套皮的產(chǎn)品，那多少有點看不起百度了，百度雖然吃相難看，但實力還是有的?？蒲兄凶畲蟮碾y點在于你不知道那條路是正確的，所以必須不斷試錯。美國研究出核彈之后，蘇聯(lián)立馬跟上也研制出了核彈；蘇聯(lián)研究出載人航天后，美國也緊跟著送了個人上去，因為一方已經(jīng)把可行的道路指了出來，后面的人只要跟上就行了。那為什么在計算機上蘇聯(lián)敗給了美國？除了國力的差距之外，蘇聯(lián)把前途賭在了電子管上，而美國選擇了晶體管，后來證明晶體管的道路才是正確的，蘇聯(lián)賭錯了，因而付出了巨大的代價。

而現(xiàn)在，ChatGPT已經(jīng)把路指了出來，既然已經(jīng)知道了這條路是可行的，百度要重走一遍這條路是不難的。

如果要對比老前輩GPT-4，文心一言的表現(xiàn)確實可以用令人失望來形容。你當然可以說它差勁，說它簡陋，畢竟文心一言的水平是我們有目共睹的。你也可以為它辯解，說文心一言起步晚，現(xiàn)在還處在嬰兒階段，或者說雖然文心一言交上的答卷并不令人滿意，但是其他同學都還是白卷，因此我們依然處于世界前列。但是這一切的一切都應(yīng)當建立在實事求是，而非胡亂猜測，輸出情緒的基礎(chǔ)上。縱使百度的污點再多，也不是你歪曲事實的理由。

當然百度的吃相還是不負眾望，昨天百度發(fā)布消息要推出文心千帆，可能收費，人家openAI都只有plus版收費，百度你是怎么敢的啊

（圖源自網(wǎng)絡(luò)，侵刪）

標簽：百度文心一言

文心一言漢譯英畫圖？我要唱唱反調(diào)的評論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

文心一言漢譯英畫圖？我要唱唱反調(diào)

文心一言漢譯英畫圖？我要唱唱反調(diào)的評論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

文心一言漢譯英畫圖？我要唱唱反調(diào)

本文作者的其他文章

文心一言漢譯英畫圖？我要唱唱反調(diào)的評論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

文心一言漢譯英畫圖？我要唱唱反調(diào)的評論 (共條)