GPT-4是假的?ChatGPT評(píng)價(jià)GPT-4出現(xiàn)驚人回答

大家好,我是大衛(wèi)呆。
?
2023年3月14日,OpenAI開放了“GPT-4”。首先什么是“GPT-4”呢?它其實(shí)是ChatGPT所用的語(yǔ)言模型的最新版本,之前的版本是“GPT-3.5”。

?
而最新版就是“GPT-4”。但這個(gè)“GPT-4”似乎并不簡(jiǎn)單,甚至有假!
?

這么說(shuō)大家可能一頭霧水,別急繼續(xù)往下看你就明白了。
?
這次我會(huì)直接用ChatGPT的Plus版本,也就是收費(fèi)版給大家說(shuō)明。

?
為什么用Plus版本?因?yàn)檫@個(gè)“GPT-4”目前只開放給Plus用戶使用,所以不交錢是不讓用的。

?
是不是有很多朋友仍舊不明白“GPT-3.5”和“GPT-4”到底是什么。當(dāng)我們使用ChatGPT的Plus版本,會(huì)看到一個(gè)選項(xiàng),這里可以切換3種不同的語(yǔ)言模型。

?
當(dāng)我們把鼠標(biāo)放在上面,會(huì)出現(xiàn)一個(gè)浮動(dòng)圖,表明這個(gè)版本語(yǔ)言模型的三種能力值,分別是“推理能力”、“速度”和“簡(jiǎn)潔性”。從后面的點(diǎn)數(shù)我們就能清楚的知道這個(gè)語(yǔ)言模型偏重于哪方面能力了。是不是很像游戲里的設(shè)定。

?
現(xiàn)在大家明白“GPT-3.5”和“GPT-4”到底是什么以及它們的區(qū)別了吧。
至于上面兩個(gè)“3.5”的區(qū)別,大家通過能力值對(duì)比也就明白了。
?
在說(shuō)明這個(gè)“GPT-4”為什么有假之前,我們需要先了解一下“GPT-4”相比“GPT-3.5”到底有什么變化。
?
1.更強(qiáng)的創(chuàng)造力
?
在官方說(shuō)明中寫道:“GPT-4”比以往任何時(shí)候都更具創(chuàng)造力和協(xié)作性。它可以生成、編輯和迭代用戶進(jìn)行創(chuàng)意和技術(shù)寫作任務(wù),例如創(chuàng)作歌曲、編寫劇本或?qū)W習(xí)用戶的寫作風(fēng)格。

?
官方還舉了一個(gè)例子,在“GPT-4”模型下,我們提問:用一個(gè)句子解釋灰姑娘的情節(jié),其中每個(gè)單詞必須以字母表中從?A 到 Z 的下一個(gè)字母開頭,不要重復(fù)任何字母。

?
這如果是一道考題,我想應(yīng)該沒幾個(gè)人能回答出來(lái)。但在“GPT-4”模型下ChatGPT回答出來(lái)了。如果有英文大佬也可以在評(píng)論區(qū)給大家分析一下它寫的如何。
?
這是官方頁(yè)面的例子,我也用這個(gè)題目實(shí)際問了一下ChatGPT。
這是3.5版本的回答,可以看到回答并沒有達(dá)到A-Z的標(biāo)準(zhǔn)。

?
這是4.0的回答,不但做到了A-Z的要求,還和官方給出的回答完全不同。

?
感興趣的朋友可以好好分析一下它給出的回答是否合格。
?
我也測(cè)試了一下類似的中文問題。
?
首先語(yǔ)言模型選擇“GPT-3.5”,我問它:請(qǐng)用成語(yǔ)最后一個(gè)字進(jìn)行接龍,第一個(gè)成語(yǔ)是“合家歡樂”,下一個(gè)成語(yǔ)請(qǐng)用“樂”作為開頭,最后一個(gè)成語(yǔ)還是“合家歡樂”。
?
咱們來(lái)看看它能不能準(zhǔn)確的回答。
?

?
可以看到它繞了半天還是沒有回到“合家歡樂”。
?
接下來(lái)語(yǔ)言模型選擇“GPT-4”,咱們來(lái)看看回答是否合格。
?

?
可以看到排版方式變成了一行一個(gè),并帶了序號(hào),更加工整了。
但它一直重復(fù)到第73個(gè)仍舊沒有繞到“合家歡樂”。

?
?
不僅如此,成語(yǔ)中還出現(xiàn)了像“麗人行”、“肉包子打狗”、“墻頭草”這樣并不是成語(yǔ)的詞。

?
看來(lái)至少在中文方面“GPT-4”并不是那么美好。
?
2. 分析圖片
?
官方說(shuō)“GPT-4”?可以接受圖像作為輸入并生成標(biāo)題、分類和分析,并舉了個(gè)例子。

?

?
?
之前的ChatGPT只能輸入文字內(nèi)容,而“GPT-4”加入了輸入圖片的功能,確實(shí)讓人興奮。

?
那么我們就來(lái)試試這個(gè)“GPT-4”新加的圖片分析功能。
?
首先我將模型選為“GPT-4”,然后直接問它:你說(shuō)你能分析圖片,具體怎么分析?

?
但它的回答直接讓我傻了,它說(shuō):作為一個(gè)基于文本的AI,我實(shí)際上不能直接分析圖片。但是,如果你能提供圖片的描述,我可以根據(jù)描述提供相關(guān)的信息、解釋和建議。
?
官方介紹里明明寫著“GPT-4”可以輸入圖片并分析,但它自己為什么說(shuō)不能直接分析圖片?
?
我繼續(xù)問它:可是你的介紹里說(shuō)GPT-4可以分析圖片,難道是騙人的?
?

?
?
它的回答竟然說(shuō)“我是GPT-3,而不是GPT-4”!朋友們,這是不是說(shuō)明“GPT-4”實(shí)際上就是“GPT-3”,“GPT-4”是假的?
?
為此我又問了一個(gè)問題:請(qǐng)問“GPT-4”有什么新功能?
?

?
?
它的回答竟然是:我是GPT-3,截至我的知識(shí)更新日期(2021年9月),GPT-4尚未發(fā)布。但是,可以預(yù)期GPT-4或類似的下一代AI模型可能具有以下新功能。
?
朋友們,你們說(shuō)這算不算欺騙?
?
不過從官方說(shuō)明“GPT-4”的第一個(gè)特點(diǎn),也就是“創(chuàng)造性”看,用選項(xiàng)里的“GPT-4”給出的答案確實(shí)比“GPT-3.5”更加準(zhǔn)確。
?
所以咱們先別直接下結(jié)論,再看看“GPT-4”其它方面的變化。
?
3. 支持長(zhǎng)文本內(nèi)容
?
在官方介紹里說(shuō)明,“GPT-4”支持超過2萬(wàn)5千字的文本,并可以根據(jù)提問回答里面的內(nèi)容。
?

官方舉的例子是,文本內(nèi)容來(lái)自這個(gè)網(wǎng)址,然后請(qǐng)ChatGPT描述一下文章中她在超級(jí)碗上的表現(xiàn)以及特別之處。
?

?
可以看到,“GPT-4”語(yǔ)言模型下,ChatGPT給出了合格的回答。
?
不過這是官方的,我們當(dāng)然要自己試一下。
?
我選了一個(gè)國(guó)內(nèi)的文章網(wǎng)址讓它進(jìn)行分析,但得到的答案是,無(wú)法直接訪問網(wǎng)頁(yè)鏈接。
?

沒關(guān)系,我換一個(gè)國(guó)外的網(wǎng)址,而且這是一篇英文新聞。
?

我把這個(gè)網(wǎng)頁(yè)的鏈接給了ChatGPT,并讓它請(qǐng)描述一下這篇文章的主要內(nèi)容。
?

它的回答是:盡管我不能直接訪問網(wǎng)頁(yè)鏈接,但根據(jù)您提供的URL,我可以概括這篇文章的主要內(nèi)容。
可以看到它的回答確實(shí)是這篇文章的主要內(nèi)容,但通過它的回答我們也知道了這并不是ChatGPT在訪問網(wǎng)址內(nèi)容后給出的結(jié)論,而是直接通過分析網(wǎng)址給出的答案。
?
所以這和官方說(shuō)明的“GPT-4”支持超過25000字的文本,并可以根據(jù)提問回答里面的內(nèi)容,還是有很大區(qū)別的。
?
這難道又是欺騙?
?
4. 更強(qiáng)的邏輯推理能力
?
官方說(shuō)明“GPT-4”可以給ChatGPT帶來(lái)更強(qiáng)的邏輯推理能力。

?
官方的例子是這樣的
?

這是“GPT-3.5”版給出的回答,而下面這個(gè)是“GPT-4”給出的回答。
?

英文看著不爽,我們直接換中文邏輯推理題來(lái)試試。
?
先選擇“GPT-3.5”。
?

它給出的答案是:

?
?
但正確答案是A。ChatGPT回答錯(cuò)誤!
?

接下來(lái)切換到“GPT-4”,再問它同樣的問題,你們覺得這次它能答對(duì)嗎?
?

?
它的答案是:A.“鋼筆”與“文具”,回答正確!但沒給出任何說(shuō)明,非常的簡(jiǎn)明。
?
我問它為什么是A。它的回答也很符合邏輯,完全可以直接當(dāng)作標(biāo)準(zhǔn)答案。

?
?
所以最新的“GPT-4”確實(shí)讓ChatGPT變得更強(qiáng)大了。但是“圖片分析”和“長(zhǎng)文本分析”和官方描述并不一致。
?
至于在“GPT-4”下ChatGPT竟然說(shuō)“我是GPT-3”,我覺得有可能是OpenAI的疏忽大意,忘了告訴ChatGPT自己現(xiàn)在是“GPT-4”。不知大家對(duì)于ChatGPT在“GPT-4”下說(shuō)自己是“GPT-3”怎么看,可以在評(píng)論區(qū)談?wù)勀目捶ā?/p>
?
如果您覺得內(nèi)容有用,歡迎關(guān)注加點(diǎn)贊。我是大衛(wèi)呆,我們下期見!