手機(jī)站首頁(yè)散文詩(shī)歌雜文隨筆日記小小說(shuō)

散文網(wǎng) » 科技 »數(shù)碼 » GPT-4是假的？ChatGPT評(píng)價(jià)GPT-4出現(xiàn)驚人回答

GPT-4是假的？ChatGPT評(píng)價(jià)GPT-4出現(xiàn)驚人回答

2023-03-16 21:55 作者:呆科技 0人讀過 | 我要投稿

大家好，我是大衛(wèi)呆。

?

2023年3月14日，OpenAI開放了“GPT-4”。首先什么是“GPT-4”呢？它其實(shí)是ChatGPT所用的語(yǔ)言模型的最新版本，之前的版本是“GPT-3.5”。

?

而最新版就是“GPT-4”。但這個(gè)“GPT-4”似乎并不簡(jiǎn)單，甚至有假！

?

這么說(shuō)大家可能一頭霧水，別急繼續(xù)往下看你就明白了。

?

這次我會(huì)直接用ChatGPT的Plus版本，也就是收費(fèi)版給大家說(shuō)明。

?

為什么用Plus版本？因?yàn)檫@個(gè)“GPT-4”目前只開放給Plus用戶使用，所以不交錢是不讓用的。

?

是不是有很多朋友仍舊不明白“GPT-3.5”和“GPT-4”到底是什么。當(dāng)我們使用ChatGPT的Plus版本，會(huì)看到一個(gè)選項(xiàng)，這里可以切換3種不同的語(yǔ)言模型。

?

當(dāng)我們把鼠標(biāo)放在上面，會(huì)出現(xiàn)一個(gè)浮動(dòng)圖，表明這個(gè)版本語(yǔ)言模型的三種能力值，分別是“推理能力”、“速度”和“簡(jiǎn)潔性”。從后面的點(diǎn)數(shù)我們就能清楚的知道這個(gè)語(yǔ)言模型偏重于哪方面能力了。是不是很像游戲里的設(shè)定。

?

現(xiàn)在大家明白“GPT-3.5”和“GPT-4”到底是什么以及它們的區(qū)別了吧。

至于上面兩個(gè)“3.5”的區(qū)別，大家通過能力值對(duì)比也就明白了。

?

在說(shuō)明這個(gè)“GPT-4”為什么有假之前，我們需要先了解一下“GPT-4”相比“GPT-3.5”到底有什么變化。

?

1.更強(qiáng)的創(chuàng)造力

?

在官方說(shuō)明中寫道：“GPT-4”比以往任何時(shí)候都更具創(chuàng)造力和協(xié)作性。它可以生成、編輯和迭代用戶進(jìn)行創(chuàng)意和技術(shù)寫作任務(wù)，例如創(chuàng)作歌曲、編寫劇本或?qū)W習(xí)用戶的寫作風(fēng)格。

?

官方還舉了一個(gè)例子，在“GPT-4”模型下，我們提問：用一個(gè)句子解釋灰姑娘的情節(jié)，其中每個(gè)單詞必須以字母表中從?A 到 Z 的下一個(gè)字母開頭，不要重復(fù)任何字母。

?

這如果是一道考題，我想應(yīng)該沒幾個(gè)人能回答出來(lái)。但在“GPT-4”模型下ChatGPT回答出來(lái)了。如果有英文大佬也可以在評(píng)論區(qū)給大家分析一下它寫的如何。

?

這是官方頁(yè)面的例子，我也用這個(gè)題目實(shí)際問了一下ChatGPT。

這是3.5版本的回答，可以看到回答并沒有達(dá)到A-Z的標(biāo)準(zhǔn)。

?

這是4.0的回答，不但做到了A-Z的要求，還和官方給出的回答完全不同。

?

感興趣的朋友可以好好分析一下它給出的回答是否合格。

?

我也測(cè)試了一下類似的中文問題。

?

首先語(yǔ)言模型選擇“GPT-3.5”，我問它：請(qǐng)用成語(yǔ)最后一個(gè)字進(jìn)行接龍，第一個(gè)成語(yǔ)是“合家歡樂”，下一個(gè)成語(yǔ)請(qǐng)用“樂”作為開頭，最后一個(gè)成語(yǔ)還是“合家歡樂”。

?

咱們來(lái)看看它能不能準(zhǔn)確的回答。

?

?

可以看到它繞了半天還是沒有回到“合家歡樂”。

?

接下來(lái)語(yǔ)言模型選擇“GPT-4”，咱們來(lái)看看回答是否合格。

?

?

可以看到排版方式變成了一行一個(gè)，并帶了序號(hào)，更加工整了。

但它一直重復(fù)到第73個(gè)仍舊沒有繞到“合家歡樂”。

?

不僅如此，成語(yǔ)中還出現(xiàn)了像“麗人行”、“肉包子打狗”、“墻頭草”這樣并不是成語(yǔ)的詞。

?

看來(lái)至少在中文方面“GPT-4”并不是那么美好。

?

2. 分析圖片

?

官方說(shuō)“GPT-4”?可以接受圖像作為輸入并生成標(biāo)題、分類和分析，并舉了個(gè)例子。

?

?

之前的ChatGPT只能輸入文字內(nèi)容，而“GPT-4”加入了輸入圖片的功能，確實(shí)讓人興奮。

?

那么我們就來(lái)試試這個(gè)“GPT-4”新加的圖片分析功能。

?

首先我將模型選為“GPT-4”，然后直接問它：你說(shuō)你能分析圖片，具體怎么分析？

?

但它的回答直接讓我傻了，它說(shuō)：作為一個(gè)基于文本的AI，我實(shí)際上不能直接分析圖片。但是，如果你能提供圖片的描述，我可以根據(jù)描述提供相關(guān)的信息、解釋和建議。

?

官方介紹里明明寫著“GPT-4”可以輸入圖片并分析，但它自己為什么說(shuō)不能直接分析圖片？

?

我繼續(xù)問它：可是你的介紹里說(shuō)GPT-4可以分析圖片，難道是騙人的？

?

?

它的回答竟然說(shuō)“我是GPT-3，而不是GPT-4”！朋友們，這是不是說(shuō)明“GPT-4”實(shí)際上就是“GPT-3”，“GPT-4”是假的？

?

為此我又問了一個(gè)問題：請(qǐng)問“GPT-4”有什么新功能？

?

?

它的回答竟然是：我是GPT-3，截至我的知識(shí)更新日期（2021年9月），GPT-4尚未發(fā)布。但是，可以預(yù)期GPT-4或類似的下一代AI模型可能具有以下新功能。

?

朋友們，你們說(shuō)這算不算欺騙？

?

不過從官方說(shuō)明“GPT-4”的第一個(gè)特點(diǎn)，也就是“創(chuàng)造性”看，用選項(xiàng)里的“GPT-4”給出的答案確實(shí)比“GPT-3.5”更加準(zhǔn)確。

?

所以咱們先別直接下結(jié)論，再看看“GPT-4”其它方面的變化。

?

3. 支持長(zhǎng)文本內(nèi)容

?

在官方介紹里說(shuō)明，“GPT-4”支持超過2萬(wàn)5千字的文本，并可以根據(jù)提問回答里面的內(nèi)容。

?

官方舉的例子是，文本內(nèi)容來(lái)自這個(gè)網(wǎng)址，然后請(qǐng)ChatGPT描述一下文章中她在超級(jí)碗上的表現(xiàn)以及特別之處。

?

?

可以看到，“GPT-4”語(yǔ)言模型下，ChatGPT給出了合格的回答。

?

不過這是官方的，我們當(dāng)然要自己試一下。

?

我選了一個(gè)國(guó)內(nèi)的文章網(wǎng)址讓它進(jìn)行分析，但得到的答案是，無(wú)法直接訪問網(wǎng)頁(yè)鏈接。

?

沒關(guān)系，我換一個(gè)國(guó)外的網(wǎng)址，而且這是一篇英文新聞。

?

我把這個(gè)網(wǎng)頁(yè)的鏈接給了ChatGPT，并讓它請(qǐng)描述一下這篇文章的主要內(nèi)容。

?

它的回答是：盡管我不能直接訪問網(wǎng)頁(yè)鏈接，但根據(jù)您提供的URL，我可以概括這篇文章的主要內(nèi)容。

可以看到它的回答確實(shí)是這篇文章的主要內(nèi)容，但通過它的回答我們也知道了這并不是ChatGPT在訪問網(wǎng)址內(nèi)容后給出的結(jié)論，而是直接通過分析網(wǎng)址給出的答案。

?

所以這和官方說(shuō)明的“GPT-4”支持超過25000字的文本，并可以根據(jù)提問回答里面的內(nèi)容，還是有很大區(qū)別的。

?

這難道又是欺騙？

?

4. 更強(qiáng)的邏輯推理能力

?

官方說(shuō)明“GPT-4”可以給ChatGPT帶來(lái)更強(qiáng)的邏輯推理能力。

?

官方的例子是這樣的

?

這是“GPT-3.5”版給出的回答，而下面這個(gè)是“GPT-4”給出的回答。

?

英文看著不爽，我們直接換中文邏輯推理題來(lái)試試。

?

先選擇“GPT-3.5”。

?

它給出的答案是：

?

但正確答案是A。ChatGPT回答錯(cuò)誤！

?

接下來(lái)切換到“GPT-4”，再問它同樣的問題，你們覺得這次它能答對(duì)嗎？

?

?

它的答案是：A.“鋼筆”與“文具”，回答正確！但沒給出任何說(shuō)明，非常的簡(jiǎn)明。

?

我問它為什么是A。它的回答也很符合邏輯，完全可以直接當(dāng)作標(biāo)準(zhǔn)答案。

?

所以最新的“GPT-4”確實(shí)讓ChatGPT變得更強(qiáng)大了。但是“圖片分析”和“長(zhǎng)文本分析”和官方描述并不一致。

?

至于在“GPT-4”下ChatGPT竟然說(shuō)“我是GPT-3”，我覺得有可能是OpenAI的疏忽大意，忘了告訴ChatGPT自己現(xiàn)在是“GPT-4”。不知大家對(duì)于ChatGPT在“GPT-4”下說(shuō)自己是“GPT-3”怎么看，可以在評(píng)論區(qū)談?wù)勀目捶ā?/p>