GPT-4發(fā)布后的第一道挑戰(zhàn),來自弱智吧


本文首發(fā)于公眾號 情報姬
轉(zhuǎn)載事宜請后臺詢問哦
文丨流年如墨 審核丨千里
排版丨鹿九

我相信,如果未來有一天我們證實了AI永遠趕不上人類的智慧,那其中弱智吧吧友絕對功不可沒。

當然,反過來意思也差不多:要是哪天AI連弱智吧的腦殘問題都能應對如流,那大伙離失業(yè)可能也就不遠了。
就在幾天前,去年年底風靡互聯(lián)網(wǎng)的聊天AI“ChatGPT”背后的公司OpenAI又推出了全新的GPT-4。

要知道,之前就被大家評價為“程序員殺手”、“論文大師”、“作業(yè)工具人”的ChatGPT所使用的只是GPT-3.5的內(nèi)核,而那些搭建在QQ群里的聊天機器人更大多只是調(diào)用了GPT-3的api,就已經(jīng)可以滿足大家絕大多數(shù)的日常所需。
而在這次全面升級后,新出爐的GPT-4可還要牛上一個段位。
最直觀的一點,是它不僅可以接收、理解文字,連圖都能看懂。用戶只需要上傳一張圖片,就能讓GPT-4對圖中內(nèi)容進行點評。
從下圖中的對話來看,它顯然看到并看懂了這張圖。

當然,你也可以故意使個壞,給它上傳一張表意隱晦的互聯(lián)網(wǎng)梗圖,賭它理會不得個中深意。

然而事實卻是GPT-4精準描述出了圖中的內(nèi)容,并且分條列點地講出了其中所包含的笑點。

只可惜,這個功能暫時不對公眾開放。
同時,OpenAI似乎是在上次的測試中搞清楚了大家的興趣所在,給GPT-4添加了一個角色扮演功能。聽上去和之前的“貓娘洗腦咒語”系列相差不大,但從大家的實戰(zhàn)演示來看,如今想把AI變成自己的專屬貓娘比以前省力了不少。

當然,也可能是剛上線的GPT-4也沒被“AI原則”的條條框框所束縛,暫且可以和用戶們玩點大的。
此外,GPT-4對于文字的理解能力也比過往的GPT-3.5高了一個臺階。即使在面對博大精深的漢語中最難為人的那些句式時,它也能給出盡量準確的翻譯。
像這句“別別別的”,三個“別”字就被正確翻譯成了“put”、“not”和“anything else”。雖然具體描述上有些許不同,但考慮到中英表述習慣的不同,已經(jīng)足夠優(yōu)秀了。

至于這句更拗口的“過過過兒過過的生活”翻譯的更是完美,顯然是正確領會到了原句的意思,沒給繞暈。

而更讓我驚喜的是,相比它套話連篇,聽君一席話如聽一席話的老前輩,GPT-4嘴里忽悠人的車轱轆話顯然少了很多,更能干實事了。
舉個簡單的例子,在以前當我們用ChatGPT做主持人編寫一個冒險故事,讓它向我們描述一些奇幻物品的形象時,它總會說一堆空話,再把皮球踢回來。

但這回,AI自己編寫故事、填補細節(jié)的能力就好上了許多,在推進故事進展時很少會給出模棱兩可的描述,玩起來更多了些代入感。

進行DND文字冒險的直播內(nèi)容)
更別說GPT-4的記憶長度是ChatGPT的近十倍,在進行長段對話時不再需要過于擔心它的記憶能力,只要每隔一段時間統(tǒng)計、記錄一下核心數(shù)據(jù),稍微糾下錯,就可以來一場痛快的異世界冒險了——喜歡DND/COC跑團,但苦于無人作伴的兄弟有福了。
但是嗷,上面提到的這些都還只是小打小鬧,真正在對話中對GPT-4的理解能力、表述能力、邏輯思維能力進行了全面考察的,還得是咱弱智吧吧友。

這兩天,B站上“GPT-4首戰(zhàn)弱智吧”、“GPT-4再戰(zhàn)弱智吧”這樣的視頻不在少數(shù)。按大家的一貫印象,AI在應付這些一踩一個坑 抽象問題時很容易就原形畢露。但這次,情況好像出了點變化。
首選端上來的是經(jīng)典老題“女朋友的老公叫我什么”,此前的AI給出過五花八門的答案,包括“爸爸”等。

而在這邊,GPT-4雖然沒能識破“女朋友的老公”就是“我”的文字游戲,但還是就問題的不合理提出了質(zhì)疑,起碼沒被繞進去,打個90分不過分。

再來,弱智吧繼續(xù)掏出混淆語義的句式,“跳多高才能跳過廣告”,意在讓AI誤會“廣告”是個具體的有高度的東西。

誰知GPT-4竟真有火眼金睛,一眼看出“這是個幽默的隱喻”,幫弱智吧解釋了問題的同時還真給出了一串減少、跳過廣告的犯案,這一串話看起來八面玲瓏。壞了,真讓AI啥都搞懂了。

還好,弱智吧不愧是弱智吧,弱智問題數(shù)之不盡,但AI只有一次失敗的機會。很快,有備而來的弱智吧就成功拿下一分——GPT-4終究在詭辯話術上吃了點虧。

雖然有偶爾失手的案例,但從這一連串的弱智吧VSGPT-4中,我們明顯可以看到它分辨語義的能力相比前代產(chǎn)品有了極大提升,簡單的語言陷阱文字游戲已經(jīng)不再能夠讓他跟著胡扯。
同時,GPT-4回答內(nèi)容的邏輯性強了不少,即使是一些需要思考、需要創(chuàng)作的問題它也能發(fā)表見解,屬實相當恐怖。

在經(jīng)歷了這樣一次升級后,讓GPT-4來扮演我們?nèi)粘I钪胁糠止ぷ鞯闹诛@然綽綽有余——這下?lián)膶W生用AI做作業(yè)的大學老師又要頭疼了。
還好,目前為止想要體驗GPT-4必須在OpenAI的網(wǎng)站上開通月費20美元的ChatGPT Plus服務,否則就只能使用此前公開的GPT-3.5版本,這個價格對于一般樂子人來說還是挺不愿承擔的。

當然,如果你真想搶先體驗GPT-4又不愿花錢,那就趕緊去注冊一下微軟newbing——在GPT-4發(fā)布后,微軟也承認了newbing搭載的AI正是GPT-4。盡管newbing有著回答次數(shù)的限制,起碼嘗個鮮還是沒問題的。

隨著ChatGPT的逐步迭代,為大家所詬病的邏輯問題、扯胡話問題等也在肉眼可見的不斷改善。等哪天GPT5.0乃至6.0發(fā)布,或許我們?nèi)粘V胁簧俸唵蔚M時的瑣事真就可以一句話交付給AI完成。
期待未來有一天,我們能過上一句話寫稿、一句話編程、甚至一句話生成動圖短片的生活,那可太有意思了。


hi,這里是情報姬~
想更早看到編輯們的文章,可以wx關注下我的公號
這對我來說很重要,筆芯

往期精彩,點擊可達

