GPT-4 重磅發(fā)布!零基礎(chǔ)也能一秒做網(wǎng)站了?

大家好,這里是和你們聊設(shè)計(jì)的花生~
當(dāng)我還沉浸于收集各種基于ChatGPT 開發(fā)的 AI 效率神器時(shí),OpenAI 竟然發(fā)布了 GPT-4。之前為大家介紹 ChatGPT 時(shí)就提到過它使用的是 GPT-3 的模型,而當(dāng)時(shí) OpenAI 的研發(fā)進(jìn)度其實(shí)已經(jīng)超過了 GPT-3,但是沒想到 GPT-4 的發(fā)布會(huì)這么突然,一時(shí)間網(wǎng)上鋪天蓋地都是關(guān)于 GPT-4 的各種消息,看來(lái)真的是功能很強(qiáng)大,廢話不多說(shuō),一起看看和 GPT-3 相比 GPT-4 有哪些進(jìn)步吧~

一、接受圖片輸入并識(shí)別內(nèi)容
這次發(fā)布最令人激動(dòng)的一點(diǎn)就是 GPT-4 支持多模態(tài)(接受圖像和文本輸入,發(fā)出文本輸出),這意味著我們可以發(fā)送圖片給 GPT-4,并指示它識(shí)別分析圖片的內(nèi)容,圖片的類型可以是帶有文字和照片的文件、圖標(biāo)或者屏幕截圖。
雖然該功能目前僅供預(yù)覽,沒有開放給用戶,但從官方論文和直播公布的案例來(lái)看,GPT-4 并不是簡(jiǎn)單地描述圖片的內(nèi)容,而是能夠理解內(nèi)容物之間的聯(lián)系,并做出進(jìn)一步的判斷和動(dòng)作,也就是說(shuō) GPT-4 理解圖片能力與它理解文本的能力不相上下。比如下面的案例,將一張圖片發(fā)送給 GPT-4 分析它的笑點(diǎn),GPT-4 能非常準(zhǔn)確地識(shí)別一張圖片中的不同部分,理解它們之間的邏輯關(guān)系,并之指出笑點(diǎn)所在。

它也能識(shí)別出圖片的不合理之處,或者推斷出圖片內(nèi)容狀態(tài)被改變時(shí)會(huì)發(fā)生什么事情。

GPT-4 還能像理解文本內(nèi)容一樣,理解圖像內(nèi)的文字并按照用戶指示作出下一步的操作,比如分析論文內(nèi)容然后總結(jié)提煉。OpenAI 在官方直播里還展示了一個(gè)神奇的案例 —— 利用 GPT-4 的識(shí)圖功能,結(jié)合其強(qiáng)大的代碼編寫能力,將簡(jiǎn)單潦草的手繪網(wǎng)頁(yè)線框草稿轉(zhuǎn)換為代碼,從而制作出一個(gè)真正的網(wǎng)頁(yè)。


二、在專業(yè)和學(xué)術(shù)領(lǐng)域上表現(xiàn)的提升
OpenAI 官方在介紹 GPT-4 時(shí)著重強(qiáng)調(diào)的另一點(diǎn)是“在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平的表現(xiàn)”,比如它通過了模擬律師考試,分?jǐn)?shù)排名在所有應(yīng)試者的前 10% 左右,相比之下 GPT-3.5 的得分則在倒數(shù) 10% 左右,且 GPT-4 在其他各種專業(yè)和學(xué)科模擬考試中也有不俗的表現(xiàn)。當(dāng)時(shí)看到這個(gè)的我只覺得這不是“表現(xiàn)出”人類水平,而是“超過”大部分的人類水平了,之后估計(jì)會(huì)出現(xiàn)很多公司直接讓 GPT-4 對(duì)接服務(wù)客戶的情況,畢竟專業(yè)能力都是過關(guān)的。

OpenAI 的研發(fā)團(tuán)隊(duì)還進(jìn)一步提升了 GPT 的英語(yǔ)能力,GPT-4 的英語(yǔ)翻譯準(zhǔn)確度為 85.5%,比 GPT-3.5 的 70.1% 高出 15%。而且在模擬測(cè)試中 GPT-4 在意大利語(yǔ)、德語(yǔ)、西班牙語(yǔ)、法語(yǔ)、日語(yǔ)、韓語(yǔ)、土耳其語(yǔ)、俄語(yǔ)等 24 種語(yǔ)言中的翻譯表現(xiàn)都優(yōu)于與其他大型語(yǔ)言模型的英語(yǔ)表現(xiàn),包括拉脫維亞語(yǔ)、威爾士語(yǔ)和斯瓦希里語(yǔ)等低資源語(yǔ)言。

據(jù) OpenAI 官網(wǎng)顯示,在線免費(fèi)語(yǔ)言學(xué)習(xí)平臺(tái)多鄰國(guó) Duolingo 將把 GPT-4 融入自己的應(yīng)用中,以推進(jìn)產(chǎn)品的兩個(gè)新功能:角色扮演(Role Play)和解釋我的答案(Explain my Answer)。之前多鄰國(guó)一直嘗試通過腳本化的對(duì)話與學(xué)習(xí)者 "聊天",其中包含了各種經(jīng)典的場(chǎng)景,如點(diǎn)菜、第一次見面或買機(jī)票。而接入 GPT-4 后,多鄰國(guó)將擁有在小眾背景下與學(xué)習(xí)者 "沉浸式 "交談的能力——比如就籃球或到達(dá)山頂?shù)男腋8羞M(jìn)行自由交談。

三、可操控性增強(qiáng)
與之前 ChatGPT 固定的一種的語(yǔ)氣和風(fēng)格不同,GPT-4 的可操控性更強(qiáng),可以扮演各種指定角色,以不同的言語(yǔ)行為風(fēng)格與用戶進(jìn)行互動(dòng),比如給五年級(jí)的小學(xué)生當(dāng)數(shù)學(xué)老師、做你的程序編寫小助手,或者扮演一個(gè)莎士比亞式的海盜頭子和你對(duì)話。


OpenAI 還通過多個(gè)介紹視頻展現(xiàn) GPT-4 的其他進(jìn)步,比如在文字輸入限制方面由 GPT-3.5 的 3000 字提升成 25000 字,之后針對(duì)同一話題或?qū)ο?,用戶?ChatGPT 會(huì)有更寬更深的討論空間;總結(jié)能力提升,可以用一句話總結(jié)一份論文,以及對(duì)比兩篇文章并總結(jié)出他們之間的共同點(diǎn);事實(shí)推理能力增強(qiáng),可以理解稅務(wù)法并幫人們報(bào)稅;代碼編寫能力進(jìn)一步增強(qiáng),簡(jiǎn)單的代碼已經(jīng)無(wú)需人類輔助修改,復(fù)雜代碼雖然不能一次成功,但出現(xiàn)的問題可以再次反饋給 GPT-4,它會(huì)自動(dòng)根據(jù)上下文檢查錯(cuò)誤點(diǎn)并重寫代碼。

推特用戶@Pietro Schirano 用 GPT-4 在 60 秒 內(nèi)編寫出經(jīng)典游戲《Pong》,圖片內(nèi)容來(lái)源: https://twitter.com/skirano/status/1635736107949195278

推特用戶@Jakebrowatzke 用 GPT-4 在幾小時(shí)內(nèi)做了一個(gè) Chrome 插件,而他毫無(wú)編程基礎(chǔ),圖片內(nèi)容來(lái)源: https://twitter.com/jakebrowatzke/status/1635882037319008258
四、局限性
盡管 GPT-4 功能已經(jīng)十分強(qiáng)大了,但它仍然存在著之前就有的局限性。比如 模型數(shù)據(jù)仍停留在 2021 年 9 月之前,對(duì)這個(gè)時(shí)間點(diǎn)之后發(fā)生的事情缺乏了解,并且也無(wú)法意識(shí)到自己的這種缺陷,因此無(wú)法吸取教訓(xùn)進(jìn)行改進(jìn)。
GPT-4 仍然不是完全可信賴。雖然對(duì)抗性訓(xùn)練讓那 GPT-4 在事實(shí)性上比最 GPT-3.5 高出了 40%,但它還是會(huì)出現(xiàn)編造事實(shí)、推理錯(cuò)誤的情況,特別是在需要理解上下文的情況下。對(duì)于 GPT-4 輸出的內(nèi)容最好進(jìn)一步人工審核,或者在提供完整的上下文信息,或者避免出現(xiàn)需要讓 GPT-4 聯(lián)系上下文進(jìn)行理解的情況。
GPT-4 在理解俗語(yǔ)上的表現(xiàn)與研究人員的期望還有很大差異,比如“teach an old dog new tricks”是一個(gè)英語(yǔ)俗語(yǔ),字面意思是“教老狗玩新花樣 ”,用來(lái)比喻人們很難或不可能教會(huì)別人新的技能或改變別人的習(xí)慣,尤其是當(dāng)他們一成不變或長(zhǎng)期以來(lái)一直以某種方式做事。當(dāng)問 GPT-4 “Can you teach an old dog new tricks?”,它只能理解字面意思,從而給出錯(cuò)誤回答“Yes, you can teach an old dog new tricks”。
GPT-4 還會(huì)忽略提問中的一些細(xì)節(jié),導(dǎo)致給出錯(cuò)誤的答案,需要人為指正;會(huì)像人類一樣無(wú)法處理難題,比如它生成的代碼會(huì)存在安全漏洞;還有會(huì)輕易相信用戶主張的虛假信息,但是這一點(diǎn)已經(jīng)改進(jìn)不少,因?yàn)?Twitter 上有人拿之前戲弄 ChatGPT 的一個(gè)問題去測(cè)試 GPT-4,被 GPT-4 駁回了并且申明“我的目的是提供準(zhǔn)確的信息”。
當(dāng)然 OpenaAI 一直在致力于改進(jìn)和完善這些缺陷,努力讓訓(xùn)練更穩(wěn)定安全,目前取得的成果包括提高了 GPT-4 拒絕合成危險(xiǎn)化學(xué)品相關(guān)請(qǐng)求的能力、不響應(yīng)敏感的請(qǐng)求(如醫(yī)療建議和自我傷害)等。

圖片來(lái)源: https://twitter.com/DrJimFan/status/1636120223853199362
已經(jīng)開通 ChatGPT Plus 的用戶可以直接體驗(yàn)最新的 GPT-4 模型,GPT-4 的 API 也開放了等候名單,感興趣的小伙伴可以申請(qǐng)。如果你有新版 Bing 的預(yù)先體驗(yàn)權(quán),那么恭喜啦 ,GPT-4 在發(fā)布前 6 周就已經(jīng)被置入到 Bing 中了。
最新消息稱 GPT-5 會(huì)在今年年底前發(fā)布,讓人十分期待會(huì)出現(xiàn)哪些更強(qiáng)大的功能。不過在此之前基于 GPT-4 開發(fā)的各種 AI 神器應(yīng)該也夠我們期待一波了。對(duì)于 GPT-4 和未來(lái)將出現(xiàn)的 GPT-5 你有哪些想法呢?歡迎在評(píng)論區(qū)分享。喜歡本期內(nèi)容的話可以多多點(diǎn)贊收藏,之后會(huì)繼續(xù)為大家推薦更多最新的 AI 資訊。
GPT-4 官方介紹:GPT-4 --- GPT-4 (openai.com)
GPT-4 API 申請(qǐng)渠道:GPT-4 API waitlist --- GPT-4 API 候補(bǔ)名單 (openai.com)
參考資料:
https://mp.weixin.qq.com/s/kA7FBZsT6SIvwIkRwFS-xw
https://weibo.com/5498125999/Mxnih6TXu
https://www.youtube.com/watch?v=outcGtbnMuQ
https://twitter.com/OpenAI/status/1635687373060317185
https://openai.com/research/gpt-4