GPT-4:顫抖吧人類!請接受生產力又一里程碑式的飛躍!
原創(chuàng) | 文BFT機器人

美國當地時間3月14日,讓數億ChatGPT用戶燥候已久的GPT-4終于生出來了!
它對比現有的大型語言模型,包括下一代(SOTA,State Of The Arts)模型而言,可以用“完勝”兩個字來形容。用OpenAI官方自己的話來說,“GPT-4是我們迄今為止最強大、對齊最好的模型”。
這次的宣發(fā),OpenAI官方在GPT-4的介紹性網頁中,直接給用戶投送了“說明書大禮包”:

網頁地址:https://openai.com/waitlist/gpt-4-api
GPT-4技術報告
https://cdn.openai.com/papers/gpt-4.pdf
System card
https://cdn.openai.com/papers/gpt-4-system-card.pdf
ChatGPT Plus 體驗
https://chat.openai.com/chat
GPT-4的API waitlist
https://openai.com/waitlist/gpt-4-api
GPT-4 demo視頻
https://www.youtube.com/watch?v=outcGtbnMuQ
GPT-4背后的開源評估框架Evals
https://github.com/openai/evals
總之,其內容之全是生怕你看不懂,更怕你看懂了不用。
01
GPT-4和GPT-3.5的區(qū)別在哪里?



從官網給出的三項不同的能力直觀對比來看
推理能力:GPT-4>Default=Legacy
速度:Default>GPT-4=Legacy
語言精煉:GPT-4>Default>Legacy
Logo的變化


為了更加清晰的展示GPT-4對比GPT-3.5的“進化”,OpenAI官方做了一系列的基礎測試,讓模型們考試,甚至直接考人類的試。
語言能力
作為一款語言模型,為了考驗其除了英語以外的其他語種的表現,OpenAI官方安排了一場考試,使用Azure Translate將MMLU基準測試(一套涵蓋57個主題的14000個多項選擇題)翻譯成各種語言。

結果顯示,GPT-4在測試的26種語言中,有24種的都優(yōu)于對比的其他語言模型(Chinchilla,PaLM),不僅僅限于英語,甚至是拉脫維亞語、威爾士語和斯瓦希里語等低資源語言GPT-4也成功拿下。

高級推理能力
而為了更好的展現GPT-4在推理能力上質的飛躍,OpenAI扒出了最新公開的奧林匹克競賽題、AP自由答題等試題,甚至于加上了2022-2023年版的模擬考試題,以增進對這兩種模型的理解。


測試的結果也顯而易見,GPT-4贏麻了。在律師模擬考試中,GPT-3排列末位10%左右,而GPT-4擠進了前10%左右??梢哉f對比GPT-4這個過于耀眼的優(yōu)等生,連曾經的“頂流”GPT-3.5都顯得有些黯然失色了。
功能增加
而對于月活九位數的ChatGPT用戶們而言,最關心的當然還是新功能的增加。
最大的改變就是不再只接受文本了!GPT-4具備處理文本和圖像的能力,用戶可指定各種視覺或語言任務。
它可根據由文本和圖像交替組成的輸入,生成自然語言、代碼等文本輸出。在生成帶文本和圖片的文檔、圖表或截圖方面,GPT-4與純文本輸入一樣出色,甚至還可利用測試時技術(如少量標注數據和思維鏈提示)提高性能。目前,就官網上給予的7個視覺輸入的例子展示來看,圖像輸入仍在研究預覽階段,未來可能會有更大的提升。
此外,GPT-4不僅可以處理更長的字符長度,其長度限制已提升至32K tokens,即能處理超過25000個單詞的文本,還能夠支持長格式內容的創(chuàng)建、擴展對話、文檔搜索和分析等應用。
安全性提升
在安全性方面,為了確保GPT-4回答的準確性和安全性,OpenAI公司與醫(yī)學、地緣政治等敏感領域的50余位專家合作,并改進了監(jiān)控框架。
與GPT-3.5相比,GPT-4的安全特性得到了顯著的改善,其緩解措施使模型響應禁止內容請求的可能性降低了82%。此外,根據OpenAI的政策,GPT-4對敏感請求(如醫(yī)療建議和自我傷害)的響應頻率提高了29%。


多項任務并行優(yōu)勢突出
如果只是簡單的對話,GPT-3.5和GPT-4之間的差別可能不太明顯,但當任務的復雜性達到一定閾值時,就能看出它們之間的區(qū)別。與GPT-3.5相比,GPT-4更可靠、更具創(chuàng)造力,并且可以處理更多微妙的指令差異。
02
如何使用GPT-4?
第一種方式:ChatGPT Plus用戶付費使用
在用戶端,目前只開放給了ChatGPT Plus用戶,顧名思義不支持免費使用,如果想要一睹為快,請先支付給官方每月20美元獲取高級訪問權限。即便付費后,提問也受到了一定的限制,每4小時內不能發(fā)送超過100條信息。
第二種方式:開發(fā)者加入waitlist
開發(fā)者可以可以申請GPT-4 API獲取訪問權,待候補名單通過后,可以把 AI 集成到自己的應用程序中,同時 OpenAI 將對約 750 個單詞的提示收取約 3 美分,對約 750 個單詞的回復收取 6 美分。
第三種方式:參與OpenAI Evals
在OpenAI開源的用于自動評估AI模型性能的框架OpenAI Evals中,提供了高質量貢獻,官方會給予你GPT-4的訪問權。
更多精彩內容請關注公眾號:BFT機器人
本文為原創(chuàng)文章,版權歸BFT機器人所有,如需轉載請與我們聯系。若您對該文章內容有任何疑問,請與我們聯系,將及時回應。