最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網 會員登陸 & 注冊

GPT-4:顫抖吧人類!請接受生產力又一里程碑式的飛躍!

2023-03-16 10:16 作者:BFT白芙堂機器人  | 我要投稿

原創(chuàng) | 文BFT機器人

美國當地時間3月14日,讓數億ChatGPT用戶燥候已久的GPT-4終于生出來了!


它對比現有的大型語言模型,包括下一代(SOTA,State Of The Arts)模型而言,可以用“完勝”兩個字來形容。用OpenAI官方自己的話來說,“GPT-4是我們迄今為止最強大、對齊最好的模型”。


這次的宣發(fā),OpenAI官方在GPT-4的介紹性網頁中,直接給用戶投送了“說明書大禮包”:



網頁地址:https://openai.com/waitlist/gpt-4-api

  • GPT-4技術報告

https://cdn.openai.com/papers/gpt-4.pdf

  • System card

https://cdn.openai.com/papers/gpt-4-system-card.pdf

  • ChatGPT Plus 體驗

https://chat.openai.com/chat

  • GPT-4的API waitlist

https://openai.com/waitlist/gpt-4-api

  • GPT-4 demo視頻

https://www.youtube.com/watch?v=outcGtbnMuQ

  • GPT-4背后的開源評估框架Evals

https://github.com/openai/evals


總之,其內容之全是生怕你看不懂,更怕你看懂了不用。


01


GPT-4和GPT-3.5的區(qū)別在哪里?


從官網給出的三項不同的能力直觀對比來看

  • 推理能力:GPT-4>Default=Legacy

  • 速度:Default>GPT-4=Legacy

  • 語言精煉:GPT-4>Default>Legacy

Logo的變化

為了更加清晰的展示GPT-4對比GPT-3.5的“進化”,OpenAI官方做了一系列的基礎測試,讓模型們考試,甚至直接考人類的試。


語言能力


作為一款語言模型,為了考驗其除了英語以外的其他語種的表現,OpenAI官方安排了一場考試,使用Azure Translate將MMLU基準測試(一套涵蓋57個主題的14000個多項選擇題)翻譯成各種語言。



結果顯示,GPT-4在測試的26種語言中,有24種的都優(yōu)于對比的其他語言模型(Chinchilla,PaLM),不僅僅限于英語,甚至是拉脫維亞語、威爾士語和斯瓦希里語等低資源語言GPT-4也成功拿下。



高級推理能力


而為了更好的展現GPT-4在推理能力上質的飛躍,OpenAI扒出了最新公開的奧林匹克競賽題、AP自由答題等試題,甚至于加上了2022-2023年版的模擬考試題,以增進對這兩種模型的理解。



測試的結果也顯而易見,GPT-4贏麻了。在律師模擬考試中,GPT-3排列末位10%左右,而GPT-4擠進了前10%左右??梢哉f對比GPT-4這個過于耀眼的優(yōu)等生,連曾經的“頂流”GPT-3.5都顯得有些黯然失色了。


功能增加


而對于月活九位數的ChatGPT用戶們而言,最關心的當然還是新功能的增加。


最大的改變就是不再只接受文本了!GPT-4具備處理文本和圖像的能力,用戶可指定各種視覺或語言任務。


它可根據由文本和圖像交替組成的輸入,生成自然語言、代碼等文本輸出。在生成帶文本和圖片的文檔、圖表或截圖方面,GPT-4與純文本輸入一樣出色,甚至還可利用測試時技術(如少量標注數據和思維鏈提示)提高性能。目前,就官網上給予的7個視覺輸入的例子展示來看,圖像輸入仍在研究預覽階段,未來可能會有更大的提升。


此外,GPT-4不僅可以處理更長的字符長度,其長度限制已提升至32K tokens,即能處理超過25000個單詞的文本,還能夠支持長格式內容的創(chuàng)建、擴展對話、文檔搜索和分析等應用。


安全性提升


在安全性方面,為了確保GPT-4回答的準確性和安全性,OpenAI公司與醫(yī)學、地緣政治等敏感領域的50余位專家合作,并改進了監(jiān)控框架。


與GPT-3.5相比,GPT-4的安全特性得到了顯著的改善,其緩解措施使模型響應禁止內容請求的可能性降低了82%。此外,根據OpenAI的政策,GPT-4對敏感請求(如醫(yī)療建議和自我傷害)的響應頻率提高了29%。


多項任務并行優(yōu)勢突出


如果只是簡單的對話,GPT-3.5和GPT-4之間的差別可能不太明顯,但當任務的復雜性達到一定閾值時,就能看出它們之間的區(qū)別。與GPT-3.5相比,GPT-4更可靠、更具創(chuàng)造力,并且可以處理更多微妙的指令差異。


02


如何使用GPT-4?


第一種方式:ChatGPT Plus用戶付費使用


在用戶端,目前只開放給了ChatGPT Plus用戶,顧名思義不支持免費使用,如果想要一睹為快,請先支付給官方每月20美元獲取高級訪問權限。即便付費后,提問也受到了一定的限制,每4小時內不能發(fā)送超過100條信息。


第二種方式:開發(fā)者加入waitlist


開發(fā)者可以可以申請GPT-4 API獲取訪問權,待候補名單通過后,可以把 AI 集成到自己的應用程序中,同時 OpenAI 將對約 750 個單詞的提示收取約 3 美分,對約 750 個單詞的回復收取 6 美分。


第三種方式:參與OpenAI Evals


在OpenAI開源的用于自動評估AI模型性能的框架OpenAI Evals中,提供了高質量貢獻,官方會給予你GPT-4的訪問權。






更多精彩內容請關注公眾號:BFT機器人


本文為原創(chuàng)文章,版權歸BFT機器人所有,如需轉載請與我們聯系。若您對該文章內容有任何疑問,請與我們聯系,將及時回應。




GPT-4:顫抖吧人類!請接受生產力又一里程碑式的飛躍!的評論 (共 條)

分享到微博請遵守國家法律
建湖县| 垫江县| 宜良县| 北安市| 合水县| 浦北县| 曲松县| 南京市| 高唐县| 洛南县| 韶山市| 彩票| 太白县| 长武县| 额敏县| 孝昌县| 永城市| 庄浪县| 信宜市| 读书| 右玉县| 桦甸市| 乡城县| 江孜县| 天门市| 丹江口市| 闸北区| 鹤岗市| 通辽市| 双辽市| 晋中市| 高密市| 房产| 科技| 农安县| 白玉县| 雷山县| 贵港市| 拜城县| 湟源县| 永昌县|