微軟154頁GPT-4報(bào)告研究(一)

寫在前面的話:這是一篇個人向的解讀文章,并非專業(yè)性解讀。
視頻版的做過,但短視頻講得比較粗略,簡單了解可以看視頻

但詳細(xì)說明還得靠文字,今天先大概提幾個報(bào)告里讓我印象最深刻的例子吧,目前還不能把文檔發(fā)給GPT4來看,否則這篇文章都可以讓GPT4自己來寫了,期待那天到來,當(dāng)然目前應(yīng)該有了折中辦法,據(jù)說是能讓GPT4聯(lián)網(wǎng)看數(shù)據(jù),我明天會具體研究下。
再次感嘆,什么時候OpenAI趕緊把4.0版本全部放出來,現(xiàn)在的閹割版確實(shí)吊人胃口,書歸正傳。
這篇論文一共有10章,分別是介紹、多模態(tài)和跨學(xué)科構(gòu)成、編碼、數(shù)學(xué)能力、與世界的互動、與人類的互動、辨別能力、強(qiáng)調(diào)的自回歸結(jié)構(gòu)的局限性、社會影響、方向和結(jié)論。再往后就是一些例子。
其實(shí)從目錄上也可以看到,基本是從幾個方面對GPT4進(jìn)行了測試和總結(jié),而且回到標(biāo)題:GPT-4的早期實(shí)驗(yàn),所以不是很能確定此時此刻的GPT到底進(jìn)階到什么程度了。
篇幅問題我挑幾個我覺得有意思的例子出來,也讓大家可以最快的時間管中窺豹一下,當(dāng)然有耐心的朋友可以直接去讀原文,需要的私我一下就行,或者去原視頻置頂評論里直接拿。
一、決策

可以看看這個例子,就能很直接體現(xiàn)出4.0版本較3.5版本的進(jìn)步,這也是我在用ChatGPT和GPT4的時候最大的感受,很多問題對于ChatGPT來講會直接告訴你無法解答,然后如果追問下去,它會非常努力去找到一個答案(且不說合不合理)
但是當(dāng)問到GPT4的時候,他會給出一個非常讓人信服的答案,而且答案會具體很多,以及當(dāng)遇到操作性的問題時,人們甚至可以腦補(bǔ)出操作畫面。上面這個放雞蛋的例子就是一個很好的說明。我基本可以預(yù)料到其他家的同類型產(chǎn)品對于這個問題的回答會多么“糟糕”。
二、數(shù)學(xué)題

來看這個例子,特別要注意的是下面的小字部分:例子中的問題是由作者寫的,而不是從網(wǎng)上獲取的。這樣做是為了確保模型不太可能 "記住 "了答案。
所以基于此,可以回答有些朋友一個很簡單的問題:GPT的答案和搜索引擎的答案有什么區(qū)別,即:GPT是在真實(shí)地計(jì)算、編寫答案,而不是搜索數(shù)據(jù)庫中已有的答案。而在此之前,ChatGPT在文案方向的讓人驚訝和它在數(shù)學(xué)方面讓人頭疼似乎是硬幣的正反兩面,只不過這次GPT-4的數(shù)學(xué)能力讓人覺得這樣的進(jìn)步簡直讓人稱奇。
我自己也拿一些數(shù)學(xué)題測試過GPT-4,結(jié)果都是讓人非常滿意(至少說明GPT-4的數(shù)學(xué)能力已經(jīng)超越我了)我們引用這段實(shí)驗(yàn)緊接著后面的一個評價:GPT-4抓住了問題的關(guān)鍵,并對問題進(jìn)行了合理的數(shù)學(xué)重新表述。
三、了解情緒

接下來看看一看在情緒方面的解釋,這里不得不提到一點(diǎn),我在直播的時候與一位朋友互動,以下是當(dāng)時的問和答:

我不知道大家看完這段的感受是什么,至少我回想起自己高中階段的時候,當(dāng)時如果我有類似的問題的話,身邊幾乎沒有一個人能夠給出如此全面的建議,可能不同角色會給出其中幾條的建議,而更厲害的地方在于,接下來我可以針對里面的每一點(diǎn)進(jìn)行更加細(xì)致的詢問以得到更具體的操作和方法。
由于篇幅問題,本次作為微軟154頁GPT-4研究報(bào)告的第一篇,主要節(jié)選了讓我印象最深刻的三個例子來讓大家感受一下GPT-4的“過人之處”,其實(shí)在里面還有大量的實(shí)例,涵蓋了人文、社會、數(shù)學(xué)、法律等方面,未來有時間可以繼續(xù)和大家分享。