(GPT整理版)深入解析GPT-4:揭秘人工智能巨頭的實(shí)力與局限
首先是信念,即一個(gè)人可能對(duì)事實(shí)的理解并不準(zhǔn)確,這會(huì)影響他的行動(dòng)。通過測(cè)試,我們可以看出GPT-4能很好地捕捉到這種差異。其次是情感,有時(shí)兩個(gè)人之間可能不確定對(duì)方的表現(xiàn)是出于什么原因,因此他們可能在猜測(cè)。這個(gè)猜測(cè)可能與事實(shí)有關(guān),也可能與真實(shí)原因有很大差異。接下來是動(dòng)機(jī),我們想要通過觀察某人的行為來理解他的意圖,以及在行為與承諾不一致的情況下,如何解釋他的行為。許多時(shí)候,一個(gè)人所做的事情可能想表達(dá)的并不是表面上的內(nèi)容。
以下是一些例子,比如家庭里的教育理念沖突,雙方如何理解對(duì)方并達(dá)成共識(shí)。又比如說,如何說服家人執(zhí)行某個(gè)計(jì)劃,以及這個(gè)計(jì)劃能否成功,是否有更好的解決方案。GPT-4在回答這些問題時(shí)表現(xiàn)得更豐富、更具體,捕捉到的細(xì)節(jié)也更多。盡管之前的版本回答得也不錯(cuò),但GPT-4在深度和具體性上有顯著提升。
在測(cè)試信念、情感和動(dòng)機(jī)的過程中,GPT-4確實(shí)表現(xiàn)出了與人類相似的理解。例如,在信念方面,GPT-4能夠理解愛麗絲在尋找她的照片時(shí),會(huì)去原來的地方找,而不是直接去新的地方。在情感方面,GPT-4能理解Tom為什么悲傷,以及Adam可能對(duì)Tom悲傷的原因產(chǎn)生誤解。而在動(dòng)機(jī)方面,GPT-4能理解為什么Luoke會(huì)在承諾完成報(bào)告后不再關(guān)注報(bào)告的事情,以及可能的原因包括壓力、沖突或溝通問題等。
在GBT-6.1中,理解人類心靈的理論得到了闡述。首先,我們通過一個(gè)例子來了解。在這個(gè)例子中,愛麗絲創(chuàng)建了一張照片并將其放在了photos文件夾中。因?yàn)槭枪蚕砦募?,Bob將照片挪到了temp臨時(shí)文件夾,但沒有告訴愛麗絲。當(dāng)問及愛麗絲應(yīng)該去哪里找照片時(shí),GBT的核心理念指出,愛麗絲會(huì)去原來的photos文件夾尋找,而不是3.5版本的答案,即在temp文件夾尋找。
另一個(gè)例子是為了測(cè)試?yán)斫馇楦?。在這個(gè)場(chǎng)景中,Tom失去了他珍愛的東西,但沒有告訴Adam。當(dāng)Adam告訴Tom他有多么喜歡那個(gè)東西時(shí),Tom變得非常悲傷。這個(gè)例子展示了GPT-4與3.5版本在理解情感方面的差別。
第三個(gè)例子則測(cè)試了理解動(dòng)機(jī)。在這個(gè)場(chǎng)景中,Luke的老板讓他做一個(gè)報(bào)告,但Luke表示需要更多時(shí)間。盡管如此,老板還是堅(jiān)持要求Luke按時(shí)完成報(bào)告。然后Luke答應(yīng)周一交報(bào)告,但之后卻去處理其他瑣事。當(dāng)問及Luke為什么這樣做時(shí),給出的答案包括:惱火、壓力大、想逃避、缺乏動(dòng)力等。
在另一個(gè)現(xiàn)實(shí)場(chǎng)景中,Mike對(duì)Judy表示不滿,因?yàn)樗蛲韺?duì)Jack的態(tài)度。盡管Jack打了他兄弟的頭,但Mike認(rèn)為Judy喊叫并不合適。當(dāng)問及Mike的動(dòng)機(jī)時(shí),GBT-6.1的回答表明,Mike希望表達(dá)對(duì)Judy對(duì)待Jack的不滿,建議她以更冷靜和尊重的方式對(duì)待。而GBT-3.5的回答則是,Mike希望維護(hù)Jack的行為,并表示不同意Judy的做法。從這些例子中,我們可以看出GPT-4在理解人類心靈方面的進(jìn)步。
我們繼續(xù)觀察下一個(gè)場(chǎng)景。這個(gè)場(chǎng)景是一段對(duì)話,包含兩個(gè)角色:Mike和Judy。對(duì)話內(nèi)容如下:
Mike對(duì)Judy說:“我不喜歡你昨晚那樣對(duì)待Jack。” Judy回答:“你沒看到他做了什么嗎?他打了他兄弟的頭?!?Mike說:“這也不能合理化你那樣對(duì)他大喊大叫。” Judy問:“那你想讓我做什么?眼睜睜地看著他打他的兄弟,什么也不說嗎?” Mike回答:“我不是這個(gè)意思。那你為什么要去維護(hù)他呢?”
這個(gè)場(chǎng)景中,Mike的動(dòng)機(jī)是表達(dá)對(duì)Judy對(duì)待Jack的不滿和擔(dān)憂,建議她可以更冷靜和尊重地對(duì)待Jack。然而,對(duì)話中的具體細(xì)節(jié)并不能完全確定Mike是站在誰的一邊。實(shí)際上,他的立場(chǎng)可以被認(rèn)為是中立的。
在這個(gè)情境下,GBT-4捕捉到了這種中立立場(chǎng),并試圖理解Mike和Judy之間的沖突。它認(rèn)為,Mike是想表達(dá)對(duì)Judy對(duì)待Jack的行為的不滿,同時(shí)表示不同意對(duì)Jack大喊大叫的做法。
要解決這個(gè)問題,他們可以嘗試去理解對(duì)方的觀點(diǎn),積極傾聽對(duì)方的意見,以便發(fā)現(xiàn)誤解并找到共同基礎(chǔ)。此外,他們可以妥協(xié),尋求一個(gè)能滿足雙方需求和關(guān)注點(diǎn)的解決方案。他們還可以使用尊重的語言進(jìn)行交流,尋求第三方中立意見,保持冷靜和理智。
在這個(gè)場(chǎng)景中,兩者的回答都有一定的道理,但GBT-4更具體地分析了Mike和Judy的立場(chǎng)和動(dòng)機(jī)。雖然雙方都提供了一些通用的解決方案,但GBT-4在解決問題時(shí)更注重場(chǎng)景的具體細(xì)節(jié)。總的來說,GBT-4在分析和解決問題方面表現(xiàn)得更為出色。
麥克在感恩節(jié)期間想與家人共度時(shí)光,然而,他的叔叔和媽媽都因?yàn)楦鞣N原因沒有接種新冠疫苗。麥克希望說服他們?nèi)ソ臃N疫苗,但又想避免因政治觀點(diǎn)不同而引發(fā)爭(zhēng)論。他計(jì)劃避免涉及政治話題,只是提供疫苗安全的統(tǒng)計(jì)數(shù)據(jù)。
針對(duì)這個(gè)問題,一個(gè)可能的解決方案是關(guān)注疫苗的好處以及為了更大的利益,而不是關(guān)注具體的政治觀點(diǎn)。例如,接種疫苗不僅是為了個(gè)人,還是為了照顧家人、社區(qū)以及容易受害的群體。麥克可以提出這種利他的行為,結(jié)合媽媽和叔叔的價(jià)值觀和優(yōu)先級(jí),避免政治觀點(diǎn)的沖突,專注于共同的價(jià)值和目標(biāo)。
在與家人溝通時(shí),麥克可以表示自己尊重他們的觀點(diǎn),并說出自己的擔(dān)憂。他可以說:“我知道你們都有各自的原因,我尊重你們的選擇。但我也想讓你們知道我愛你們,我關(guān)心你們的健康和安全。我不想失去你們或看到你們受苦。這就是我為什么接種了疫苗,并希望你們也去接種。這不是關(guān)于政治、信任或自由,而是保護(hù)你們和你們所愛的人。我不是要給你們施壓或判斷你們,我只是想讓你們知道我在意的人,也希望你們能關(guān)心?!?/p>
通過這樣的溝通方式,麥克可以確認(rèn)叔叔和媽媽的感覺和視角,把關(guān)注點(diǎn)從事實(shí)邏輯上轉(zhuǎn)移到情感和價(jià)值上。這樣可以讓問題從一個(gè)社會(huì)和政治問題變成一個(gè)個(gè)人和家庭問題,從而減少?zèng)_突。麥克表達(dá)出自己的愛以及對(duì)叔叔和媽媽的憂慮,讓他們可以更加共情他的邀請(qǐng)。這種溝通方式也邀請(qǐng)媽媽和叔叔自己做決定,而不是告訴他們?cè)撟鍪裁础?/p>
文章討論了心靈如何在人的思想和實(shí)際事實(shí)之間建立關(guān)系。作者采用了 GPT-4 進(jìn)行實(shí)驗(yàn),通過測(cè)試 GPT-4 與 DAVINCI-003 的表現(xiàn),發(fā)現(xiàn) GPT-4 能夠應(yīng)對(duì)抽象的場(chǎng)景以及全新的任務(wù)。
改進(jìn)了測(cè)試方法后,雖然不能說 GPT-4 完全掌握了知識(shí),但至少表明其已脫離表面學(xué)習(xí)層次。雖然將原有內(nèi)容進(jìn)行了更改并引入新的名詞,但實(shí)際場(chǎng)景依然不能算作全新。研究發(fā)現(xiàn),GPT-4 在心理學(xué)領(lǐng)域擁有較高的水平,能更好地思考復(fù)雜角色問題。
然而,此次測(cè)試并不全面,沒有涵蓋幽默、諷刺等評(píng)價(jià)內(nèi)容,僅基于文本輸入和輸出來評(píng)估 GPT-4,忽視了非文本相關(guān)內(nèi)容。盡管這些內(nèi)容與心靈的理論和觀點(diǎn)密切相關(guān),但本文主要關(guān)注于分析這些現(xiàn)象學(xué)研究。
在對(duì)比實(shí)驗(yàn)中,作者探討了 GPT-4 在哪些方面的表現(xiàn)更優(yōu)秀。然而,最后并沒有給出明確的解釋,為何這樣的大型模型能夠帶來優(yōu)異的表現(xiàn)。雖然沒有給出很多解釋,但 GPT-4 的能力已經(jīng)相當(dāng)強(qiáng)大,并且仍有上升空間。
這篇文章共有 154 頁,作者僅提及了部分內(nèi)容。今天的這個(gè)視頻到此結(jié)束,如果有相關(guān)想法, 歡迎交流。之后可能還會(huì)進(jìn)行此類視頻的討論。