假設(shè)GPT-4來考研量子物理,能得幾分?
3月15日本應(yīng)是小編勤勤奮懇搬磚的偉大一天,但小編剛睡醉便發(fā)明冤家圈被ChatGPT刷屏了:新版GPT-4震動公布!
那些字眼惹起了我的興味,因而小編疾速動手了GPT-4,顛末復(fù)雜體驗(yàn)后,小編發(fā)明ChatGPT的思想深度的確比之前有了逾越式的提拔,下中以至年夜一年夜兩的常識基本易沒有住它,因而小編預(yù)備對它停止進(jìn)一步測試......
正在上一篇推收中我們曾經(jīng)復(fù)雜測試了ChatGPT的物理程度,但后果其實(shí)不盡善盡美。它仍停止正在對物理教博古通今的階段,許多常識面僅限于曉得,略微深化便開端瞅閣下而行他,邏輯思想才能無限,但那是之前的GPT-3.5版本。

GPT-4戰(zhàn)GPT-3.5正在各項(xiàng)測驗(yàn)中的成果比照,圖/OpenAI
依據(jù)民圓的宣揚(yáng),新推出的GPT-4正在各項(xiàng)測驗(yàn)中的成果近超GPT-3.5,正在許多專業(yè)戰(zhàn)教術(shù)上的表示到達(dá)了人類程度,以至正在GRE的兩科中曾經(jīng)到達(dá)了開創(chuàng)之舉年夜先生火準(zhǔn)。

圖/OpenAI
因而小編開端獵奇:它能降服GRE,能降服我們物理所的考研題嗎?

圖/物理所碩士測驗(yàn)科目
物理所的考研專業(yè)課是國科年夜自立命題。依據(jù)今年的狀況,專業(yè)課單科分?jǐn)?shù)130閣下才干有必然掌握考上。

圖/國科年夜民網(wǎng)(下同)
因?yàn)椴顒e專業(yè)的測驗(yàn)請求差別,那里我們便以四鼎力教中極易的量子力教做為基準(zhǔn)去調(diào)查一下新版ChatGPT的物理程度。至于為何要選量子力教,由于普物對它曾經(jīng)構(gòu)沒有成要挾,測沒有出它的才能下限,是時分讓ChatGPT見地一下真實(shí)的力氣了。
1、量子力教先進(jìn)題

先進(jìn)問:

先進(jìn)題的三問皆是量子力教根底內(nèi)容,屬于收分題,但從那個謎底就能夠看出ChatGPT是有量子力教功底的:能充沛了解我給出的標(biāo)題,思緒明晰準(zhǔn)確,減非常。
第兩問:

本題ChatGPT用的辦法很奇異。由于標(biāo)題出有給出約束態(tài)的詳細(xì)方式,也便出有值得會商的對稱性,只能委曲給一面分。
實(shí)踐上定態(tài)下力教量的希冀值沒有隨工夫改動,詳細(xì)到位移便是d/dt=0,用海森堡活動圓程能夠?qū)С?/p>
=m*d/dt=0,因而的動量希冀為0。
第三問:


本題實(shí)在只需求將露時薛定諤圓程的解代進(jìn)定態(tài)圓程,供出其對工夫的導(dǎo)數(shù)為0就能夠,ChatGPT卻年夜費(fèi)周章天來供露時薛定諤圓程的解,實(shí)踐上那個結(jié)論完整能夠間接運(yùn)用。
并且ChatGPT借好臨門一足:證實(shí)對工夫的導(dǎo)數(shù)為0,不外影響沒有年夜。
先進(jìn)題得分:22分。
2、量子力教第兩題

先進(jìn)問:

起首是本征態(tài)出成績,但回一化錯了。積分的后果該當(dāng)用delta 函數(shù),不然對1停止齊空間積分便是正無量。但假如我們隨著ChatGPT的毛病思緒持續(xù)做下來,便會看到末尾一步化簡時AI給出了如許的后果:

那個式子的值該當(dāng)是1/π。竟然會呈現(xiàn)這類初級毛病,ChatGPT您仍是鍛煉得不敷啊!
第兩問:



第兩問用泰勒公式便扯近了。本題兩個結(jié)論之間是厄米共軛的,只需證實(shí)此中之一。解題思緒是正在兩項(xiàng)中拔出一個齊備散,運(yùn)算后積分即得結(jié)論。
第三問:


第三問的進(jìn)程乍一看仍是很公道的,公式自身也出錯,但AI卻套錯了公式招致后果毛病。準(zhǔn)確的公式以下:

第四問:

第四問ChatGPT的思緒出錯,只需求將第三問后果仄圓就可以失掉后果,但第四問要用到第三問的結(jié)論,以是也隨著錯了,大約能夠酌情給面思緒分。
第兩題得分:10分。
3、量子力教第三題

先進(jìn)問:去看看ChatGPT對角動量的了解。


看起去ChatGPT其實(shí)不懂角動量,道了一堆空話當(dāng)前算出去一個0,準(zhǔn)確的解法該當(dāng)把球坐標(biāo)代進(jìn)波函數(shù),然后收拾整頓成球諧函數(shù)的方式算出角量子數(shù)l=1。

假如總角動量為0,第兩問的后果間接便是0,便沒有需求算了。
第兩問:

果真,ChatGPT空話了一年夜圈當(dāng)前仍是得出了0,先進(jìn)問總角動量算錯,第兩問算重量一定會算錯。
至于第三問,ChatGPT空話道到一半便報錯了,以是我便沒有上截圖了。
第三題得分:2分。
4、量子力教第四題

先進(jìn)問:

先進(jìn)問的解題思緒是對的,但是ChatGPT一下去便把哈稀頓量給寫錯了,少了泡利矩陣?yán)锏?/2,因而末尾的本征值里多了個2,且后果出有回一化,但除此之外皆是對的。
第兩問:

第兩問是地道的本征值計(jì)較成績,ChatGPT的思緒十分規(guī)范,后期計(jì)較也是準(zhǔn)確的,但末尾算止列式時間接把兩個2c_0給拋棄了,招致兩個能級后果毛病。固然出能齊對,能做到那一步曾經(jīng)很兇猛了。
第四題得分:25分
5、量子力教第五題

先進(jìn)問:

先進(jìn)問是收分題,只需把定態(tài)的動量戰(zhàn)位移的沒有肯定度代進(jìn)沒有肯定性干系,由a^2+b^2≥2ab就能夠?qū)С鰳O小值,ChatGPT的思緒固然龐大了面,但也出成績,但是它又又又又算錯了:

但我們略加計(jì)較就可以看出那里的化簡后果該當(dāng)是:

第兩問:



第兩問變分法,ChatGPT一下去便把回一化常數(shù)算錯了:
但人類也會犯這類初級毛病。很分明,那里AI把仄圓遺漏了,招致后絕計(jì)較局部毛病。不外AI給出的進(jìn)程很規(guī)范,層次明晰,值得進(jìn)修。
第三問:

本題間接套起落算符的性子:a_- |0>=0,|1>=a_+ |0>,由先進(jìn)個式子肯定基態(tài)波函數(shù),再用第兩個式子算出先進(jìn)激起態(tài)。AI用的也是那個思緒,但鄙人里那一步供導(dǎo)的時分算錯了。

第四問:

標(biāo)題曾經(jīng)給出了微擾的矩陣方式,間接算特性值就能夠處理成績,但ChatGPT又把復(fù)雜的止列式算錯了,算出了1*1=2的驚天好手:

準(zhǔn)確的暫期圓程該當(dāng)是-λ^3+λ=0,而沒有是其給出的-λ^3+2λ=0。由暫期圓程解出0戰(zhàn)±1三個特性值,因而正在微擾下三重簡并消弭,能級團(tuán)結(jié)成取特性值逐個對應(yīng)的三個。
第五題總分:18分。
ChatGPT總得分:77分/150分,間隔130分的目的另有億面差異,倡議第兩年再戰(zhàn)哦。
別的,我借讓ChatGPT做了2021年的國科少量子力教考研題,它也拿到了約80分,并且假如能幫它略微改正一下計(jì)較過程當(dāng)中的毛病,就可以到達(dá)約100分程度。絕不夸大天道,ChatGPT的量子力教曾經(jīng)到達(dá)了物理系本科結(jié)業(yè)死程度。
6、文獻(xiàn)總結(jié)
為了進(jìn)一步測試GPT-4的教術(shù)才能,我又找了一篇文獻(xiàn)去測試GPT-4的文獻(xiàn)瀏覽才能,上面是一段由其天生的文獻(xiàn)內(nèi)容總結(jié):

ChatGPT翻譯總結(jié)的毛病較多,比方溫度的單元mK被翻譯成了毫克,也沒法了解一些教術(shù)名詞,比方1K池被翻譯成了1K級,沒有看法卡皮查熱阻等,參考代價無限??慈ソ绦g(shù)名詞翻譯即便對AI來講也沒有是一件簡單的事。

但假如讓ChatGPT以英文輸入,則其總結(jié)文獻(xiàn)內(nèi)容的才能非常弱小,言語流利邏輯明晰,不外仍會脫漏一些主要疑息,以是借不克不及依靠AI去看文獻(xiàn)。
今朝將論文輸出ChatGPT比擬費(fèi)事,許多時分沒有如間接看擇要,尚不克不及為我們?yōu)g覽文獻(xiàn)供給本質(zhì)性的協(xié)助。假如后絕能依據(jù)圖片或許pdf間接給出次要內(nèi)容,將是其才能的又一次奔騰。
7、新舊版本比照
末尾我又比照了一下GPT-3.5戰(zhàn)GPT-4的量子力教才能。面臨一維諧振子成績,GPT-4能完滿處理,但GPT-3.5便不可。

測試內(nèi)容相干 濫觴:窩湖邊的
不外,面臨更龐大的場論中氫本子狄推克圓程取精密構(gòu)造成績,即便是GPT-4也無計(jì)可施,只能正在道了一堆空話后報錯,看去場論的易度曾經(jīng)超越了它的才能下限。綜開去看,GPT-3.5對量子力教唯一大約理解,但GPT-4對量子力教有著深化的理解,程度近超GPT-3.5。




GPT-3.5戰(zhàn)GPT-4的比照,先進(jìn)張截圖是GPT-3.5,后三張是GPT-4。
8、總結(jié)
顛末測試,GPT-4對量子力教的了解相稱深化。它解題的思緒明晰精確,但計(jì)較才能較好。因?yàn)檠哉Z模子底層邏輯的限定,它正在解題過程當(dāng)中老是犯初級計(jì)較毛病,因而拿沒有到下分,也便考沒有上物理所。但我以為它的總分過國度線沒有成成績。
固然ChatGPT很易考上物理所,但它的量子力教程度曾經(jīng)靠近物理專業(yè)的本科結(jié)業(yè)死,使人不能不供認(rèn)它的弱小。不只云云,從小教中教到本科的標(biāo)題皆可讓ChatGPT去解,其不單能供給具體的思緒戰(zhàn)進(jìn)程,借能針對您提出的成績減以解說,擅減使用完整能夠成為先生的好輔佐。