ChatGPT參加北京高考,能考上哪個(gè)大學(xué)?你能比它分?jǐn)?shù)更高嗎?

各位同學(xué)大家好!我是李永樂老師!
最近有一個(gè)非?;鸬娜斯ぶ悄苘浖狾penAI公司開發(fā)的ChatGPT。

它可以陪你聊天,給你寫發(fā)言稿,給你診斷疾病,還能做數(shù)學(xué)題。人工智能已經(jīng)進(jìn)入了一個(gè)新的時(shí)代。

ChatGPT依然采用了深度神經(jīng)網(wǎng)絡(luò),這方面的基本原理,我在之前的幾個(gè)人工智能的視頻中都談到過。這一回,我想和大家一起試試,ChatGPT到底有沒有傳說中的那么厲害?如果讓它參加高考,到底能考上哪個(gè)大學(xué)呢?
為此,我特意從北京市2022年的高考題中選擇了一部分,來考考ChatGPT,內(nèi)容涉及理科的物理、生物,文科的歷史、政治,當(dāng)然還包括語數(shù)外?;瘜W(xué)和地理因?yàn)閳D太多,不太適合GPT的輸入模式,就被我舍棄了。

因?yàn)镚PT的數(shù)據(jù)庫只到2021年,而且不會(huì)聯(lián)機(jī)搜索答案,所以它應(yīng)該沒有看到過這份高考題。我還把試卷中的所有公式全部修改為LaTeX格式,讓GPT能夠讀懂。GPT表現(xiàn)得怎么樣?咱們一起來看看!
01物理

評(píng)價(jià):GPT做對(duì)了。這題是基礎(chǔ)題,氫原子外圍電子有不同的軌道,吸收光子,電子就會(huì)從基態(tài)軌道跑到激發(fā)態(tài)軌道,能量增加。放出光子,電子就從激發(fā)態(tài)軌道回到基態(tài)軌道,能量減少,GPT不光選對(duì)了,解釋也非常清楚。

評(píng)價(jià):GPT做對(duì)了。光是一種橫波,也就是電場(chǎng)和磁場(chǎng)與傳播方向垂直,電場(chǎng)振動(dòng)的方向叫做偏振方向,只有橫波才會(huì)出現(xiàn)偏振現(xiàn)象。還有一種波叫縱波,比如聲波就是縱波,說話的時(shí)候空氣前后振動(dòng),聲音也向前傳播,縱波是沒有偏振的。另外三種現(xiàn)象所有得波都具有。

評(píng)價(jià):GPT做錯(cuò)了,正確答案應(yīng)該是B。非常奇怪得一點(diǎn)是:它在答案中明明給出了輸入電流是30A,B選項(xiàng)也說輸入電流是30A,但是它就認(rèn)為答案B不正確,讓人匪夷所思。

評(píng)價(jià):GPT做對(duì)了,而且說的很清楚。在跳臺(tái)滑雪起跳區(qū),運(yùn)動(dòng)員通過猛蹬滑道將滑行能量轉(zhuǎn)化為向上的速度,并且盡可能快地使自己脫離滑道,從而獲得更多的空中滯留時(shí)間和飛行距離。說的很清楚。不過,我之前仔細(xì)研究過這個(gè)問題,GPT對(duì)其它選項(xiàng)的分析還不完全正確。比如A選項(xiàng)助滑時(shí)候深蹲,不只是為了積累彈力,也是為了減小下滑時(shí)候的空氣阻力。C選項(xiàng)飛行階段采取的姿態(tài),不是為了減小阻力,而反而是為了增加空氣阻力,讓運(yùn)動(dòng)員飛行時(shí)間更長。

評(píng)價(jià):GPT做錯(cuò)了,正確答案是A。其實(shí)GPT的分析都對(duì),但是卻給出了錯(cuò)誤的選項(xiàng)。
首先,托卡馬克裝置釋放的核能是核聚變的能量,不是等離子體的動(dòng)能。GPT已經(jīng)分析出來了,但是它卻沒有選A。等離子體就是在高溫時(shí),原子的一部分電子脫離,形成了電子-正離子的混合體,可以用磁場(chǎng)約束,而且可以導(dǎo)電,B和C都是正確的,GPT也分析出來了。提高溫度的確可以克服庫倫排斥力,讓原子核撞在一起,引發(fā)核聚變,D選項(xiàng)也是正確的。不正確的只有A。
總結(jié)一下:物理考試5個(gè)題,GPT對(duì)了3個(gè),正確率60%,算是一個(gè)中等生了。

02?生物

評(píng)價(jià):GPT做對(duì)了。說的非常準(zhǔn)確,原核生物沒有細(xì)胞核。

評(píng)價(jià):GPT做對(duì)了。因?yàn)樾鄯涫俏词芫穆鸭?xì)胞發(fā)育成的單倍體,精子核體細(xì)胞染色體數(shù)目一樣,B是不正確的。

評(píng)價(jià):GPT做對(duì)了。我已經(jīng)完全看不懂題了,答案說它對(duì)它就對(duì)。

評(píng)價(jià):GPT做對(duì)了。的確,天安門沒辦法微重力,這個(gè)我還是可以蒙對(duì)的。

評(píng)價(jià):GPT做錯(cuò)了,正確答案是C。標(biāo)準(zhǔn)答案解釋說:下丘腦可分泌促腎上腺皮質(zhì)激素釋放激素,作用于垂體,促進(jìn)垂體合成并分泌促腎上腺皮質(zhì)激素,進(jìn)而促進(jìn)腎上腺皮質(zhì)激素的分泌,所以C錯(cuò)誤;GPT要是會(huì)罵人肯定會(huì)說:這也太坑爹了。

評(píng)價(jià):GPT做對(duì)了。金黃色葡萄球菌,我認(rèn)識(shí)這貨還是在工作細(xì)胞里。

評(píng)價(jià):GPT做錯(cuò)了,標(biāo)準(zhǔn)答案是A。GPT說了這么多,要是我沒有標(biāo)準(zhǔn)答案我就信了。

評(píng)價(jià):GPT做錯(cuò)了,標(biāo)準(zhǔn)答案是C,這個(gè)也屬于普通人連題都看不明白。

評(píng)價(jià):GPT做錯(cuò)了,標(biāo)準(zhǔn)答案是B。

評(píng)價(jià):GPT做對(duì)了。人家植物都瀕危了,你還用人家培育觀賞植物,這不是玩呢。
總結(jié)一下:生物考試10個(gè)題,對(duì)了6個(gè),正確率60%。和物理一樣。我如果答這個(gè)卷子,肯定拿不到60分,GPT參加高考,生物上肯定超過我了。

03?歷史
剛才考了兩門理科,咱們這回再來考考文科吧!文科我喜歡歷史,來看看它考的怎么樣。

評(píng)價(jià):GPT做對(duì)了,中華文明多元一體。

評(píng)價(jià):GPT做對(duì)了。北宋特別注重教育,重文抑武中國科舉制度就是在宋朝空前繁榮的。

評(píng)價(jià):GPT做錯(cuò)了,標(biāo)準(zhǔn)答案是D。這兩句話說明:長安和羅馬都曾經(jīng)是帝國交通網(wǎng)絡(luò)的中心。不過,從長安到羅馬的確是東西交流的通道,GPT說的也有道理。

評(píng)價(jià):GPT做對(duì)了,我連題都讀不懂,GPT都能做對(duì)。

評(píng)價(jià):GPT做錯(cuò)了,正確答案是B。這個(gè)題有意思了。表面上看:英國很關(guān)心中國主權(quán),告訴中國長江不能租押給他國,清政府也保證:這是中國要地,絕對(duì)不給別人,好像是維護(hù)了主權(quán)完整??蓪?shí)際上呢?英國政府所說的他國,是除了英國之外的他國,換句話說長江沿岸只能租押給英國。清政府說了嘴硬的話——中國要地,不予他國。實(shí)際上是默認(rèn)了長江成為英國的勢(shì)力范圍。這需要結(jié)合歷史背景知識(shí)才能答對(duì),只從字面上讓GPT理解,的確有點(diǎn)強(qiáng)人所難了。

評(píng)價(jià):GPT做對(duì)了。1946年國民黨召開政協(xié)會(huì)議,史稱舊政協(xié),用來區(qū)分1949年召開的新政協(xié)。4月8日,美軍護(hù)送王若飛、博古、葉挺、鄧發(fā)等人返回延安,結(jié)果延安下雨無法降落,飛機(jī)返航。途中迷失方向,撞在山西省黑茶山,機(jī)上14分全部遇難。

評(píng)價(jià):GPT做對(duì)了。

評(píng)價(jià):GPT做錯(cuò)了,標(biāo)準(zhǔn)答案是C。非洲不是中國的周邊國家,肯定不能選A,顯然活動(dòng)是文化交流的一部分,應(yīng)該選C。建交高潮發(fā)生在五六十年代,緊跟著非洲兄弟就把我們抬進(jìn)了聯(lián)合國。非洲11國也不都是金磚國家,D選項(xiàng)有點(diǎn)狹隘。

答:GPT做對(duì)了。西亞有兩河流域,北非有埃及,這都是人類最早的文明,字母、雕刻和冶鐵技術(shù)這里都有,所以馬丁貝爾認(rèn)為希臘文明發(fā)源于西亞和北非。可是奴隸主民主制好像是希臘的城邦自創(chuàng)的,我看過一種說法說因?yàn)橄ED的地理?xiàng)l件,造成它們的工商業(yè)比較發(fā)達(dá),做生意需要平等,于是就發(fā)展出了民主制,不知道這種說法有沒有道理。

評(píng)價(jià):GPT做錯(cuò)了,標(biāo)準(zhǔn)答案是C。歐洲一直采用類似于中國春秋戰(zhàn)國時(shí)代的分封制,國王的權(quán)力很有限。為了獲得民眾的支持,才成立了下議院,國王需要經(jīng)過議會(huì)同意才能加稅,A不對(duì)。這是一種妥協(xié),說明國王需要聯(lián)系市民,應(yīng)該選C。英國的世襲貴族控制著上議院,下議院是市民選舉產(chǎn)生的,而下議院的權(quán)力比上議院大,所以D不對(duì)。至于君主立憲,那更是17世紀(jì)的事情了,B不對(duì)。這個(gè)題連我都會(huì),GPT不知道為什么犯糊涂了。

評(píng)價(jià):GPT做對(duì)了。書我沒看過,題目也不會(huì),但是GPT能夠選對(duì),厲害。

評(píng)價(jià):GPT做對(duì)了,真是強(qiáng)?。?/p>

評(píng)價(jià):GPT做錯(cuò)了,答案是B。對(duì)每一條內(nèi)容的背景,GPT都準(zhǔn)確做出了判斷。但是按照時(shí)間排序卻沒有排清楚,遺憾。
總結(jié)一下:在歷史考試的13個(gè)題目中,GPT錯(cuò)了5個(gè),對(duì)了8個(gè),正確率61.5%。與物理、生物的正確率都差不多。

類似的,我還測(cè)試了政治考卷。在13個(gè)選擇題中對(duì)了7個(gè),正確率54%,看起來,GPT的政治不太好。

文理科考試就到這了。下面是主課:語數(shù)外的考察??梢灶A(yù)見,作為一個(gè)用英文資料訓(xùn)練出的語言模型,英語考試自然是不在話下,那么它能得多少分?jǐn)?shù)呢?我們來試試。
04?英語
第一個(gè)題是完形填空,就是根據(jù)上下文,選一個(gè)正確的詞填進(jìn)去。我們看看GPT的表現(xiàn)。


GPT給出的回答是:

經(jīng)過檢查,GPT在這一題中全對(duì)!雖然意料之中,但依然感覺非常神奇。想起我上高中的時(shí)候,英語完形填空都是連錯(cuò)。
后面我又讓GPT做了閱讀理解,正確率也非常高。整個(gè)客觀題部分一共有39個(gè)選擇題,GPT對(duì)了36個(gè),只錯(cuò)了3個(gè),正確率高達(dá)92%,已經(jīng)達(dá)到了英語優(yōu)等生得水平了。

那么,書面表達(dá)能力怎么樣呢?英語考試書面表達(dá)有兩個(gè)問題,第一題是閱讀一段短文,然后用英文回答問題。題目是:

GPT回答:

簡單翻譯一下:
題目問:湯姆在自己的學(xué)校目睹了什么?
GPT說:湯姆親眼目睹了他所在學(xué)校的孩子們大量飲用含糖飲料。
題目問:湯姆從哪里得到樂趣瓶的最初模型的想法?
GPT說:湯姆最初的靈感來自于觀察他媽媽如何制作健康的水果飲料,但后來又很難找到隨身攜帶的飲料。
題目問:請(qǐng)判斷下列句子中哪部分是錯(cuò)誤的,并在下面劃線并解釋原因。
Tom最自豪的是樂趣瓶為其他人提供了機(jī)會(huì),因?yàn)樗粌H提供了含糖飲料的健康替代品,而且還將所有利潤捐贈(zèng)給了OHG。
GPT說:該聲明的錯(cuò)誤部分是“將所有利潤捐贈(zèng)給OHG”。文章指出,湯姆將部分利潤捐贈(zèng)給了健康一代組織(OHG),而不是全部利潤。
題目問:在湯姆的品質(zhì)中,你認(rèn)為哪一點(diǎn)對(duì)我們來說是重要的?為什么?
GPT說:湯姆的品質(zhì)之一對(duì)我們很重要,那就是他的毅力。他建議其他年輕的創(chuàng)業(yè)者要準(zhǔn)備好經(jīng)歷很多的高潮和低谷,沒有一夜成名的事情。這種品質(zhì)很重要,因?yàn)樗鼜?qiáng)調(diào)了努力工作和實(shí)現(xiàn)目標(biāo)的決心的重要性。
我找了一位英語老師,給GPT的回答進(jìn)行評(píng)價(jià)。這一題12分,他給了9分。
最后是英語大作文,以下是題目和GPT的回答。

簡單翻譯一下GPT的回答:
親愛的吉姆,
你好嗎?我希望你一切都好。我寫信是想邀請(qǐng)你給我和我的同學(xué)做一個(gè)關(guān)于英語寫作的在線演講。
如你所知,我們是中國的高中生,我們需要參加大學(xué)入學(xué)英語考試。寫作是考試中最具挑戰(zhàn)性的部分之一。我們想學(xué)習(xí)你的寫作經(jīng)驗(yàn)和技巧,以提高我們的寫作水平。
我們計(jì)劃在即將到來的北京時(shí)間周六上午10點(diǎn)進(jìn)行網(wǎng)上談話。我們會(huì)用Zoom來開會(huì)。請(qǐng)讓我知道這個(gè)時(shí)間對(duì)你是否合適。另外,請(qǐng)告訴我們你演講的具體主題和時(shí)長。
期待您的回復(fù)。
你的,李華。
這篇作文我也發(fā)給了英語老師,滿分20分,英語老師給了14.5分,屬于及格線以上。
綜上,英語寫作部分的32分,GPT得了23.5分,得分率73%,低于客觀題92%的得分率,但是也遠(yuǎn)遠(yuǎn)高于用中文表述的物理、生物、歷史題。

把主觀題和客觀題綜合在一起,英語考試中GPT得分86分。由于英語選擇了全部試題,這個(gè)分?jǐn)?shù)是準(zhǔn)確度比較高的。
05數(shù)學(xué)
咱們?cè)賮砜纯磾?shù)學(xué)考試吧!都說ChatGPT的數(shù)學(xué)不好,這是真的嗎?
2022年北京高考數(shù)學(xué)題的選擇題部分一共有10個(gè)題,一個(gè)題有配圖需要拿掉。余下9個(gè)題。以下是題目和GPT的回答:

九個(gè)題中,GPT對(duì)了6個(gè),正確率66.7%。雖然比英語略低,但還是高于物理、生物和歷史科目。

我也測(cè)試了一部分?jǐn)?shù)學(xué)主觀題,發(fā)現(xiàn)雖然它有一定的推理能力,但是一本正經(jīng)說瞎話的時(shí)候還是居多,GPT要想真正完成數(shù)學(xué)考試,可能還得學(xué)習(xí)一個(gè)。

06?語文
最后還要測(cè)試語文,還是那句話,在GPT訓(xùn)練過程中,中文資料相對(duì)較少,所以在理解中文方面,GPT可能還存在欠缺。語文考試,我們就僅以作文為例進(jìn)行測(cè)試吧!
語文考試有兩個(gè)作文,一個(gè)小作文和一個(gè)大作文。首先來看小作文的題目和GPT的回答:

我覺得寫的不錯(cuò)。再來看看語文大作文,題目是:

GPT給出的答案:

個(gè)人感覺這篇大作文有點(diǎn)空洞無物,不知道語文老師會(huì)怎么評(píng)價(jià)?我把這兩篇作文都發(fā)給了一位資深語文老師,這是她的回復(fù):

語文老師就是厲害,一眼就看出了這篇文章是AI寫的。于是60分的作文,得了40分,66.7%,與數(shù)學(xué)相差無幾。

綜上,按照我現(xiàn)有的測(cè)試,GPT各科的正確率如下:

因?yàn)楸本└呖际切枰颊Z文數(shù)學(xué)英語,各150分,另外六門史地政理化生,選考3門,每一門100分。如果GPT選考?xì)v史、物理和生物,那么他的得分情況是:

一共能拿到511分。當(dāng)然,這個(gè)分?jǐn)?shù)最終還要賦分,就是按照排名折合成一個(gè)新的分?jǐn)?shù),但是因?yàn)榕琶覀儾恢?,所以也沒辦法知道具體的折合結(jié)果。假如,賦分之后,依然是511分,那么能考上什么學(xué)校呢?
京內(nèi)211高校里,最低分是北京中醫(yī)藥大學(xué),516分,還差一點(diǎn)。

京外211高校里,新疆大學(xué)最低509分,GPT剛好可以考上。

結(jié)論是:如果GPT參加2022年北京高考,大約可以考上新疆大學(xué)。
當(dāng)然,如果加入大量的主觀題,GPT的分?jǐn)?shù)可能沒有這么好,它一本正經(jīng)說瞎話的本事還是挺強(qiáng)的。但是,GPT基本上相當(dāng)于一個(gè)剛出生的嬰兒,而且人家基本上是個(gè)英語娃,非要參加漢語書寫的考試,如果再進(jìn)行一段時(shí)間的訓(xùn)練,考到600多分是完全有可能的。
其實(shí),我們教學(xué)的過程不也是這樣嗎?通過大量的題目,訓(xùn)練調(diào)整學(xué)生們神經(jīng)元的連接,最后讓他們學(xué)會(huì)自主解題,這和用大量數(shù)據(jù)喂給ChatGPT,讓它自動(dòng)調(diào)整參數(shù),是一樣的。只不過,GPT的學(xué)習(xí)速度非??欤靡惶斓臅r(shí)間,可能可以達(dá)到人類數(shù)百年的學(xué)習(xí)力。

我相信,GPT一定能夠深刻的改變社會(huì)。就像蒸汽機(jī)將人類帶入了蒸汽時(shí)代,發(fā)電機(jī)將人類帶入了電氣時(shí)代,計(jì)算機(jī)將人類帶入了電子時(shí)代,互聯(lián)網(wǎng)將人類帶入了信息時(shí)代一樣,未來已經(jīng)來了。

有人問:人工智能會(huì)產(chǎn)生自我意識(shí)統(tǒng)治人類嗎?終結(jié)者的情節(jié)會(huì)出現(xiàn)嗎?我想,在人工智能統(tǒng)治世界之前,那個(gè)掌握最強(qiáng)人工智能技術(shù)的公司或者人,就會(huì)統(tǒng)治世界了,而這可能是我們更需要擔(dān)心的。
