手機(jī)站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 生活 »日常 » ChatGPT參加北京高考，能考上哪個(gè)大學(xué)？你能比它分?jǐn)?shù)更高嗎？

ChatGPT參加北京高考，能考上哪個(gè)大學(xué)？你能比它分?jǐn)?shù)更高嗎？

2023-03-04 14:27 作者:李永樂老師官方 0人讀過 | 我要投稿

各位同學(xué)大家好！我是李永樂老師！

最近有一個(gè)非?；鸬娜斯ぶ悄苘浖狾penAI公司開發(fā)的ChatGPT。

它可以陪你聊天，給你寫發(fā)言稿，給你診斷疾病，還能做數(shù)學(xué)題。人工智能已經(jīng)進(jìn)入了一個(gè)新的時(shí)代。

ChatGPT依然采用了深度神經(jīng)網(wǎng)絡(luò)，這方面的基本原理，我在之前的幾個(gè)人工智能的視頻中都談到過。這一回，我想和大家一起試試，ChatGPT到底有沒有傳說中的那么厲害？如果讓它參加高考，到底能考上哪個(gè)大學(xué)呢？

為此，我特意從北京市2022年的高考題中選擇了一部分，來考考ChatGPT，內(nèi)容涉及理科的物理、生物，文科的歷史、政治，當(dāng)然還包括語數(shù)外?；瘜W(xué)和地理因?yàn)閳D太多，不太適合GPT的輸入模式，就被我舍棄了。

因?yàn)镚PT的數(shù)據(jù)庫只到2021年，而且不會(huì)聯(lián)機(jī)搜索答案，所以它應(yīng)該沒有看到過這份高考題。我還把試卷中的所有公式全部修改為LaTeX格式，讓GPT能夠讀懂。GPT表現(xiàn)得怎么樣？咱們一起來看看！

01物理

評(píng)價(jià)：GPT做對(duì)了。這題是基礎(chǔ)題，氫原子外圍電子有不同的軌道，吸收光子，電子就會(huì)從基態(tài)軌道跑到激發(fā)態(tài)軌道，能量增加。放出光子，電子就從激發(fā)態(tài)軌道回到基態(tài)軌道，能量減少，GPT不光選對(duì)了，解釋也非常清楚。

評(píng)價(jià)：GPT做對(duì)了。光是一種橫波，也就是電場(chǎng)和磁場(chǎng)與傳播方向垂直，電場(chǎng)振動(dòng)的方向叫做偏振方向，只有橫波才會(huì)出現(xiàn)偏振現(xiàn)象。還有一種波叫縱波，比如聲波就是縱波，說話的時(shí)候空氣前后振動(dòng)，聲音也向前傳播，縱波是沒有偏振的。另外三種現(xiàn)象所有得波都具有。

評(píng)價(jià)：GPT做錯(cuò)了，正確答案應(yīng)該是B。非常奇怪得一點(diǎn)是：它在答案中明明給出了輸入電流是30A，B選項(xiàng)也說輸入電流是30A，但是它就認(rèn)為答案B不正確，讓人匪夷所思。

評(píng)價(jià)：GPT做對(duì)了，而且說的很清楚。在跳臺(tái)滑雪起跳區(qū)，運(yùn)動(dòng)員通過猛蹬滑道將滑行能量轉(zhuǎn)化為向上的速度，并且盡可能快地使自己脫離滑道，從而獲得更多的空中滯留時(shí)間和飛行距離。說的很清楚。不過，我之前仔細(xì)研究過這個(gè)問題，GPT對(duì)其它選項(xiàng)的分析還不完全正確。比如A選項(xiàng)助滑時(shí)候深蹲，不只是為了積累彈力，也是為了減小下滑時(shí)候的空氣阻力。C選項(xiàng)飛行階段采取的姿態(tài)，不是為了減小阻力，而反而是為了增加空氣阻力，讓運(yùn)動(dòng)員飛行時(shí)間更長。

評(píng)價(jià)：GPT做錯(cuò)了，正確答案是A。其實(shí)GPT的分析都對(duì)，但是卻給出了錯(cuò)誤的選項(xiàng)。

首先，托卡馬克裝置釋放的核能是核聚變的能量，不是等離子體的動(dòng)能。GPT已經(jīng)分析出來了，但是它卻沒有選A。等離子體就是在高溫時(shí)，原子的一部分電子脫離，形成了電子-正離子的混合體，可以用磁場(chǎng)約束，而且可以導(dǎo)電，B和C都是正確的，GPT也分析出來了。提高溫度的確可以克服庫倫排斥力，讓原子核撞在一起，引發(fā)核聚變，D選項(xiàng)也是正確的。不正確的只有A。

總結(jié)一下：物理考試5個(gè)題，GPT對(duì)了3個(gè)，正確率60%，算是一個(gè)中等生了。

02?生物

評(píng)價(jià)：GPT做對(duì)了。說的非常準(zhǔn)確，原核生物沒有細(xì)胞核。

評(píng)價(jià)：GPT做對(duì)了。因?yàn)樾鄯涫俏词芫穆鸭?xì)胞發(fā)育成的單倍體，精子核體細(xì)胞染色體數(shù)目一樣，B是不正確的。

評(píng)價(jià)：GPT做對(duì)了。我已經(jīng)完全看不懂題了，答案說它對(duì)它就對(duì)。

評(píng)價(jià)：GPT做對(duì)了。的確，天安門沒辦法微重力，這個(gè)我還是可以蒙對(duì)的。

評(píng)價(jià)：GPT做錯(cuò)了，正確答案是C。標(biāo)準(zhǔn)答案解釋說：下丘腦可分泌促腎上腺皮質(zhì)激素釋放激素，作用于垂體，促進(jìn)垂體合成并分泌促腎上腺皮質(zhì)激素，進(jìn)而促進(jìn)腎上腺皮質(zhì)激素的分泌，所以C錯(cuò)誤；GPT要是會(huì)罵人肯定會(huì)說：這也太坑爹了。

評(píng)價(jià)：GPT做對(duì)了。金黃色葡萄球菌，我認(rèn)識(shí)這貨還是在工作細(xì)胞里。

評(píng)價(jià)：GPT做錯(cuò)了，標(biāo)準(zhǔn)答案是A。GPT說了這么多，要是我沒有標(biāo)準(zhǔn)答案我就信了。

評(píng)價(jià)：GPT做錯(cuò)了，標(biāo)準(zhǔn)答案是C，這個(gè)也屬于普通人連題都看不明白。

評(píng)價(jià)：GPT做錯(cuò)了，標(biāo)準(zhǔn)答案是B。

評(píng)價(jià)：GPT做對(duì)了。人家植物都瀕危了，你還用人家培育觀賞植物，這不是玩呢。

總結(jié)一下：生物考試10個(gè)題，對(duì)了6個(gè)，正確率60%。和物理一樣。我如果答這個(gè)卷子，肯定拿不到60分，GPT參加高考，生物上肯定超過我了。

03?歷史

剛才考了兩門理科，咱們這回再來考考文科吧！文科我喜歡歷史，來看看它考的怎么樣。

評(píng)價(jià)：GPT做對(duì)了，中華文明多元一體。

評(píng)價(jià)：GPT做對(duì)了。北宋特別注重教育，重文抑武中國科舉制度就是在宋朝空前繁榮的。

評(píng)價(jià)：GPT做錯(cuò)了，標(biāo)準(zhǔn)答案是D。這兩句話說明：長安和羅馬都曾經(jīng)是帝國交通網(wǎng)絡(luò)的中心。不過，從長安到羅馬的確是東西交流的通道，GPT說的也有道理。

評(píng)價(jià)：GPT做對(duì)了，我連題都讀不懂，GPT都能做對(duì)。

評(píng)價(jià)：GPT做錯(cuò)了，正確答案是B。這個(gè)題有意思了。表面上看：英國很關(guān)心中國主權(quán)，告訴中國長江不能租押給他國，清政府也保證：這是中國要地，絕對(duì)不給別人，好像是維護(hù)了主權(quán)完整?？蓪?shí)際上呢？英國政府所說的他國，是除了英國之外的他國，換句話說長江沿岸只能租押給英國。清政府說了嘴硬的話——中國要地，不予他國。實(shí)際上是默認(rèn)了長江成為英國的勢(shì)力范圍。這需要結(jié)合歷史背景知識(shí)才能答對(duì)，只從字面上讓GPT理解，的確有點(diǎn)強(qiáng)人所難了。

評(píng)價(jià)：GPT做對(duì)了。1946年國民黨召開政協(xié)會(huì)議，史稱舊政協(xié)，用來區(qū)分1949年召開的新政協(xié)。4月8日，美軍護(hù)送王若飛、博古、葉挺、鄧發(fā)等人返回延安，結(jié)果延安下雨無法降落，飛機(jī)返航。途中迷失方向，撞在山西省黑茶山，機(jī)上14分全部遇難。

評(píng)價(jià)：GPT做對(duì)了。

評(píng)價(jià)：GPT做錯(cuò)了，標(biāo)準(zhǔn)答案是C。非洲不是中國的周邊國家，肯定不能選A，顯然活動(dòng)是文化交流的一部分，應(yīng)該選C。建交高潮發(fā)生在五六十年代，緊跟著非洲兄弟就把我們抬進(jìn)了聯(lián)合國。非洲11國也不都是金磚國家，D選項(xiàng)有點(diǎn)狹隘。

答：GPT做對(duì)了。西亞有兩河流域，北非有埃及，這都是人類最早的文明，字母、雕刻和冶鐵技術(shù)這里都有，所以馬丁貝爾認(rèn)為希臘文明發(fā)源于西亞和北非。可是奴隸主民主制好像是希臘的城邦自創(chuàng)的，我看過一種說法說因?yàn)橄ＥD的地理?xiàng)l件，造成它們的工商業(yè)比較發(fā)達(dá)，做生意需要平等，于是就發(fā)展出了民主制，不知道這種說法有沒有道理。

評(píng)價(jià)：GPT做錯(cuò)了，標(biāo)準(zhǔn)答案是C。歐洲一直采用類似于中國春秋戰(zhàn)國時(shí)代的分封制，國王的權(quán)力很有限。為了獲得民眾的支持，才成立了下議院，國王需要經(jīng)過議會(huì)同意才能加稅，A不對(duì)。這是一種妥協(xié)，說明國王需要聯(lián)系市民，應(yīng)該選C。英國的世襲貴族控制著上議院，下議院是市民選舉產(chǎn)生的，而下議院的權(quán)力比上議院大，所以D不對(duì)。至于君主立憲，那更是17世紀(jì)的事情了，B不對(duì)。這個(gè)題連我都會(huì)，GPT不知道為什么犯糊涂了。

評(píng)價(jià)：GPT做對(duì)了。書我沒看過，題目也不會(huì)，但是GPT能夠選對(duì)，厲害。

評(píng)價(jià)：GPT做對(duì)了，真是強(qiáng)?。?/p>

評(píng)價(jià)：GPT做錯(cuò)了，答案是B。對(duì)每一條內(nèi)容的背景，GPT都準(zhǔn)確做出了判斷。但是按照時(shí)間排序卻沒有排清楚，遺憾。

總結(jié)一下：在歷史考試的13個(gè)題目中，GPT錯(cuò)了5個(gè)，對(duì)了8個(gè)，正確率61.5%。與物理、生物的正確率都差不多。

類似的，我還測(cè)試了政治考卷。在13個(gè)選擇題中對(duì)了7個(gè)，正確率54%，看起來，GPT的政治不太好。

文理科考試就到這了。下面是主課：語數(shù)外的考察?？梢灶A(yù)見，作為一個(gè)用英文資料訓(xùn)練出的語言模型，英語考試自然是不在話下，那么它能得多少分?jǐn)?shù)呢？我們來試試。

04?英語

第一個(gè)題是完形填空，就是根據(jù)上下文，選一個(gè)正確的詞填進(jìn)去。我們看看GPT的表現(xiàn)。

GPT給出的回答是：

經(jīng)過檢查，GPT在這一題中全對(duì)！雖然意料之中，但依然感覺非常神奇。想起我上高中的時(shí)候，英語完形填空都是連錯(cuò)。

后面我又讓GPT做了閱讀理解，正確率也非常高。整個(gè)客觀題部分一共有39個(gè)選擇題，GPT對(duì)了36個(gè)，只錯(cuò)了3個(gè)，正確率高達(dá)92%，已經(jīng)達(dá)到了英語優(yōu)等生得水平了。

那么，書面表達(dá)能力怎么樣呢？英語考試書面表達(dá)有兩個(gè)問題，第一題是閱讀一段短文，然后用英文回答問題。題目是：

GPT回答：

簡單翻譯一下：

題目問：湯姆在自己的學(xué)校目睹了什么?

GPT說：湯姆親眼目睹了他所在學(xué)校的孩子們大量飲用含糖飲料。

題目問：湯姆從哪里得到樂趣瓶的最初模型的想法?

GPT說：湯姆最初的靈感來自于觀察他媽媽如何制作健康的水果飲料，但后來又很難找到隨身攜帶的飲料。

題目問：請(qǐng)判斷下列句子中哪部分是錯(cuò)誤的，并在下面劃線并解釋原因。

Tom最自豪的是樂趣瓶為其他人提供了機(jī)會(huì)，因?yàn)樗粌H提供了含糖飲料的健康替代品，而且還將所有利潤捐贈(zèng)給了OHG。

GPT說：該聲明的錯(cuò)誤部分是“將所有利潤捐贈(zèng)給OHG”。文章指出，湯姆將部分利潤捐贈(zèng)給了健康一代組織(OHG)，而不是全部利潤。

題目問：在湯姆的品質(zhì)中，你認(rèn)為哪一點(diǎn)對(duì)我們來說是重要的?為什么?

GPT說：湯姆的品質(zhì)之一對(duì)我們很重要，那就是他的毅力。他建議其他年輕的創(chuàng)業(yè)者要準(zhǔn)備好經(jīng)歷很多的高潮和低谷，沒有一夜成名的事情。這種品質(zhì)很重要，因?yàn)樗鼜?qiáng)調(diào)了努力工作和實(shí)現(xiàn)目標(biāo)的決心的重要性。

我找了一位英語老師，給GPT的回答進(jìn)行評(píng)價(jià)。這一題12分，他給了9分。

最后是英語大作文，以下是題目和GPT的回答。

簡單翻譯一下GPT的回答：

親愛的吉姆，

你好嗎?我希望你一切都好。我寫信是想邀請(qǐng)你給我和我的同學(xué)做一個(gè)關(guān)于英語寫作的在線演講。

如你所知，我們是中國的高中生，我們需要參加大學(xué)入學(xué)英語考試。寫作是考試中最具挑戰(zhàn)性的部分之一。我們想學(xué)習(xí)你的寫作經(jīng)驗(yàn)和技巧，以提高我們的寫作水平。

我們計(jì)劃在即將到來的北京時(shí)間周六上午10點(diǎn)進(jìn)行網(wǎng)上談話。我們會(huì)用Zoom來開會(huì)。請(qǐng)讓我知道這個(gè)時(shí)間對(duì)你是否合適。另外，請(qǐng)告訴我們你演講的具體主題和時(shí)長。

期待您的回復(fù)。

你的，李華。

這篇作文我也發(fā)給了英語老師，滿分20分，英語老師給了14.5分，屬于及格線以上。

綜上，英語寫作部分的32分，GPT得了23.5分，得分率73%，低于客觀題92%的得分率，但是也遠(yuǎn)遠(yuǎn)高于用中文表述的物理、生物、歷史題。

把主觀題和客觀題綜合在一起，英語考試中GPT得分86分。由于英語選擇了全部試題，這個(gè)分?jǐn)?shù)是準(zhǔn)確度比較高的。

05數(shù)學(xué)

咱們?cè)賮砜纯磾?shù)學(xué)考試吧！都說ChatGPT的數(shù)學(xué)不好，這是真的嗎？

2022年北京高考數(shù)學(xué)題的選擇題部分一共有10個(gè)題，一個(gè)題有配圖需要拿掉。余下9個(gè)題。以下是題目和GPT的回答：

九個(gè)題中，GPT對(duì)了6個(gè)，正確率66.7%。雖然比英語略低，但還是高于物理、生物和歷史科目。

我也測(cè)試了一部分?jǐn)?shù)學(xué)主觀題，發(fā)現(xiàn)雖然它有一定的推理能力，但是一本正經(jīng)說瞎話的時(shí)候還是居多，GPT要想真正完成數(shù)學(xué)考試，可能還得學(xué)習(xí)一個(gè)。

06?語文

最后還要測(cè)試語文，還是那句話，在GPT訓(xùn)練過程中，中文資料相對(duì)較少，所以在理解中文方面，GPT可能還存在欠缺。語文考試，我們就僅以作文為例進(jìn)行測(cè)試吧！

語文考試有兩個(gè)作文，一個(gè)小作文和一個(gè)大作文。首先來看小作文的題目和GPT的回答：

我覺得寫的不錯(cuò)。再來看看語文大作文，題目是：

GPT給出的答案：

個(gè)人感覺這篇大作文有點(diǎn)空洞無物，不知道語文老師會(huì)怎么評(píng)價(jià)?我把這兩篇作文都發(fā)給了一位資深語文老師，這是她的回復(fù)：

語文老師就是厲害，一眼就看出了這篇文章是AI寫的。于是60分的作文，得了40分，66.7%，與數(shù)學(xué)相差無幾。

綜上，按照我現(xiàn)有的測(cè)試，GPT各科的正確率如下：

因?yàn)楸本└呖际切枰颊Z文數(shù)學(xué)英語，各150分，另外六門史地政理化生，選考3門，每一門100分。如果GPT選考?xì)v史、物理和生物，那么他的得分情況是：

一共能拿到511分。當(dāng)然，這個(gè)分?jǐn)?shù)最終還要賦分，就是按照排名折合成一個(gè)新的分?jǐn)?shù)，但是因?yàn)榕琶覀儾恢?，所以也沒辦法知道具體的折合結(jié)果。假如，賦分之后，依然是511分，那么能考上什么學(xué)校呢？

京內(nèi)211高校里，最低分是北京中醫(yī)藥大學(xué)，516分，還差一點(diǎn)。

京外211高校里，新疆大學(xué)最低509分，GPT剛好可以考上。

結(jié)論是：如果GPT參加2022年北京高考，大約可以考上新疆大學(xué)。

當(dāng)然，如果加入大量的主觀題，GPT的分?jǐn)?shù)可能沒有這么好，它一本正經(jīng)說瞎話的本事還是挺強(qiáng)的。但是，GPT基本上相當(dāng)于一個(gè)剛出生的嬰兒，而且人家基本上是個(gè)英語娃，非要參加漢語書寫的考試，如果再進(jìn)行一段時(shí)間的訓(xùn)練，考到600多分是完全有可能的。

其實(shí)，我們教學(xué)的過程不也是這樣嗎？通過大量的題目，訓(xùn)練調(diào)整學(xué)生們神經(jīng)元的連接，最后讓他們學(xué)會(huì)自主解題，這和用大量數(shù)據(jù)喂給ChatGPT，讓它自動(dòng)調(diào)整參數(shù)，是一樣的。只不過，GPT的學(xué)習(xí)速度非?？欤靡惶斓臅r(shí)間，可能可以達(dá)到人類數(shù)百年的學(xué)習(xí)力。

我相信，GPT一定能夠深刻的改變社會(huì)。就像蒸汽機(jī)將人類帶入了蒸汽時(shí)代，發(fā)電機(jī)將人類帶入了電氣時(shí)代，計(jì)算機(jī)將人類帶入了電子時(shí)代，互聯(lián)網(wǎng)將人類帶入了信息時(shí)代一樣，未來已經(jīng)來了。

有人問：人工智能會(huì)產(chǎn)生自我意識(shí)統(tǒng)治人類嗎？終結(jié)者的情節(jié)會(huì)出現(xiàn)嗎？我想，在人工智能統(tǒng)治世界之前，那個(gè)掌握最強(qiáng)人工智能技術(shù)的公司或者人，就會(huì)統(tǒng)治世界了，而這可能是我們更需要擔(dān)心的。

標(biāo)簽：高考北京人工智能 OpenAI ChatGPT