高考數(shù)學(xué)難?AI考一下試試!

今年的高考不僅僅是對考生們的一次考驗(yàn),同時(shí)也是對國內(nèi)的“AI大模型”們的一次大考。在6月7日高考作文題目公布后,我們曬出了讓AI寫的作文,引起了廣泛關(guān)注。甚至一些“AI考生”也主動(dòng)展示了他們的成績,例如360創(chuàng)始人周鴻祎就在微博上曬出了用自家的360智腦寫的作文,并詢問網(wǎng)友:“這篇作文能得多少分呢?”
除了作文,我們也想知道AI大模型在做題方面的水平如何。對于很多考生來說,數(shù)學(xué)一直都是難以攻克的難題,那么,AI能否給出正確答案呢?又在閱讀理解方面,哪家AI大模型的能力更強(qiáng)?
因此,我們特意讓國內(nèi)幾家AI大模型,包括百度的文心一言、科大訊飛的訊飛星火、阿里的通義千問、360的智腦,以及ChatGPT,分別進(jìn)行了一些高考數(shù)學(xué)和語文題的測試。
數(shù)學(xué)搞起來

1.文心一言

2.訊飛星火

3.通義千問

4.360智腦

5.ChatGPT


AI理解力大比拼


1.文心一言

2.訊飛星火

3.通義千問

4.360智腦


5.ChatGPT

在數(shù)學(xué)方面,AI大模型表現(xiàn)都還可以。它們可以計(jì)算簡單的代數(shù)運(yùn)算和解方程,理解一元二次函數(shù)和其他基本函數(shù)的圖形特征,并且在一定范圍內(nèi)可以推理和求證。但是涉及到更復(fù)雜的計(jì)算或者抽象推理時(shí),AI模型的表現(xiàn)就差強(qiáng)人意了。比如解決不定方程組這樣的題目,AI模型就顯得力不從心。
在閱讀理解方面,不同的AI模型表現(xiàn)也有差異。百度的文心一言和阿里的通義千問在理解語篇和回答問題方面表現(xiàn)較好,它們可以抓住文章的主旨和關(guān)鍵細(xì)節(jié),對文章的理解較深入。而另一些模型如360智腦和ChatGPT則更擅長于理解簡單句子和短語,對長篇篇章的理解還需要提高。
總的來說,雖然AI模型在解決高考語數(shù)題上已經(jīng)有了一定的表現(xiàn),但和人類考生相比,它們的能力還遠(yuǎn)遠(yuǎn)不及。AI只是機(jī)械地根據(jù)訓(xùn)練 datasets 產(chǎn)生答案,還無法體現(xiàn)出人類考生的靈活性、創(chuàng)造性和邏輯推理能力。不過,隨著模型的不斷進(jìn)步,AI的語言和邏輯能力還會(huì)繼續(xù)提高,未來在應(yīng)對復(fù)雜提問和開放性試題方面,它們可能會(huì)有更大的發(fā)展空間。AI進(jìn)軍高考,既是一場技術(shù)實(shí)力的較量,也是人工智能提高自身能力的一次練兵