ChatGPT中國(guó)數(shù)學(xué)題挑戰(zhàn)!它能全答對(duì)嗎?

Hello,大家好,我是大衛(wèi)呆。
?
上期節(jié)目我給大家介紹了一下最近極其火爆的ChatGPT,以及不久的將來可能對(duì)我們的職業(yè)造成的影響。它不僅能回答各種生活問題,還能寫宣傳語(yǔ)、寫代碼甚至做數(shù)學(xué)題,而且支持中文!

?
今天咱們來個(gè)有意思的測(cè)試,我準(zhǔn)備了5道小學(xué)水平的數(shù)學(xué)題,咱們看看ChatGPT到底能不能都正確的解答。
?

你說為什么只用小學(xué)水平的數(shù)學(xué)題?那是因?yàn)?strong>初中以上的題有很多的特殊符號(hào),很難輸入到文字框中。而且,如果ChatGPT連小學(xué)數(shù)學(xué)題都做不了也就不用考慮更難的題了。所以咱們先來看看它對(duì)小學(xué)數(shù)學(xué)題的解題能力如何。
?
話不多說,咱們直接上題。
?
第一題:7年前,媽媽年齡是兒子的6倍,兒子今年12歲,媽媽今年幾歲。
我們來看看標(biāo)準(zhǔn)答案:
年齡問題,7年前,兒子年齡為12-7=5歲,而媽媽年齡是兒子的6倍,所以媽媽七年前的年齡為5×6=30歲,那么媽媽今年37歲。
?
接下來我們看看ChatGPT的回答對(duì)不對(duì)。

?
回答正確,而且解題思路也和標(biāo)準(zhǔn)答案幾乎相同。
?
這是一道比較簡(jiǎn)單的數(shù)學(xué)題,但難點(diǎn)在于ChatGPT對(duì)于中文語(yǔ)義的理解??梢钥吹剑耆斫饬酥形恼Z(yǔ)義并給出了正確的答案。要知道ChatGPT可是國(guó)外開發(fā)的程序,它的開發(fā)者可能都無法理解中文,但它卻做到了。

?
當(dāng)然也不排除ChatGPT背后也有中文大佬參與的可能性。
?
第二題:有一串彩珠,按“2紅3綠4黃”的順序依次排列。第600顆是什么顏色?
還是先看標(biāo)準(zhǔn)答案:
周期循環(huán)問題,以2+3+4=9個(gè)一循環(huán),600÷9=66....6,余數(shù)為6,所以第600顆是黃顏色。
?
再來看看ChatGPT的回答。

?
回答正確,解題思路也和標(biāo)準(zhǔn)答案相同。但注意這里ChatGPT出現(xiàn)了一個(gè)中文錯(cuò)字。

?
這道題的難度要比第一題大,如果只看問題,各位看文章的朋友們能答出來嗎?ChatGPT不但要理解中文中的“紅綠黃”,還要和數(shù)學(xué)計(jì)算混在一起才能解出正確答案,但它做到了。
?
第三題:建筑工地有一批磚,最上層兩塊磚,第2層6塊磚,第3層10塊磚……,依次每層比其上一層多4塊,已知最下層有2106塊磚,這堆磚共有多少塊?
?
這回再次加大了難度,不但要理解中文每句話的邏輯及含義,還要根據(jù)這些內(nèi)容加入數(shù)學(xué)計(jì)算。
?
我們還是先看標(biāo)準(zhǔn)答案:
根據(jù)題意設(shè)層數(shù)為n,A1=2,An=2106,D=4,
2106=2+(n-1)×4,
2106=2+4n-4,
4n=2106+2,
4n=2108,
n=2108÷4,
n=527,
(2+2106)×527÷2,
=1110916÷2,
=555458(塊),
答:這堆磚共有555458塊.
?
下面有請(qǐng)ChatGPT作答。

?

?

?
?
ChatGPT同樣給出了完整的解題步驟,不過這次結(jié)果出錯(cuò)了。
可以看到ChatGPT在計(jì)算層數(shù)的時(shí)候就出現(xiàn)了錯(cuò)誤,所以想讓ChatGPT幫你做作業(yè)的朋友要小心了,答案不一定是對(duì)的。

?
第四題:把100根小棒分成10堆,每堆小棒根數(shù)都是單數(shù),且一堆比一堆少2根,應(yīng)如何分?
標(biāo)準(zhǔn)答案:
這是一個(gè)等差數(shù)列,Sn=nA1+[n(n-1)d]/2 ,所以100=10A1+10×9×2/2,解得A1=1
所以分成的10堆數(shù)量依次是1、3、5、7、9、11、13、15、17、19。
?
這次ChatGPT能答對(duì)嗎?

?

?
?
ChatGPT回答正確。
?
最后第五題,我們加大難度,來個(gè)中文的邏輯推理題,我們看看ChatGPT的表現(xiàn)如何。
?
警方查詢了三個(gè)可疑的人,這三個(gè)人中有一個(gè)是小偷,講的全是假話。有一個(gè)人是從犯,說起話來真真假假,還有一個(gè)人是好人,句句話都是真的,查詢中問及三個(gè)人的職業(yè),回答是:
?
甲:我是推銷員,乙是司機(jī),丙是美工設(shè)計(jì)師。
乙:我是醫(yī)師,丙是百貨公司的業(yè)務(wù)員,甲呀,你要問他,他肯定說是推員。
丙:我是百貨公司的業(yè)務(wù)員,甲是美工設(shè)計(jì)師,乙是司機(jī)。
?
請(qǐng)問這三個(gè)人中說假話的小偷是誰(shuí)?
?
這道題對(duì)于ChatGPT不僅僅是邏輯問題,而且要非常熟練的理解中文的語(yǔ)法等含義,對(duì)于一個(gè)人工智能來,這可以說是中文里比較難的考驗(yàn),我們看看它的表現(xiàn)如何。
?
首先標(biāo)準(zhǔn)答案是:
這是個(gè)邏輯推理題,關(guān)鍵是找到切入點(diǎn),其中乙說的第三句話一定是真的,因?yàn)閱柤准椎拇_是說自己是推銷員,所以乙一定不是小偷,那么就分乙是從犯或好人兩種情況來考慮,很容易就能判斷出甲是小偷。
?
大家記住這個(gè)正確答案,下面有請(qǐng)ChatGPT作答。

?

?
ChatGPT的答案是甲是小偷,回答正確!而且我們仔細(xì)看它的解答也非常符合判斷邏輯。說明ChatGPT不但理解邏輯,而且理解中文!
?
怎么樣,你震驚嗎?大家覺得ChatGPT的表現(xiàn)如何?
?
就我個(gè)人來評(píng)價(jià)一下,一共讓ChatGPT做了5道中國(guó)小學(xué)水平的數(shù)學(xué)題,4對(duì)1錯(cuò)。正確率75%。由于測(cè)試樣本只有5道題,所以也并不能說明什么問題,但至少能看出2點(diǎn)。
?
1. ChatGPT對(duì)于中文的理解非常讓人驚嘆,要知道中文在全球來講都是非常復(fù)雜的語(yǔ)言系統(tǒng),但一個(gè)人工智能竟然能順利的答出中文的邏輯問題,確實(shí)讓人驚訝。
?
2. ChatGPT真的可以用來做中國(guó)的數(shù)學(xué)題包括中文的邏輯推理題。雖然答錯(cuò)了一道,但可以看到ChatGPT的答題正確率很高,解題思路也基本都是對(duì)的。
?
但是,這里大家也不要覺得ChatGPT有多么神奇,上期節(jié)目已經(jīng)讓它自己解釋了一下名字的由來。其中GPT縮寫是來自Generative Pretrained Transformer。

?
而里面的“Pretrained”表示在模型被部署之前已經(jīng)通過大量語(yǔ)料進(jìn)行了預(yù)訓(xùn)練,以提高它的性能和泛化能力。也就是說"ChatGPT"是預(yù)先通過海量?jī)?nèi)容學(xué)習(xí)的。而我所找的小學(xué)數(shù)學(xué)題全部來自網(wǎng)上,所以并不排除ChatGPT的海量學(xué)習(xí)中包括我上面的幾道題。而唯一答錯(cuò)的,可能是ChatGPT對(duì)中文支持的還不夠完美或者題庫(kù)中沒有,當(dāng)然也可能是本身算法上產(chǎn)生的問題。

?
但ChatGPT確實(shí)已經(jīng)不僅僅是聊天助手這么簡(jiǎn)單了,它確實(shí)開始朝著科幻片里人工智能的方向在走,也許就在不久的將來,它就可以做到無論什么問題都能以人類的方式給你正確的答案,那必定會(huì)引起整個(gè)人類文明的巨大變化。您對(duì)此有什么看法,不妨在評(píng)論區(qū)討論一下。
?
我是大衛(wèi)呆,如果您覺得內(nèi)容有用歡迎點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā),謝謝您的支持,我們下期見!