ChatGPT的創(chuàng)造力已達(dá)到人類頂尖水平-蒙大拿大學(xué)研究

美國(guó)蒙大拿大學(xué)的一項(xiàng)新研究表明,ChatGPT的創(chuàng)造力已經(jīng)達(dá)到了前1%的人類思想家水平。研究人員對(duì)ChatGPT進(jìn)行了托蘭斯創(chuàng)造力思維測(cè)驗(yàn)(TTCT,?Torrance Tests of Creative Thinking),并記錄了8個(gè)回答。此外,他們還收集了蒙大拿大學(xué)24名學(xué)生的回答,并將這些分?jǐn)?shù)與全國(guó)2700名參加TTCT考試的學(xué)生進(jìn)行了比較。[1]
?
所有回答由學(xué)術(shù)測(cè)試服務(wù)機(jī)構(gòu)打分,該機(jī)構(gòu)事先并不知道收到的回答有AI生成的。該研究表明,AI的回答與參加考試的創(chuàng)造力最豐富的真人回答一樣具有創(chuàng)造力。研究的結(jié)果令蒙大拿大學(xué)博士Erik Guzik 感到驚訝。他表示:“對(duì)我來(lái)說(shuō),創(chuàng)造力意味著以不同的方式做事。比如我就比較喜歡某個(gè)創(chuàng)業(yè)的定義,那就是成為企業(yè)家就是要有不同的想法。因此,AI可能幫助我們將創(chuàng)造性思維應(yīng)用到商業(yè)和創(chuàng)新過(guò)程中,我覺(jué)得這太令人著迷了。”
?
TTCT有兩個(gè)不同的評(píng)估:一個(gè)是語(yǔ)言評(píng)估,另一個(gè)是圖形評(píng)估。二者都衡量了發(fā)散性思維,即產(chǎn)生創(chuàng)意的思維過(guò)程。
?
在語(yǔ)言評(píng)估中,考生通過(guò)圖片和或語(yǔ)言提示進(jìn)行書(shū)面回答。例如,他們可能被要求回答圖片中某個(gè)事件的結(jié)果,或者針對(duì)某個(gè)產(chǎn)品提出改進(jìn)方法。他們的答案用于評(píng)估三種心理特征:
1. 流暢度:相關(guān)想法的數(shù)量
2. 獨(dú)創(chuàng)性:想法的新穎程度
3. 靈活性:不同類型的想法
?
在圖形評(píng)估中,考生需要畫(huà)出他們的答案。例如,他們可能被要求完成某個(gè)圖畫(huà)。除了流暢度和獨(dú)創(chuàng)性外,圖形評(píng)估還包括以下技能的測(cè)驗(yàn):
1. 拓展性:在基本要求之外增加想法
2. 定力:指一個(gè)人在面對(duì)模糊不清的情況時(shí),能有足夠的耐心,直到他們能提出一個(gè)創(chuàng)新性的解答的能力。
3. 富有創(chuàng)造力的稱呼名字的塑造能力:為圖形創(chuàng)造性地恰當(dāng)命名。
?
在這項(xiàng)研究中,ChatGPT在流暢性和獨(dú)創(chuàng)性方面的回應(yīng)都位于百分位。在靈活性方面,回應(yīng)分?jǐn)?shù)降至97。
?
Guzik談到:“我們一直在體驗(yàn)ChatGPT,發(fā)現(xiàn)它有一些出乎意料、引人注目的表現(xiàn)。有些回答是前所未有、令人驚訝的。這時(shí)我們決定將它投入測(cè)試,看看它到底有多大程度的創(chuàng)造性。”[2]
?
ChatGPT確實(shí)正在成為創(chuàng)新的重要驅(qū)動(dòng)力。
?參考資料
[1]?https://www.94c.cc/info/chatgpt-creativity-reaches-top-human-level.html
[2]https://www.cnbc.com/2023/07/17/study-chatgpt-can-match-the-top-1percent-of-creative-human-thinkers.html