AI大模型產(chǎn)品集體奔赴高考考場(chǎng),教育賽道的訊飛星火能贏嗎?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

近日,2023年高考落下帷幕,“用AI寫(xiě)高考作文”的話題也備受熱議。2023年,受ChatGPT熱潮的影響,國(guó)內(nèi)的AI大模型產(chǎn)品也如雨后春筍。例如,百度、阿里、360等互聯(lián)網(wǎng)巨頭企業(yè)均相繼推出文心一言、通義千問(wèn)、360智腦等AI大模型產(chǎn)品。
與此同時(shí),一些深耕教育AI賽道的玩家也不甘人后,借助AI大模型,將其原本的優(yōu)勢(shì)得以釋放。作為智能語(yǔ)音和人工智能賽道的上市企業(yè),科大訊飛推出的大模型產(chǎn)品訊飛星火,也在這波AI熱潮中備受關(guān)注。
那么,與高考與教育賽道高度相關(guān)的訊飛星火,實(shí)際寫(xiě)作水平與使用體驗(yàn)如何?筆者對(duì)其進(jìn)行了高考作文相關(guān)的系列提問(wèn)。通過(guò)親測(cè)體驗(yàn),發(fā)現(xiàn)這確實(shí)是一款十分智能的AI大模型產(chǎn)品。雖然也有一些美中不足的地方,但是也可謂瑕不掩瑜。
瑕不掩瑜,真實(shí)水平或不敵優(yōu)等生
首先,筆者以全國(guó)甲卷為例,與科大訊飛星火認(rèn)知大模型進(jìn)行了對(duì)話。該卷作文題目是:人們因技術(shù)發(fā)展得以更好地掌控時(shí)間,但也有人因此成了時(shí)間的仆人。這句話引發(fā)了你怎樣的聯(lián)想與思考?請(qǐng)寫(xiě)一篇文章。

筆者將該高考作文的要求,全文輸入訊飛星火。訊飛星火的“高考作文”如下:全文一共855字,回答時(shí)間在30秒以?xún)?nèi)。

圖源:訊飛星火認(rèn)知大模型
通過(guò)輸出的內(nèi)容可以看出,科大訊飛星火對(duì)于提問(wèn)的語(yǔ)義理解基本正確,行文的邏輯也十分順暢,例如,在如何正確的利用時(shí)間方面,訊飛星火采用了“因?yàn)?.....所以”等表達(dá)方式,可謂有理有據(jù),同時(shí)行文的措辭表達(dá)也非常的口語(yǔ)化,并沒(méi)有多么華麗的辭藻與晦澀難懂的句子。
不過(guò),作為體現(xiàn)考生寫(xiě)作水平最重要的考試,高考作文還會(huì)考查考生作文的立意新穎程度、文字功底等。而如果從這些角度去評(píng)價(jià)訊飛星火的“高考作文”,也不難看出其存在的明顯不足。
首先,在立意方面。訊飛星火用“時(shí)間”是把殺豬刀為題,雖然通俗易懂,但是未免過(guò)于普通,甚至讓人覺(jué)得有些敷衍套作的意味。
其次,文章中有多個(gè)論點(diǎn),例如“時(shí)間很重要”、“我們應(yīng)該學(xué)會(huì)利用時(shí)間”、“應(yīng)該勞逸結(jié)合等”。只是,這些觀點(diǎn)的論據(jù),都帶有一定的說(shuō)教意味,既沒(méi)有引經(jīng)據(jù)典,也沒(méi)有太多實(shí)例輔助讀者理解,因此論據(jù)也顯得不夠具體和有說(shuō)服力、更缺少文采。
雖然文末舉了兩個(gè)例子,但是沒(méi)有插入到文章對(duì)應(yīng)的觀點(diǎn)之中進(jìn)行佐證,也顯得不夠完整。為了驗(yàn)證訊飛星火的智能性,筆者繼續(xù)對(duì)其進(jìn)行提問(wèn),試圖讓其再寫(xiě)一篇立意更新穎、更有深度的文章。全文如下,一共827字,回答時(shí)間同樣在30秒以?xún)?nèi)。

通過(guò)全文內(nèi)容可以看出,這次的“高考作文”在內(nèi)容方面,更加接近筆者的需求。例如,行文中用到了莎士比亞、愛(ài)因斯坦、愛(ài)迪生、喬布斯等名人名言。
只不過(guò),除了前兩位名人關(guān)于時(shí)間的名言能夠?qū)ζ溆^點(diǎn)進(jìn)行佐證外,文章中引用的愛(ài)迪生與喬布斯的名言卻與觀點(diǎn)關(guān)系并不大,因此依然顯得說(shuō)服力不足。由此可見(jiàn),雖然訊飛星火理解了作文題目要求的語(yǔ)義,但是在引經(jīng)據(jù)典的作文要求方面,還是有“套作”的嫌疑。
據(jù)筆者親測(cè)多款大模型產(chǎn)品,發(fā)現(xiàn)這類(lèi)產(chǎn)品“套作”的現(xiàn)象十分普遍。因此有網(wǎng)友分析表示,或許AI大模型產(chǎn)品并不理解“套作”的含義。按照一些網(wǎng)友的理解,套作指的是不能生搬硬套、套公式套模板。因此,也有網(wǎng)友評(píng)價(jià)訊飛星火自動(dòng)生成的文章過(guò)于普通,更像是一個(gè)普通初中生的作文。
除此以外,筆者發(fā)現(xiàn),大多數(shù)大模型產(chǎn)品的“高考作文”,體裁都是議論文。因此,也試圖讓訊飛星火換一種體裁與風(fēng)格,試試訊飛星火寫(xiě)作更加生活化的話題作文的水平。于是,又以2023年新課標(biāo)I卷關(guān)于“故事”的話題作文,來(lái)對(duì)訊飛星火進(jìn)行測(cè)試。

將作文題目全文輸入訊飛星火,輸出的文章字?jǐn)?shù)是763字,文章的中心思想是:故事有力量,而好故事的意義與價(jià)值是多方面的。全文也非常有層次的進(jìn)行了逐個(gè)論點(diǎn)的陳述、佐證。而佐證的內(nèi)容,主要是引經(jīng)據(jù)典,通過(guò)古代、近現(xiàn)代的文學(xué)作品進(jìn)行舉例說(shuō)明,從而得出結(jié)論。

不過(guò),全文體裁看起來(lái),依然是一篇議論文。筆者認(rèn)為,現(xiàn)代元素還是少了一些,依然具有很強(qiáng)的說(shuō)教味道。如果能夠結(jié)合好故事給身邊親友帶來(lái)的改變來(lái)舉例說(shuō)明,或許遠(yuǎn)比只是提到那些文學(xué)作品,更有說(shuō)服力。
體驗(yàn)過(guò)關(guān),但美中有不足
好在訊飛星火在功能體驗(yàn)上,比市面其他大模型產(chǎn)品,更加體貼入微。例如,除了查看歷史提問(wèn)、新建對(duì)話等,而且相關(guān)菜單也放在了十分顯眼的位置,避免用戶(hù)無(wú)法快速找到歷史對(duì)話記錄,還可以一鍵選擇“重新回答”。

于是,筆者試著換一種提問(wèn)方式,并試著連續(xù)發(fā)問(wèn)。不過(guò)親測(cè)發(fā)現(xiàn),科大訊飛星火似乎不太支持連續(xù)發(fā)問(wèn)。
對(duì)于筆者針對(duì)上一篇作文的疑問(wèn),訊飛星火也采用了“忽略”的處理方式。沒(méi)有正面回答筆者關(guān)于對(duì)上一篇“高考作文”不滿意的回答,而是直接重新寫(xiě)了一篇文章。
值得驚喜的是,這次輸出的關(guān)于“好故事”的作文,終于不再是議論文了。而是很具生活化,列舉了很多實(shí)際生活案例的一篇文章,因此讀起來(lái)也更加像真實(shí)考生的創(chuàng)作。

由此可見(jiàn),AI大模型產(chǎn)品輸出的內(nèi)容如何,關(guān)鍵還在于用戶(hù)如何提問(wèn)。在訊飛星火能夠全面理解用戶(hù)提問(wèn)的語(yǔ)義基礎(chǔ)上,只要提問(wèn)的內(nèi)容足夠具體、要求合理,訊飛星火是能夠輸出用戶(hù)真正想要的內(nèi)容的。
不過(guò),美中不足的是,訊飛星火在理解用戶(hù)的提問(wèn)意圖時(shí),還是存在一些明顯的偏差。例如前文的多次測(cè)試中,明確要求作文需要自擬題目,字?jǐn)?shù)不少于800字。但是訊飛星火實(shí)際輸出的作文,既沒(méi)有標(biāo)題,字?jǐn)?shù)有時(shí)也不及800字。通過(guò)親測(cè)對(duì)比其他大模型產(chǎn)品,這種問(wèn)題也相對(duì)普遍。
由此也可以預(yù)見(jiàn),未來(lái)大模型產(chǎn)品如何更加精準(zhǔn)的進(jìn)行語(yǔ)義理解,將是非常重要的競(jìng)爭(zhēng)力之一。
人類(lèi)未來(lái)需要什么樣的AI大模型產(chǎn)品?
測(cè)完訊飛星火大模型產(chǎn)品的智能程度、用戶(hù)體驗(yàn),我們不妨從用戶(hù)角度來(lái)看,人類(lèi)到底需要什么樣的大模型產(chǎn)品。首先,我們來(lái)看看訊飛星火是怎么回答這個(gè)問(wèn)題的,也非常有意思。

通過(guò)訊飛星火的回答,不難看出,這些因素確實(shí)是用戶(hù)未來(lái)十分關(guān)注的優(yōu)化方向。只是,在這些特點(diǎn)之前,如何建立機(jī)器人與人類(lèi)之間的良好溝通,才是第一步。
這正如不同國(guó)家的人,使用不同的語(yǔ)言,如果沒(méi)有翻譯機(jī),彼此又不懂他國(guó)語(yǔ)言,那么就是雞同鴨講,自然得不到正確的反饋。因此筆者認(rèn)為,所有的大模型產(chǎn)品,未來(lái)首要需要解決的,便是如何正確地理解人類(lèi)的基礎(chǔ)語(yǔ)言,包括隨著時(shí)代變化而產(chǎn)生的新詞匯、網(wǎng)絡(luò)語(yǔ)言、口語(yǔ)、方言等。
難能可貴的是,科大訊飛一直深耕智能語(yǔ)音和人工智能賽道,其翻譯機(jī)產(chǎn)品在全球暢銷(xiāo),便是其對(duì)不同語(yǔ)言轉(zhuǎn)換技術(shù)的有力印證。因此,對(duì)比之下,訊飛星火相比其他大模型,理論上具有更強(qiáng)的技術(shù)研發(fā)能力,能讓訊飛星火目前存在的一些瑕疵進(jìn)行優(yōu)化迭代。
而在各個(gè)互聯(lián)網(wǎng)科技大廠都紛紛推出大模型產(chǎn)品之時(shí), 今年高考的“作文大賽”,既是一個(gè)練兵場(chǎng),也是一塊試金石。在各個(gè)大廠集體奔赴考場(chǎng)時(shí),誰(shuí)負(fù)誰(shuí)勝已經(jīng)不再重要,重要的是借助這次契機(jī),大廠的AI大模型存在什么利弊,或許各大玩家心知肚明。
非常有趣的是,當(dāng)筆者試圖提問(wèn)訊飛科技,AI大模型產(chǎn)品哪家強(qiáng)之時(shí),其回答非常的“圓滑”,也非常的低調(diào),并沒(méi)有宣稱(chēng)自己就是行業(yè)第一,甚至在回答內(nèi)容里,提到的都是別家的產(chǎn)品,都沒(méi)有提到“訊飛星火”。如果用調(diào)侃的語(yǔ)氣來(lái)看這樣的回答,科大訊飛這種“低調(diào)務(wù)實(shí)”的精神,還是值得肯定的。

人類(lèi)的進(jìn)步,永遠(yuǎn)都是思想的突破。人工智能的應(yīng)用,目前還只是萬(wàn)里長(zhǎng)征的第一步。雖然離人們想要的完美尚有距離,但是一定會(huì)向著人類(lèi)想要達(dá)到的效果邁進(jìn)。
結(jié)語(yǔ)
作為教育AI賽道的玩家之一,科大訊飛顯然是更懂教育、更懂學(xué)生的。因此,相比一些大模型產(chǎn)品面向的行業(yè)大而全,訊飛星火在AI大模型集體寫(xiě)作文這個(gè)熱門(mén)事件上,幾乎是獨(dú)一無(wú)二的存在,因此訊飛星火在受到更多關(guān)注的同時(shí),也將背負(fù)著更多人的希望。
我們相信,在AI大模型的應(yīng)用越來(lái)越成熟的同時(shí),其逐漸向行業(yè)垂直,走向?qū)I(yè)化、生態(tài)化也將成為必然,而科大訊飛不僅能將訊飛星火用在其學(xué)習(xí)機(jī)等AI硬件產(chǎn)品上,更將因?yàn)槠溟_(kāi)放性,而為教育行業(yè)添磚加瓦、增色添彩。