ChatGPT缺點(diǎn)之為什么ChatGPT、文心一言這么厲害了,還經(jīng)常會(huì)把古詩(shī)詞的作者弄錯(cuò)?

因?yàn)镃hatbot模型在中國(guó)古典文學(xué)方面確實(shí)還有較大提高的空間。包括:
訓(xùn)練數(shù)據(jù)不夠豐富。這些模型的訓(xùn)練數(shù)據(jù)主要來(lái)自網(wǎng)絡(luò)爬取的文本,古典文學(xué)相關(guān)的高質(zhì)量數(shù)據(jù)相對(duì)較少,導(dǎo)致模型對(duì)這方面知識(shí)掌握不夠深入全面。

作者信息不突出。很多古典詩(shī)詞的文本中并不會(huì)特別注明作者信息,模型學(xué)習(xí)到的主要是詩(shī)詞內(nèi)容本身,而不是與作者密切關(guān)聯(lián)的知識(shí)。這使得模型難以準(zhǔn)確判斷某首詩(shī)詞的作者。
相關(guān)知識(shí)不系統(tǒng)。像詩(shī)詞創(chuàng)作年代、流派、代表作者等相關(guān)知識(shí),需要系統(tǒng)學(xué)習(xí)和記憶,但模型目前還難以做到這點(diǎn),導(dǎo)致難以準(zhǔn)確判斷詩(shī)詞的時(shí)代和作者特點(diǎn)。
評(píng)估指標(biāo)的限制。目前大多數(shù)模型是以語(yǔ)言生成能力為主要評(píng)估指標(biāo),而非事實(shí)知識(shí)準(zhǔn)確性。這也在一定程度上導(dǎo)致模型在具體知識(shí)判斷上仍顯不足。

所以,要真正提高這些chatbot模型在古典文學(xué)方面的表現(xiàn),還需要提供更豐富的訓(xùn)練數(shù)據(jù),加強(qiáng)相關(guān)事實(shí)知識(shí)的學(xué)習(xí),以及采用更全面準(zhǔn)確的評(píng)估指標(biāo),這還相關(guān)方面在技術(shù)上繼續(xù)努力并尋求突破。