被迫上場(chǎng)?我們?nèi)轿粶y(cè)試了文心一言,只能說_____?!静钤u(píng)君】

如果說文心一言是個(gè)人工智障,那我覺得還是有失偏頗的,因?yàn)楸绕疬^往的人工智障它的確要強(qiáng)很多。無論是我自己測(cè)試還是看別人的演示,會(huì)發(fā)現(xiàn)在知識(shí)性或者技術(shù)性問題上,某些方面甚至能與gpt較高低。但是在與它的對(duì)話中,很難讓人感到它是有趣,具有創(chuàng)意的。因此相比于人工智能,我更愿意稱它為問答機(jī)器人。
文心一言有著高度的重復(fù)用語,與其說是車轱轆話,不如說是在用固定的模板套。同一個(gè)問題換個(gè)問法給出的答案,查重率竟然高達(dá)99% 。
這是文心一言自己推薦的內(nèi)容,我們讓它寫一篇


那如果是月球旅行呢

可以發(fā)現(xiàn),除了太空換成了月球,市場(chǎng)規(guī)模換了下數(shù)字,其他一模一樣?;蛟S你會(huì)說,太空和月球沒有本質(zhì)區(qū)別,即使是用同樣的報(bào)告也很正常。那好,我們來看看地球旅行呢。

還是同一套模板,復(fù)制粘貼替換了一些關(guān)鍵詞而已,地球旅行還這樣用就怎么也說不過去了吧。
或許你會(huì)覺得這只是刻意做了處理的小范圍情況,那再看看這個(gè)呢。


講個(gè)笑話也依舊只有固定的幾個(gè)內(nèi)容。這已經(jīng)不能叫車轱轆話了,而是相同的內(nèi)容在復(fù)制粘貼。
此外有些大段的回答雖然整體并不是一樣的,但是句式依舊有不少重復(fù),所以我合理懷疑這類回答也是在用小話術(shù)的模板進(jìn)行拼接。
由此可見,我說它更像是一個(gè)問答機(jī)器人其實(shí)是非常貼切的。它更像是在搜索自己的知識(shí)庫(kù),然后對(duì)結(jié)果進(jìn)行了過濾和編排。這也是為什么一些問題它的回答要么很簡(jiǎn)單,要么有不少重復(fù)用語,正是因?yàn)橹R(shí)庫(kù)中缺少對(duì)應(yīng)場(chǎng)景的話術(shù)。