【花師小哲】當(dāng)代煉金術(shù)(神經(jīng)網(wǎng)絡(luò))前沿(2.5)——ChatGPT沒那么簡單?

本來我以為提一下ChatGPT就完事了的,結(jié)果卻沒有那么簡單。昨晚老師拉個(gè)個(gè)騰訊會議,扯了一兩個(gè)小時(shí)這東西,雖然我中途因有事離開了半個(gè)小時(shí)沒有聽全,但開頭結(jié)尾都聽了,也有了很多新的收獲和看法。
于是,再把這玩意拿出來掰扯掰扯。

1.為什么說這東西那么強(qiáng)?
對于不是AI從業(yè)者的人來說,這玩意好像也就是那么回事,不就是一個(gè)問答系統(tǒng)嘛,現(xiàn)在這樣的問答系統(tǒng)可多了去了。你說它能幫你寫文章,但專業(yè)的幫你寫文章的AI肯定比這玩意強(qiáng)的;你說它能夠幫你算數(shù)學(xué)題,但它的推理能力并沒有那么強(qiáng);你說他能夠直接給你返回答案,但是當(dāng)你只是想用關(guān)鍵詞搜點(diǎn)東西的時(shí)候,搜索引擎還是你的首選(換句話說,這玩意的擴(kuò)展性并沒有那么強(qiáng))。更不要說這玩意現(xiàn)在只支持文字,你搜圖片、視頻啥的還是不行的。
簡而言之,這玩意從功能上來說,只能說有很多出彩的能力,但直接說平替搜索引擎,還為時(shí)尚早。
那么,這玩意究竟厲害在什么地方呢?答案是,它是直接使用GPT的API開發(fā)的一個(gè)問答系統(tǒng)。
這一點(diǎn)其實(shí)蠻重要的,最近很多公眾號發(fā)ChatGPT的文章就只是給大家展示了它的一些能力和不足,反而沒有很仔細(xì)地講這個(gè)東西。

2.這玩意真的好用嗎?怎么用?
雖說很多公眾號都告訴你這玩意是免費(fèi)試用的,非常方便,但真的如此嗎?
事實(shí)是殘酷的,大部分人連注冊賬號都無法完成。原因也很簡單,中國的郵箱不給通過注冊驗(yàn)證,VPN也不行。雖然他給了可以用谷歌賬號或微軟賬號登錄的選項(xiàng),但個(gè)人實(shí)測是不給用的。所以昨晚我們才開了騰訊會議,用一個(gè)能注冊的郵箱,大家一起測試系統(tǒng)。


當(dāng)然,對于AI方向的研究者來說,我們更加關(guān)注的是,這東西沒有開源的。換句話說,我們并不知道這玩意究竟是如何實(shí)現(xiàn)的,包括導(dǎo)師和師兄昨晚也討論了很久這玩意是如何實(shí)現(xiàn)的。
這一點(diǎn)很重要,畢竟萬一這個(gè)東西只是記住了很多東西的一個(gè)問答系統(tǒng),那就是開了個(gè)大烏龍,就真的只是為GPT-4造勢了。

3.從學(xué)術(shù)的角度,為什么大家那么好奇它是如何工作的?
前面也說了,這玩意厲害在它是直接使用GPT的API開發(fā)的一個(gè)問答系統(tǒng)。
為什么說這一點(diǎn)很厲害,舉個(gè)不恰當(dāng)?shù)睦樱谖覀円酝挠^念中,用GPT這樣的大語言模型做這種問答系統(tǒng)就像是拿著兩顆鵝卵石做精密手術(shù)一樣,專業(yè)不對口。
換句話說,雖然我們說“預(yù)訓(xùn)練-微調(diào)”范式很強(qiáng),但實(shí)際應(yīng)用于具體的問題的話,我們往往是不會直接使用預(yù)訓(xùn)練好的大模型來做這樣細(xì)節(jié)和具體的應(yīng)用的。之前也談到過,我們看重BERT的兩點(diǎn)是attention機(jī)制和預(yù)訓(xùn)練任務(wù)的設(shè)置而不是大模型本身。而ChatGPT就像打了很多人的臉一樣,它就是這么個(gè)存在。
所以我們都很好奇,為什么能夠用GPT的API搞出這么個(gè)東西。由于代碼目前還沒有開源,這東西現(xiàn)在也只能停留在猜想的階段。

4.實(shí)測與發(fā)現(xiàn)
下面給出一些我么實(shí)測的例子:
(1)越來越簡單的梯度下降




在這個(gè)例子中,我們嘗試讓ChatGPT來用越來越簡單的說法來解釋機(jī)器學(xué)習(xí)中的一個(gè)基礎(chǔ)概念——梯度下降??梢钥吹揭婚_始ChatGPT解釋的使用還定義了符號,但是隨著我們回復(fù)說“聽不懂”,它慢慢地把這些符號去掉了,到最后還盡量用三歲小孩聽得懂的例子(用詞也是小人)來解釋了。
而且他有一定的記憶功能,在最后它還沒有忘記之前問它的F1賽車的例子。這有些壞處,在下一個(gè)例子中有更好的展示。但是也有好處,這樣我們就可以多次交互來獲得更加滿意的結(jié)果。
(2)智能母雞(機(jī))



其實(shí)我們一開始想問的就是智能母機(jī),但是打錯字了(真的打錯字了,不是小黑子),但覺得很好玩就繼續(xù)問下去了,可以看到回答的還是有模有樣的。當(dāng)我們糾正錯誤,使用“智能母機(jī)”時(shí),它似乎認(rèn)為我們輸入錯誤,采用了智能母雞的說法,但回答的內(nèi)容還是關(guān)于智能母機(jī)的。
(3)其他
其他的很多就沒有圖了(我沒截,雖然錄屏了但懶得去翻),簡單說一下
①對于常見的數(shù)學(xué)問題,是可以給出一些解答的,但是稍微修改里面的一些數(shù)字設(shè)置他就有可能會出問題。當(dāng)然,根據(jù)上述實(shí)驗(yàn),這可能是因?yàn)樗涀×酥暗膯栴},反而倒打一耙,說我們的輸入輸錯了。
②能夠做到把一段python代碼轉(zhuǎn)C++,據(jù)說微調(diào)就可以用,不過目前也只是喂給他一個(gè)冒泡排序的小算法。
③能夠根據(jù)輸入的要求更改輸出形式,例如一條一條地整理好還是輸出一大段
④讓它直接寫冒泡排序是很難的,但讓它debug會好很多
⑤似乎不同人用的結(jié)果不一樣


上面是其他人的截圖,下面是我們測試的截圖。這也可能是因?yàn)槲覀兊妮斎胗行┰S的差別導(dǎo)致的,或許也是因?yàn)橹皢柕囊恍﹩栴}都是一段話式的回答。
還有很多有意思的測試,這里不展開。

5.能力討論
好了,那么問題來了,這個(gè)系統(tǒng)的能力究竟如何,是否有邊界,邊界在哪里?
(1)語言理解能力已經(jīng)很強(qiáng)了,但推理能力還不足。這個(gè)好理解,畢竟是基于大語言模型做的,所以欠缺很多推理能力是很正常的。這一點(diǎn)很重要的原因也是因?yàn)樗腔贕PT的API開發(fā)的,能夠展示強(qiáng)大的語言能力很讓人震驚
(2)邊界是有的,能力還是受限。作為問答系統(tǒng),它還是沒有逃過問答系統(tǒng)的限制,例如它不知道最近的一些新詞(據(jù)說是2022年初進(jìn)行訓(xùn)練的),這也是其相較于搜索引擎一個(gè)巨大的缺點(diǎn)。
(3)需要提問者有構(gòu)造問題的技巧。如果問題構(gòu)造的好,這個(gè)系統(tǒng)效率提升是很明顯的,但是問題構(gòu)造不好,很容易有不滿意的回答。而搜索引擎只需要關(guān)鍵字就可以搜索到很多相關(guān)信息了。而且很多時(shí)候我么是不需要太精確的回答的,反而希望從一個(gè)關(guān)鍵詞獲取大量相關(guān)信息。
(4)真的有可能和谷歌展開商業(yè)大戰(zhàn)。不過我個(gè)人不懂商業(yè),所以我就把老師的觀點(diǎn)放在這。
(5)對AI從業(yè)者來說,這個(gè)東西可能會帶來研究范式的轉(zhuǎn)變。今后基于大模型API開發(fā)的模式可能日漸普遍。AI也許真的要變天?AI可能迎來大結(jié)局?雖然ChatGPT確實(shí)展示了強(qiáng)大的能力,不過我們還是要冷靜、理性。
(6)下一步怎么做。要讓這玩意能夠更加強(qiáng)大,有很多辦法,例如加多模態(tài)(換句話說,能夠支持輸入、輸出圖片、文件等)、與搜索引擎相結(jié)合、解決預(yù)訓(xùn)練語言模型的在線學(xué)習(xí)等。

這玩意雖然被很多AI領(lǐng)域的人注意到了,但還沒有傳的太開,具體能不能成為一個(gè)“新時(shí)代”的導(dǎo)火索還要看后續(xù)的跟進(jìn)研究。
【花師小哲】當(dāng)代煉金術(shù)(神經(jīng)網(wǎng)絡(luò))前沿(2.5)——ChatGPT沒那么簡單?的評論 (共 條)
