【花師小哲】鑒定網(wǎng)絡(luò)熱門(mén)(?)AI(2)——ChatGPT篇(2)
總算是轉(zhuǎn)陰了,然后就投入到科研的深淵當(dāng)中,一直沒(méi)怎么更專(zhuān)欄,不過(guò)今天突然看到大消息——GPT-4要來(lái)了,這當(dāng)然要寫(xiě)個(gè)專(zhuān)欄了(其實(shí)有些想寫(xiě)寫(xiě)負(fù)樣本的,不過(guò)暫時(shí)還沒(méi)太多時(shí)間去研究)。當(dāng)然,還是簡(jiǎn)要看一下最近的ChatGPT的相關(guān)新聞。

1.ChatGPT的禁用消息
比較重要的禁用ChatGPT的通知中最早的應(yīng)該是stackflow禁用ChatGPT的回答。畢竟,程序員debug求助那真的是救命的求助,而ChatGPT生成的回答畢竟是有很大的不確定性,不能保證是對(duì)的,這會(huì)大大降低回答的整體質(zhì)量,或者說(shuō),濫用ChatGPT必然會(huì)出現(xiàn)問(wèn)題。
然后,各種各樣的封禁消息就出來(lái)了,例如有學(xué)校直接封禁了ChatGPT。
太陽(yáng)底下沒(méi)有新鮮事,這種情況是可以預(yù)料到的,就我個(gè)人來(lái)說(shuō),ChatGPT確實(shí)是很合格的工作助手,一些簡(jiǎn)單的但是不想寫(xiě)的代碼(例如python的各種奇怪的小代碼)就直接讓它給我些就好了,它的“世界知識(shí)”也能給我很多幫助,但讓它幫我寫(xiě)論文還是不會(huì)做的。

2.ChatGPT分辨算法
既然有些人要禁用ChatGPT,那必然要想辦法分辨哪些文本是人寫(xiě)的哪些是ChatGPT生成的,于是就有了相關(guān)算法來(lái)做。不過(guò)簡(jiǎn)單來(lái)說(shuō)這就是一種對(duì)抗系統(tǒng)嘛,沒(méi)什么新鮮的。對(duì)抗系統(tǒng)其實(shí)一般沒(méi)那么難做,例如你想做一個(gè)能打敗市面上現(xiàn)有圍棋系統(tǒng)的圍棋系統(tǒng)(例:【花師小哲】當(dāng)代煉金術(shù)(神經(jīng)網(wǎng)絡(luò))前沿(0)——補(bǔ)檔),并不需要真的去完全研究透對(duì)手的算法,對(duì)抗系統(tǒng)能做的比較簡(jiǎn)單。
為什么展開(kāi)講這個(gè),其實(shí)是我陽(yáng)的期間看了不少關(guān)于生物起源、演化相關(guān)的視頻,就感覺(jué)對(duì)抗系統(tǒng)其實(shí)就像是寄生蟲(chóng)之類(lèi)的東西,它不需要比原模型更加強(qiáng)大,只需要找準(zhǔn)原模型的薄弱點(diǎn)就可以了,就感覺(jué)很神奇。

3.黑化ChatGPT
其實(shí)我早些時(shí)候也在QQ空間發(fā)過(guò)一個(gè)東西:

然后好像真的有人去做了,這部分比較危險(xiǎn),就不展開(kāi)。

4.ChatGPT的其他應(yīng)用
ChatGPT接入微信之類(lèi)的就不談了
(1)有人做了一個(gè)PPT自動(dòng)生成系統(tǒng)——ChatBCG,主要借助于ChatGPT生成的文本,然后加到一些模板里。不過(guò)這個(gè)構(gòu)圖是真的簡(jiǎn)單,不過(guò)之后作者也許可以考慮整合下DALL-E啥的。

(2)把GPT-3應(yīng)用到debug中的應(yīng)用——Adrenaline。能夠幫你debug的同時(shí)幫你解釋為什么會(huì)有bug,這種系統(tǒng)其實(shí)也不少了。


5.ChatGPT與詐騙
今早看到一條推送真的沒(méi)有繃?。?/p>
具體內(nèi)容也不展開(kāi)了。ChatGPT這種殺器可以說(shuō)是吊打敏感詞檢測(cè)機(jī)了,萬(wàn)一真的有人拿來(lái)訓(xùn)練水軍,絕對(duì)是一場(chǎng)災(zāi)難,比一般水軍那種復(fù)制粘貼的文本可厲害太多了。這問(wèn)題畢竟也不好矯正,畢竟即使采取“挑選高贊文本”等方式,也必然無(wú)法消除語(yǔ)言中本就存在的偏見(jiàn)等,這些東西本來(lái)就在GPT里,按照當(dāng)前人們對(duì)大模型的認(rèn)知,也只要稍加改造,就可以成為激發(fā)出某部分的潛力,所以ChatGPT當(dāng)騙子還是挺容易可以做到的。

6.GPT-4終究還是要出來(lái)了
如圖:

雖然大家應(yīng)該都看得懂,但還是稍微翻譯一下重點(diǎn):GPT-4要出來(lái)了!它將是地表最強(qiáng)模型,在它的面前ChatGPT就像是玩具一樣(所以ChatGPT你真的就是吊人胃口的?。?,GPT-3有1750億參數(shù),但GPT-4將會(huì)有100萬(wàn)億個(gè)參數(shù)。
真的挺驚訝的,據(jù)我所知,目前最大的語(yǔ)言模型應(yīng)該是英偉達(dá)和微軟合作的MT-NLG,有5300億個(gè)參數(shù),相比之下,GPT-4真的是降維打擊。不過(guò)畢竟人家還沒(méi)有出,效果究竟如何(還有運(yùn)算速度是否跟得上)就只能等了:
