最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

【花師小哲】鑒定網(wǎng)絡熱門(?)AI(19)——神經(jīng)網(wǎng)絡學會了“舉一反三”?

2023-11-02 15:33 作者:花師小哲-中二  | 我要投稿

前幾天說了要講的一篇論文(至于為什么先講ChatGPT參數(shù)可能是20B的那一篇,主要還是因為那一篇和我的方向更接近,還是以個人學術(shù)研究角度選擇閱讀順序,當然,也是因為上一篇好寫)

不要因為是Nature的論文就覺得一定很高大上,實際上這篇文章的內(nèi)容還是很簡單的。

1.元學習

沒錯,元學習又來給我們帶來一點小小的震撼了。

元學習和強化學習比較像,大家對強化學習可能更熟悉,畢竟AlphaZeroChatGPT這倆明星模型都用了強化學習。

這兩種方法本身領(lǐng)域研究其實并不算火熱(而且都存在很多各自的問題),但是和其他領(lǐng)域一結(jié)合往往能搞出來很多神奇的東西,或者說爆點(什么,強化學習又搞事情了)

這不巧了嘛,前不久總算是簡單填了一下元學習的坑,這次就不展開了:

【花師小哲】鑒定網(wǎng)絡熱門(?)AI(16)——元學習

2.系統(tǒng)組合與系統(tǒng)泛化

本文研究的是系統(tǒng)泛化中的系統(tǒng)組合能力。過去,一些專家認為神經(jīng)網(wǎng)絡是沒有系統(tǒng)組合能力的,系統(tǒng)組合能力,簡單來說就是舉一反三,例如人類知道“跳”和“走兩步”就很容易推導出“跳兩次”。

直接看這個有點復雜的圖吧,當然我們就看一小部分:

小球場景

Primitives中有四個字符串代表四個小球,這些就是基本元素,例如dax代表紅球。Function 1中我們很簡單就能看出來,fep是一個函數(shù),代表重復三次,它的使用方法是放在基本元素詞的后面。

沒錯,我們要能做到舉一反三,實際上就是在玩一些推理小游戲,理解已知成分和產(chǎn)生新組合,現(xiàn)在我們就是要讓神經(jīng)網(wǎng)絡學會“舉一反三”。

3.模型架構(gòu)

當然,在擁有極強泛化能力的ChatGPT和GPT-4面前,我是不太相信這些模型不會基礎(chǔ)的舉一反三的。不過畢竟這倆模型都太大了,實在不行就用統(tǒng)計來反駁嘛,況且也沒人真的拆開ChatGPT去看看里面是不是真的存了“跳”和“走兩步”而沒有存“跳兩次”。

沒錯,要說明這個問題,還是要上小模型,本文用到的模型就140萬個參數(shù)(在大模型時代真的算很小了),基本上是標準的Transformer

簡單介紹下吧,我們看到,下方的輸入分為查詢和示例,中間用一些特殊符號隔開,輸出就是查詢對應的輸出。在小球這個例子中我們輸入就是偽語言查詢和一些“偽語言-小球表示”對,其他例子中會有不同的輸入。

沒錯,就這么簡單。

4.元學習的應用

不要忘記本文是元學習方法(實際上本文的元學習叫做組合性元學習 (Meta-learning for Compositionality,MLC),也就是適合這個問題的元學習方法)

也就是說我們有很多個類似小球的例子,這也回答了為什么不能直接拿ChatGPT說系統(tǒng)組合問題被解決了,因為單一的問題說服力并不強。

OK,元學習分內(nèi)循環(huán)和外循環(huán)(不清楚的可以看上面鏈接),內(nèi)循環(huán)就是一個個具體的任務了,而“舉一反三”的能力就是在外循環(huán)中學習的,這樣在測試的時候用新的場景,就能確保模型不是記住了某一特定場景的情況,而是真的學會了從示例中尋找規(guī)則并組合一些示例。

實驗結(jié)果表明,MLC確實能讓神經(jīng)網(wǎng)絡達到人類的泛化水平。當然,我們還是要承認,這任務其實并沒有特別復雜,不過這篇研究也足夠有意義了。


【花師小哲】鑒定網(wǎng)絡熱門(?)AI(19)——神經(jīng)網(wǎng)絡學會了“舉一反三”?的評論 (共 條)

分享到微博請遵守國家法律
繁昌县| 枣强县| 朔州市| 县级市| 无棣县| 赫章县| 玉树县| 扎囊县| 保亭| 天水市| 武清区| 江油市| 报价| 介休市| 惠东县| 汝南县| 成都市| 通海县| 汉沽区| 赤峰市| 探索| 永新县| 化德县| 阳信县| 沂源县| 南康市| 习水县| 汾西县| 侯马市| 开原市| 大洼县| 西宁市| 古交市| 习水县| 岐山县| 绥滨县| 仁化县| 治多县| 出国| 合水县| 绥德县|