最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

【花師小哲】鑒定網(wǎng)絡(luò)熱門(?)AI(16)——元學(xué)習(xí)

2023-10-05 10:22 作者:花師小哲-中二  | 我要投稿

好久沒有更新專欄了,最近真的忙的要死,主要是開學(xué)事情多,差點被滾雪球。嘛,這些事情就不多說了,這次來填一個大坑,即元學(xué)習(xí)(應(yīng)該兩個月前就說要寫了),當然不打算說的太多

1.什么是元學(xué)習(xí)

如果是稍微了解機器學(xué)習(xí)的同學(xué)應(yīng)該了解,大部分的神經(jīng)網(wǎng)絡(luò)都是需要大量的訓(xùn)練數(shù)據(jù)的(不然“大數(shù)據(jù)”也就不會變成一個重要概念和學(xué)科了),例如我想讓模型能夠區(qū)分貓狗,那我可能需要至少成百上千張貓狗圖片,對于大模型來說,情況就更加惡化,幾個TB的數(shù)據(jù)都是基本需求。

但是人類卻不需要這么麻煩,我們在面對新事物的時候,往往只需要少量的樣本就可以處理。例如一個研究動物的專家往往只需要幾張圖片就可以認識一個新物種的特征。

當然,人類也不是從一個空空的大腦開始學(xué)習(xí)的,我們有之前的經(jīng)驗,換句話說,我們已經(jīng)學(xué)會了“如何學(xué)習(xí)”。

沒錯,元學(xué)習(xí)就是在學(xué)習(xí)“如何學(xué)習(xí)”。


再舉個例子吧,假設(shè)你是一個快遞公司,每個城市的快遞配送系統(tǒng)都是不一樣的。如果是傳統(tǒng)的機器學(xué)習(xí)算法,那么就是每到一個新的城市,就從頭構(gòu)建自己的快遞配送系統(tǒng),非常麻煩,各個城市間的系統(tǒng)沒有相互借鑒,也不能相互通用。

但是如果我們先建立幾家,然后根據(jù)這幾家總結(jié)經(jīng)驗教訓(xùn),就可以為新的城市的快遞配送系統(tǒng)建設(shè)提供幫助,例如我們可能需要一些基礎(chǔ)配置模板之類的。

2.元學(xué)習(xí)與少樣本學(xué)習(xí)

從上面可以看出,元學(xué)習(xí)與小樣本往往是分不開的,畢竟元學(xué)習(xí)的目的就是“快速適應(yīng)新任務(wù)”,一般來說就是5-shot,就是我給你5個樣本你就要適應(yīng)新任務(wù)??吹?-shot,可能有朋友就會想到GPT-3zero-shot、one-shotfew-shot,沒錯,這幾個概念也是借鑒的元學(xué)習(xí)。

3.元學(xué)習(xí)方法

目前元學(xué)習(xí)主要分為三類方法:

(1)基于距離的方法。這部分其實和對比學(xué)習(xí)非常相似,可以參照:

【花師小哲】當代煉金術(shù)(神經(jīng)網(wǎng)絡(luò))前沿(6)——對比學(xué)習(xí)

Siamese Neural Networks


(2)基于學(xué)習(xí)的方法。算是最有元學(xué)習(xí)味道的方法了,因為目的確實就是“學(xué)習(xí)如何學(xué)習(xí)”,思路也不復(fù)雜,就是先在各個任務(wù)上訓(xùn)練,然后找到一個到這些任務(wù)都更近的點,或者說就是綜合這些任務(wù)上訓(xùn)練的結(jié)果來當做“經(jīng)驗”。具體還是有點復(fù)雜的,不展開。代表方法有MAML和OpenAI的Reptile(眾所周知Reptile是“爬行動物”的意思,OpenAI的想法是,元學(xué)習(xí)是容易被特化來適應(yīng)新任務(wù)的,進化潛力強,就像蜥蜴那樣??上КF(xiàn)在是LLM的羊駝時代了,也就是哺乳動物占優(yōu))

MAML


(3)基于幻覺(這個幻覺 不是大模型中的幻覺)的方法。你讓我用5張照片適應(yīng)新任務(wù)我當然做不到了,于是我要更多的樣本(幻覺)來訓(xùn)練。沒錯,就是加一個生成器來根據(jù)少樣本生成大樣本。

當然這種方法的一個大問題是,小樣本壓力并沒有消失,而是轉(zhuǎn)移到了生成器的這邊

4.元學(xué)習(xí)與多任務(wù)學(xué)習(xí)

元學(xué)習(xí)沒有成為主流的原因之一就是“多任務(wù)學(xué)習(xí)”的存在。

多任務(wù)學(xué)習(xí),簡單來說就是把一大推任務(wù)一股腦的讓一個模型學(xué)習(xí),一般來說任務(wù)越多樣,模型泛化效果越好。當然,現(xiàn)在的多任務(wù)學(xué)習(xí)都是大模型+大數(shù)據(jù)。

其實從效果上來說,兩者(元學(xué)習(xí)中主要指基于學(xué)習(xí)的方法)確實很相似,有論文這樣區(qū)別兩者,即多任務(wù)微調(diào)會偏向于數(shù)據(jù)多的任務(wù),而元學(xué)習(xí)更一視同仁。



其實還是有些難以理解,但一篇論文(Self-Destructing Models: Increasing the Costs of Harmful Dual Uses of Foundation Models)給出了一個新的思路,即在基于學(xué)習(xí)的元學(xué)習(xí)方法中,我們既可以讓我們的模型能夠更快地適應(yīng)新的任務(wù),也可以反過來做,讓我們的模型能夠更慢地適應(yīng)一些新任務(wù),這就是多任務(wù)學(xué)習(xí)很難做到的事情了。

你說這種做法有什么用?其實用處還是很大的,例如有些人喜歡微調(diào)現(xiàn)有的模型來生成有害內(nèi)容,那我們就可以讓這個模型非常難適應(yīng)有害任務(wù),這樣這些人就會發(fā)現(xiàn)微調(diào)這個現(xiàn)有模型還不如自己從頭訓(xùn)練省錢,就能保住現(xiàn)有模型的聲譽。

5.結(jié)語

可以看到,元學(xué)習(xí)仍然是很有潛力且很有意思的方法,但是和強化學(xué)習(xí)很像,處于本身方法發(fā)展其實不是特別好也不是特別火,但是總能在各種其他的領(lǐng)域露一手、化腐朽為神奇。


【花師小哲】鑒定網(wǎng)絡(luò)熱門(?)AI(16)——元學(xué)習(xí)的評論 (共 條)

分享到微博請遵守國家法律
富裕县| 枣阳市| 分宜县| 长岛县| 三门峡市| 淅川县| 台州市| 安庆市| 白城市| 土默特左旗| 塔城市| 崇文区| 宁河县| 曲周县| 方山县| 海兴县| 铁岭市| 梨树县| 丹阳市| 凉山| 神农架林区| 常州市| 安康市| 星座| 绥德县| 垦利县| 临漳县| 精河县| 东至县| 甘孜县| 正镶白旗| 新源县| 陵川县| 布尔津县| 衡阳县| 西乡县| 武乡县| 平果县| 古浪县| 秦皇岛市| 利津县|