最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

跨域小樣本系列1:簡介篇

2023-05-18 12:22 作者:深度之眼官方賬號  | 我要投稿

來源:投稿 作者:橡皮
編輯:學(xué)姐

引言

IEEE Spectrum在采訪AI領(lǐng)域巨佬吳恩達(dá)(Andrew Ng)時(shí),他表示“對于許多根本不存在巨型數(shù)據(jù)集的產(chǎn)業(yè),重點(diǎn)必須從大數(shù)據(jù)轉(zhuǎn)向優(yōu)質(zhì)數(shù)據(jù)。有50個(gè)經(jīng)過深思熟慮后處理的樣本示例,就足以向神經(jīng)網(wǎng)絡(luò)解釋你想要它學(xué)習(xí)什么?!保↖n many industries where giant data sets simply don’t exist, I think the focus has to shift from big data to good data. Having 50 thoughtfully engineered examples can be sufficient to explain to the neural network what you want it to learn.)由此可見,針對規(guī)模小但精致的數(shù)據(jù)是未來的一個(gè)重要研究方向。

跨域小樣本學(xué)習(xí)

在現(xiàn)實(shí)中的很多場景下,收集大量有標(biāo)簽數(shù)據(jù)是非常昂貴、困難甚至不可能實(shí)現(xiàn)的,如何在低資源場景對下游任務(wù)進(jìn)行性能提升是小樣本學(xué)習(xí)(Few-Shot Learning)重點(diǎn)關(guān)注的問題,目前使用元學(xué)習(xí)(Meta-Learning)方法已經(jīng)能夠很好的滿足小樣本學(xué)習(xí)的需要。隨著研究的發(fā)展和對現(xiàn)實(shí)場景的進(jìn)一步理解,相比小樣本學(xué)習(xí)條件更加苛刻的跨域小樣本學(xué)習(xí)(Cross-Domain Few Shot Learning)成為了近些年來新興的研究話題。

具體來講,對于一些特殊場景下難以收集的數(shù)據(jù),比如皮膚病圖像、飛機(jī)殘骸衛(wèi)星圖像等等,它們在現(xiàn)實(shí)中收集困難、發(fā)生概率極低。跨域小樣本學(xué)習(xí),是希望利用一個(gè)或多個(gè)其他成熟領(lǐng)域(源域)上的先驗(yàn)知識,去解決另一個(gè)缺少樣本的(目標(biāo)域)的復(fù)雜任務(wù)。 同時(shí)值得一提的是,跨域小樣本的問題與人類憑借已有知識去解決從未接觸過領(lǐng)域的新問題的設(shè)定幾乎一樣,它的提出更加符合人工智能模仿人類思考的模式。

針對這個(gè)概念,不得不說很容易與大家所熟悉的域適應(yīng)(Domain Adaptation)、小樣本學(xué)習(xí)(Few Shot Learning)概念相混淆,為方便理解,在此按照自己的理解做出了一個(gè)簡單的概念辨析:

  • 域自適應(yīng)(DA):希望使用在A任務(wù)上學(xué)習(xí)到的先驗(yàn)知識來解決A’任務(wù)。其中兩種任務(wù)類型相同(比如都是分類任務(wù)),但是A任務(wù)與A’任務(wù)存在很大的域跨度(Domain Gap),例如使用白天良好光照條件下的數(shù)據(jù)先驗(yàn)知識試圖解決黑夜條件下的任務(wù)。

  • 小樣本學(xué)習(xí)(FSL):希望使用在A任務(wù)上學(xué)習(xí)到的先驗(yàn)知識來解決B任務(wù),且B任務(wù)的可用數(shù)據(jù)很少。其中兩種任務(wù)類型不同(比如A是分類任務(wù),B是檢測任務(wù)),但是A任務(wù)和B任務(wù)之間幾乎沒有域跨度。

  • 跨域小樣本學(xué)習(xí)(CDFSL):希望使用在A任務(wù)上學(xué)習(xí)到的先驗(yàn)知識來解決B任務(wù),且B任務(wù)的可用數(shù)據(jù)很少。其中兩種任務(wù)類型不同(比如A是分類任務(wù),B是檢測任務(wù)),但是A任務(wù)和B任務(wù)之間有不同程度的域跨度。

在ECCV2020的一篇文章(A Broader Study of Cross-Domain Few-Shot Learning) 中,作者詳細(xì)的給出了關(guān)于跨域小樣本問題的定義并提出了一個(gè)基準(zhǔn)(Benchmark):

數(shù)據(jù)集分別包括植物疾病圖像、衛(wèi)星圖像、皮膚病變的皮膚鏡圖像和X光圖像。 所選數(shù)據(jù)集反映了精確的真實(shí)世界案例,用于跨域小樣本學(xué)習(xí)。此外,從上述領(lǐng)域收集足夠的例子通常是困難的、昂貴的,或者在某些情況下是不可能的!

在這項(xiàng)研究中建立的Benchmark設(shè)定: 使用ImageNet進(jìn)行源域預(yù)訓(xùn)練,使用與自然圖像不同的目標(biāo)域進(jìn)行目標(biāo)評估。相似度由3個(gè)正交標(biāo)準(zhǔn)衡量:

1)是否存在透視失真,

2)語義內(nèi)容,

3)顏色深度。

目標(biāo)類與源類的標(biāo)簽不相交。

?農(nóng)業(yè)病害CropDisease數(shù)據(jù)集:有透視 自然圖像 彩色圖

?衛(wèi)星圖像EuroSAT數(shù)據(jù)集:無透視 自然圖像 彩色圖

?皮膚病的ISIC數(shù)據(jù)集:無透視 醫(yī)學(xué)圖像 彩色圖

?X光胸片ChestX數(shù)據(jù)集:五透視 醫(yī)學(xué)圖像 灰度圖

作者提出的基準(zhǔn)評價(jià)方法與實(shí)驗(yàn)設(shè)置:

作者提出的基準(zhǔn)評價(jià)方法與實(shí)驗(yàn)設(shè)置:

目前CDFSL的研究難點(diǎn)和思路:

① 源域和目標(biāo)域標(biāo)簽不重合(disjoint)

-重新訓(xùn)練最后一層softmax

② 目標(biāo)域的可用標(biāo)簽數(shù)據(jù)極少-fewshot

-新的學(xué)習(xí)策略:learn to learn meta-learning

③ 存在域跨度-domain gap

-域自適應(yīng) 域?qū)R 調(diào)優(yōu)

解決CDFSL的主流方法

① 元學(xué)習(xí)(meta-learning)

-在小樣本學(xué)習(xí)領(lǐng)域非常impressive,但是在跨域小樣本學(xué)習(xí)領(lǐng)域的性能很難與調(diào)優(yōu)相比。

② 遷移調(diào)優(yōu)(fine-tuning)

-性能方面效果雖然比元學(xué)習(xí)要好,但是有一定的上限,究竟在調(diào)優(yōu)時(shí)選擇finetune-all還是finetune last-k layer都是問題...

在下期文章,將會介紹CDFSL的常用數(shù)據(jù)集并分別對任務(wù)設(shè)定詳解,關(guān)注不錯(cuò)過哦~

關(guān)注“學(xué)姐帶你玩AI”公眾號

回復(fù)“500”領(lǐng)取學(xué)姐整理分類好的論文合集

跨域小樣本系列1:簡介篇的評論 (共 條)

分享到微博請遵守國家法律
武平县| 长岭县| 彝良县| 高邮市| 汝阳县| 淳安县| 安平县| 东平县| 昔阳县| 自贡市| 华宁县| 齐齐哈尔市| 清原| 长兴县| 元氏县| 三穗县| 汤原县| 庆阳市| 浦江县| 凤城市| 大宁县| 大化| 顺平县| 利津县| 华容县| 美姑县| 台东县| 安宁市| 长沙县| 长葛市| 民县| 思茅市| 九龙县| 行唐县| 鄂伦春自治旗| 威宁| 称多县| 五指山市| 吉林省| 泰宁县| 莱西市|