論文閱讀:Zero-shot 綜述
聲明:請(qǐng)勿參考,因?yàn)樵摴P記主要為了自己梳理和表達(dá)知識(shí),附帶大量腦補(bǔ)(否則后果自負(fù))
論文標(biāo)題:A Survey of Zero-Shot Learning:Settings,Methods,and Applications(TIST2019, SCI三區(qū))
1.Introduction
? ? ? ?監(jiān)督學(xué)習(xí)取得了很大的成功。
???????但是,監(jiān)督分類(lèi),通常是需要大量標(biāo)記的數(shù)據(jù)的,另外,習(xí)得的分類(lèi)器只能識(shí)別出訓(xùn)練集里面含有的類(lèi)別,這個(gè)是它的局限。因?yàn)樵谀承┣闆r中,訓(xùn)練集并不充足,或者需要分類(lèi)的對(duì)象并不在訓(xùn)練集包含的類(lèi)別中。(插句題外話(huà),近幾年不是有挺多ood的分類(lèi)算法,發(fā)表在頂刊里了么,可能這篇文章太老了吧)
???????? 為了解決”讓分類(lèi)器去學(xué)習(xí)這些訓(xùn)練實(shí)例很少的類(lèi)“的問(wèn)題,few shot/one shot方法橫空出世啦!在這些方法中,對(duì)“實(shí)例稀少的類(lèi)別”進(jìn)行學(xué)習(xí)的同時(shí),其他類(lèi)別的實(shí)例的內(nèi)容也會(huì)被用上哦。
???????? 接下來(lái)介紹,為了應(yīng)對(duì)這種先前沒(méi)見(jiàn)過(guò)的實(shí)例,文章里列舉了一些方法喔:
1.open set recognition methods
2.cumulative learning and class-incremental learning methods
3.open word recognition
?
???????? 在上述的方法中,如果被測(cè)實(shí)例屬于unseen類(lèi)別(就是說(shuō)在模型學(xué)習(xí)的時(shí)候沒(méi)有該類(lèi)的標(biāo)簽),那么分類(lèi)器就沒(méi)法確定它的標(biāo)簽。但是有些情況下,我們又需要模型能知道它們的標(biāo)簽。下面是一些場(chǎng)景:
目標(biāo)類(lèi)別的數(shù)量非常龐大。比如說(shuō)動(dòng)作檢測(cè)任務(wù),人的動(dòng)作有很多種,但是有標(biāo)記的動(dòng)作就很有限呀,既然標(biāo)記所有的動(dòng)作是不現(xiàn)實(shí)的,那當(dāng)然希望模型能夠識(shí)別unseen類(lèi)別啦。
目標(biāo)類(lèi)別是非常罕見(jiàn)的。比如細(xì)粒度目標(biāo)分類(lèi),我們得辨別出花的不同品種,那很多稀有的品種也沒(méi)法給出標(biāo)記啊,那咱們也希望辨別出來(lái)呀,這就需要zero-shot呀。
目標(biāo)的類(lèi)別經(jīng)常變化。
一些任務(wù)中,獲取標(biāo)記的成本非常高。比如圖像的語(yǔ)義分割問(wèn)題,語(yǔ)義分割是從像素級(jí)別歸類(lèi),也就是需要對(duì)每個(gè)像素進(jìn)行標(biāo)記
?????? 為了解決這個(gè)問(wèn)題,zero-shot learning(zero data learning)就被提出啦!它的目的,我們前面已經(jīng)提過(guò)了,就是去分類(lèi)出那些,屬于“類(lèi)內(nèi)無(wú)標(biāo)記實(shí)例”的類(lèi)別喔。文章中還提到,自從它被創(chuàng)立以來(lái),在ML中發(fā)展很快喔,在CV領(lǐng)域、NLP領(lǐng)域和普適計(jì)算領(lǐng)域有廣泛應(yīng)用喔。
? ? ? ?其實(shí)我有些搞不明白zero-shot learning 和 out-of-distribution(ood) sample識(shí)別之間有什么區(qū)別。zero-shot是去識(shí)別unseen class的類(lèi)別,那么ood samples也算是在分布之外的樣本,也是沒(méi)有標(biāo)記的,他們兩者好像有相通之處哇?
? ? ? ?看了CSDN上一篇博客說(shuō),ood更偏向于異常檢測(cè)。我也記得(憑印象)我在一篇講“Noisy Graph Cleaning”的文章里面看到,作者處理問(wèn)題的背景是關(guān)于應(yīng)對(duì)噪聲數(shù)據(jù)的(學(xué)習(xí)或者檢測(cè)過(guò)程中),給出了ind分類(lèi)和ood檢測(cè)。所以貌似ood更偏向于噪聲數(shù)據(jù)處理吧。