最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

簡(jiǎn)單聊聊圖像分類基礎(chǔ)知識(shí),小白看過來

2022-06-21 15:53 作者:深度之眼官方賬號(hào)  | 我要投稿

作者:LSC 來源:投稿

編輯:學(xué)姐

基礎(chǔ)知識(shí)

1. 具體領(lǐng)域劃分

(1)多類別圖像分類

(2)細(xì)粒度圖像分類

(3)多標(biāo)簽圖像分類

(4)弱監(jiān)督與無監(jiān)督圖像分類

(5)零樣本圖像分類


2.圖像分類問題的3層境界


多類別圖像分類在不同物種的層次上識(shí)別,往往具有較大的類間方差,而類內(nèi)則具有較小的類內(nèi)誤差。

細(xì)粒度圖像分類具有更加相似的外觀和特征,導(dǎo)致數(shù)據(jù)間的類內(nèi)差異較大,分類難度也更高。


實(shí)例級(jí)分類可以看做是一個(gè)識(shí)別問題,比如人臉識(shí)別。


3.傳統(tǒng)圖像分類關(guān)鍵問題

(1)數(shù)據(jù)預(yù)處理 (2)圖像特征 (3)分類模型

分為兩種: 手工特征+分類器、從數(shù)據(jù)自動(dòng)學(xué)習(xí)特征

4. 常用的圖像分類數(shù)據(jù)集

(1) MNIST數(shù)據(jù)集: 發(fā)布于1998年,60000張圖,10類,分布均勻,數(shù)據(jù)集中的”hello world”

在票據(jù)等圖像中裁剪出數(shù)字,將其放在20*20像素的框中,并保持了長(zhǎng)寬比率,然后放在28*28的背景中。


(2) CIFAR10

MNIST的彩色增強(qiáng)版,60000張圖片,大小32*32,10類,均勻分布,都是真實(shí)圖片而不是手稿等,圖中只有一個(gè)主體目標(biāo),可以有部分遮擋,但是必須可辨識(shí)。


(3) CIFAR100

更加細(xì)粒度的CIFAR10,共100類,被分成20個(gè)超類。

每小類包含600個(gè)圖像,其中有500個(gè)訓(xùn)練圖像和100個(gè)測(cè)試圖像。每個(gè)圖像都帶有一個(gè)“精細(xì)”標(biāo)簽(它所屬的類)和一個(gè)粗糙的標(biāo)簽(它所屬的超類)

(4) PASCAL

來源于2005-2012的PASCAL Visual Object Classes(VOC項(xiàng)目),20類,來源于圖片社交網(wǎng)站flickr,總共9963張圖,24640個(gè)標(biāo)注目標(biāo)。

2005年主要用于目標(biāo)檢測(cè),從2007年開始引進(jìn)了圖像分割的標(biāo)注和人體結(jié)構(gòu)布局的標(biāo)注,2010年開始引進(jìn)了行為分類標(biāo)注。


(5)ImageNet數(shù)據(jù)集

包含21841個(gè)類別,14197122張圖片,百萬標(biāo)注框

5 評(píng)估指標(biāo)

(1)正負(fù)樣本

計(jì)標(biāo)簽為正樣本,分類為正樣本的數(shù)目為True Positive,簡(jiǎn)稱TP,標(biāo)簽為正樣本,分類為負(fù)樣本的數(shù)目為False Negative,簡(jiǎn)稱FN,標(biāo)簽為負(fù)樣本,分類為正樣本的數(shù)目為False Positive,簡(jiǎn)稱FP,標(biāo)簽為負(fù)樣本,分類為負(fù)樣本的數(shù)目為True Negative,簡(jiǎn)稱TN。


(2)精確率、召回率、F1值

精度(查準(zhǔn)率):?被判定為正樣本的測(cè)試樣本中,真正的正樣本所占的比例

召回率(查全率):?被判定為正樣本的正樣本占全部正樣本的比例

F1-score是綜合考慮了精度與召回率,其值越大模型越好。

(3)PR曲線

精度與召回率是一對(duì)相互矛盾的指標(biāo),召回率增加,精度下降,曲線與坐標(biāo)值面積越大,性能越好,對(duì)正負(fù)樣本不均衡敏感。

(4)ROC曲線與AUC


橫坐標(biāo)(假陽率)FPR=FP/(FR+TN) 正類中實(shí)際負(fù)實(shí)例占所有負(fù)實(shí)例的比例。

縱坐標(biāo)(正陽率) TPR=TP/(TP+FN) 正類中實(shí)際正實(shí)例占所有正實(shí)例的比例。

正負(fù)樣本的分布變化,ROC曲線保持不變,對(duì)正負(fù)樣本不均衡問題不敏感。

AUC(Area Under Curve):?ROC曲線下的面積,表示隨機(jī)挑選一個(gè)正樣本以及一個(gè)負(fù)樣本,分類器會(huì)對(duì)正樣本給出的預(yù)測(cè)值高于負(fù)樣本的概率。

(5)混淆矩陣

多矩陣分類模型各個(gè)類別之間的分類情況。

對(duì)于k分類問題,混淆矩陣為k*k的矩陣,元素Cij表示第i類樣本被分類器判定為第j類的數(shù)量。

主對(duì)角線的元素之和為正確分類的樣本數(shù),其他位置元素之和為錯(cuò)誤分類的樣本數(shù)。對(duì)角線之和值越大,正確率越高。

混淆矩陣可以很清晰的反映出各類別之間的錯(cuò)分概率,越好的分類器對(duì)角線上的值更大。


(6)0-1損失

只看分類的對(duì)錯(cuò),當(dāng)標(biāo)簽與與類別相等時(shí),loss為0,否則為1。

這個(gè)是真實(shí)的優(yōu)化目標(biāo),但是無法求導(dǎo)和優(yōu)化,只有理論意義。


(7)熵與交叉熵(cross entropy)

熵表示熱力學(xué)系統(tǒng)的無序程序,在信息學(xué)中用于表示信息多少,不確定性越大,概率越低,則信息越多,熵越高。

熵是概率的單調(diào)遞減的函數(shù)。


(8)KL散度

用于估計(jì)兩個(gè)分布p和q的相似性

如果p是一個(gè)已知的分布(標(biāo)簽),則-l(p,p)是一個(gè)常數(shù),此時(shí)KL散度與交叉熵l(p,q)只有一個(gè)常數(shù)的差異。

KL散度的特性是大于等于0,當(dāng)且僅當(dāng)兩個(gè)分布完全相同時(shí)等于0。



簡(jiǎn)單聊聊圖像分類基礎(chǔ)知識(shí),小白看過來的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
文成县| 牙克石市| 历史| 微博| 花垣县| 阿鲁科尔沁旗| 峨山| 九江市| 乃东县| 西昌市| 昌平区| 囊谦县| 永兴县| 九龙城区| 和顺县| 姜堰市| 东明县| 南溪县| 东丽区| 肃宁县| 贡嘎县| 东乡县| 义马市| 钦州市| 安达市| 双柏县| 麻阳| 罗江县| 神农架林区| 靖边县| 天峨县| 胶州市| 洞口县| 电白县| 冀州市| 喜德县| 两当县| 土默特右旗| 平原县| 桓台县| 祁门县|