2-3卷積神經(jīng)網(wǎng)絡(luò)丨深度學(xué)習(xí)丨機(jī)器學(xué)習(xí)丨Python丨人工智能丨高等數(shù)學(xué)丨AI丨

卷積神經(jīng)網(wǎng)絡(luò)CNN 、卷積、池化、FC層
卷積作用是為了進(jìn)行特征提取
一個(gè)卷積核相當(dāng)于一個(gè)特征濾波器,提取一個(gè)特征。
CNN網(wǎng)絡(luò)不斷前后向的計(jì)算學(xué)習(xí),一直在更新出合適的weights,也就是一直在更新卷積核們。卷積核在更新了,學(xué)習(xí)到的特征也就被更新了(因?yàn)榫矸e核的值(weights)變了,與上一層的map卷積計(jì)算的結(jié)果也就變了,得到的新map就也變了。對(duì)分類問題而言,對(duì)圖像提取特征,再以合適的特征來判斷它所屬的類別。
總結(jié):更新卷積核參數(shù)(weights),就相當(dāng)于是一直在更新所提取到的圖像特征,以得到可以把圖像正確分類的最合適的特征們。
卷積層
input by 卷積核kernel 是對(duì)應(yīng)位置和kernel權(quán)重相乘后相加,而非兩個(gè)矩陣相乘

填充Padding

步長(zhǎng)Stride:特征圖大小會(huì)縮小1/s倍

計(jì)算公式
k: kernel
p: padding

多通道卷積:channel表示通道數(shù),在RGB圖像中channel=3
notice:圖中一個(gè)卷積核2*2*2(C,H,W)有兩個(gè)通道channel,注意是一個(gè)卷積核?。o 他是一個(gè)3D張量tensor
W:1*2*2*2(B,C,H,W)B代表卷積核的數(shù)量

下圖右邊表示RGB三通道,兩個(gè)卷積核,kernel為3*3,兩個(gè)卷積核輸出兩張?zhí)卣鲌D。
對(duì)應(yīng)input通道與對(duì)應(yīng)卷積核權(quán)重相乘相加后,三個(gè)通道的值最后相加,再加上偏置項(xiàng)bias即可得到特征圖最終的數(shù)值。
雖然卷積核是一個(gè)3D張量,但是執(zhí)行的是2D的卷積操作,卷積是在兩個(gè)維度(rows,cols)行和列上執(zhí)行,通常RGB圖像卷積都是2D卷積操作,3D卷積常用于視頻中,多出了一個(gè)時(shí)間維度

池化層
最大池化 max pooling
平均池化 average pooling
輸出尺寸和卷積公式一致


K1=(6*1*5*5)六個(gè)卷積核,一個(gè)輸入通道,卷積核大小5*5
features: 卷積、池化
classifier:全連接層,接受特征,輸出分類
