VGG
假設input 是224*224*3 ,kernel = 3*3 ,stride = 1 ,所以covn卷積操作不會改變圖像尺寸的大小
pool池化層 kernel_size = 2*2 ,stride = 2 ,所以每經(jīng)過一個池化層,圖像尺寸就會減少一半,經(jīng)過5個池化操作,圖像縮小2的5次方倍(32倍),2*2*2*2*2=32
224/32 = 7 最后到達全連接層的尺寸為 7*7*512
VGG的網(wǎng)絡結(jié)構(gòu)

全連接層的參數(shù)占了網(wǎng)絡參數(shù)的大半部分

Q1:為什么使用3*3的卷積核
Q2:1*1卷積核的作用是什么


各向同性縮放( 也叫:等比縮放),長寬縮放比例相同,好處是不破壞原圖的比例
各向異性縮放(也叫:直接變化),直接調(diào)整圖像尺寸,二不考慮圖像物體發(fā)生形變

transform變換增加數(shù)據(jù)量,提高網(wǎng)絡準確度和泛化能力

多尺度訓練,只原圖最小邊在一個范圍內(nèi)變化【256--512】
然后從中隨機截取224*224的圖像塊進行訓練

VGG超參數(shù)的設置

VGG的特點

fc = 權(quán)重的轉(zhuǎn)置*輸入的特征+偏置b


標簽: