03-03-mp4-nn網(wǎng)絡(luò)層-卷積層.mp4

卷積conv
卷積過程,類似于用一個(gè)模板,去圖像上尋找與它相似的區(qū)域,與卷積核模式越相似,激活值越高,也就是特征圖對應(yīng)的位置參數(shù)越高,從而實(shí)現(xiàn)相同特征的提取
卷積運(yùn)算,對應(yīng)位置先相乘,而后把相乘的數(shù)再進(jìn)行相加求和

一個(gè)卷積核在一個(gè)信號(hào)上是幾維卷積,就是幾維卷積
通常會(huì)涉及多個(gè)信號(hào)和多個(gè)卷積核的操作,比如在RGB三通道上,三個(gè)卷積核進(jìn)行的是2D的二維卷積操作,而不是看有幾個(gè)卷積核就是幾維卷積!

nn.Conv2d 對多個(gè)信號(hào)進(jìn)行二維卷積

RF1默認(rèn)為1
根據(jù)公式,L2層的感受野=1+(3-1)=3
L3層的感受野=3+(3-1)=5
output_channels:輸出通道數(shù),也就是輸出特征圖的輸出數(shù)量,等價(jià)于kernel的個(gè)數(shù)
dilation: 空洞卷積大小,默認(rèn)為1。一般用于圖像分割任務(wù),從而增大感受野,增大感受野有利于圖像分割,輸出圖像的一個(gè)像素能看到輸入圖像更大的區(qū)域
感受域:(感受野)
不管結(jié)點(diǎn)多深,感受域的大小始終是指輸入原圖的區(qū)域大小,而不是上一層的區(qū)域大小

RF1默認(rèn)為1
根據(jù)公式,L2層的感受野=1+(3-1)=3
L3層的感受野=3+(3-1)=5
輸出尺寸計(jì)算

dilation=1,padding=0時(shí)

三維張量實(shí)現(xiàn)二維卷積
輸入是RGB三個(gè)通道的二維圖像,其tensor是三維,然后創(chuàng)建三個(gè)二維的卷積核,三個(gè)卷積核分別對應(yīng)三個(gè)通道channels進(jìn)行卷積操作,最后三個(gè)通道的卷積結(jié)果相加,再加上偏置項(xiàng)bias,才得到特征圖的一個(gè)像素點(diǎn)的值!
在這里,一個(gè)卷積核在兩個(gè)維度上進(jìn)行滑動(dòng),所以是二維的卷積操作!

轉(zhuǎn)置卷積:用于對圖像上采樣UpSample


