19 卷積層【動手學深度學習v2】

其實李沐老師這里沒有結(jié)合圖來講卷積啊,剛好我是學過了《信號與系統(tǒng)》和《圖像處理》啊,簡單聊聊我所了解的卷積啊??赡軙绣e誤與紕漏,還望指正與海涵。
- 連續(xù)域的卷積與離散域的卷積
首先聊聊卷積(這部分可以直接跳過,影響不大)。卷積大家一般都是聊連續(xù)域比較多啊,其定義為

結(jié)果被稱之為f(x)與g(x)的卷積。
而離散域與之類似,為

注意,離散域中n的取值為整數(shù),其他則同理,不再贅述。
舉個例子:記x(n),y(n)滿足如下關系
x(1)=1,x(2)=-1,當n取其他值時,x(n)=0;
y(1)=1, y(2)=2,當n取其他值時,y(n)=0;
那么

很自然的h(1)=0;
其他同理。
那么到此為止,我們卷積部分算是差不多講完了。
- 圖像處理中的卷積核
其實無論是叫卷積還是濾波(filter)都無所謂了,反正都是一個東西。說到這個就得提一下圖像了,畢竟是與圖像相關的。大家都是知道圖像都是由像素點組成的,而每個像素點都有一個對應的像素值,根據(jù)值的不同,表現(xiàn)出不同的顏色。比如我們這里可以虛擬一個圖像。

進行卷積操作,我們還需要另外的一個變量,這里我們
虛擬另外一個卷積核

從數(shù)據(jù)科學的角度而言,這兩個都是矩陣。前者是一個5×6的矩陣,而后者是一個3×3的矩陣。我們是很難去直接計算的。所以這里有些小tips!我們只需要依次從大的圖像中采樣一個和我們的核一樣大的圖形,就可以進行卷積操作了。也即,

然后也就可以將這個紅框中的數(shù)據(jù)與我們最初的卷積核進行計算。
也即:

相同顏色的圈圈數(shù)據(jù)相加,也即:
24-23+5-1+10-2=13,
這就是我們口中的離散卷積(求0位置處的值罷了,剛好就是對稱的)。這樣就求到了第一個值,那么我們再滑動卷積核,繼續(xù)以這樣的方式去計算第二個滑塊。

那么不再贅述。
但是這樣計算是很奇怪的,不夠美觀。事實上,數(shù)學以及數(shù)據(jù)科學一定是在追求美觀的!而且也不符合我們數(shù)據(jù)科學的運算(畢竟我們可以直接使用按位乘,然后再求和就行了)。
然后考慮到在運算過程中,卷積核是始終不變的!然后就給他翻轉(zhuǎn),或者不再進行反向運算了。不管怎么理解,總之是不再以那種奇怪的運算方式進行了。就變得正常了。再然后就是,這種稱呼就被流傳下來了...也就是稱為 卷積核(kernel),當然也可以稱之為濾波(filter)。
- 與視頻中的聯(lián)系
很顯然啊,這個就是視頻中所講述的。

卷積核不依賴于當前圖片的位置(i,j),僅取決于自己。具有平移不變性;

卷積運行僅取決于當時的圖像位置(卷積核大小),具有局部性。
- 其他
另外就是說,這樣計算的話,圖像大小就在變小了(因為外圈沒了),所以一般可能要邊界填充(padding),這個后面會講...