小花仙子風(fēng)格化三維靜幀全流程案例不是你一個(gè)人在學(xué)

具體內(nèi)容放在我的首頁(yè)動(dòng)態(tài)介紹了

? 在上一講中,我們對(duì)卷積神經(jīng)網(wǎng)絡(luò)中的卷積操作進(jìn)行了詳細(xì)的解讀,但僅僅是對(duì)二維圖像,即通道數(shù)為 1 的圖像(灰度圖)進(jìn)行了卷積,對(duì)于三維或者更高維的圖像卷積顯然并沒(méi)有這么簡(jiǎn)單。
????? 如果圖像大小為 6*6*3,那么這里的 3 指的是三個(gè)顏色通道,你可以將其理解為 3 個(gè) 6*6 的圖像的堆疊,如果要對(duì)此圖像進(jìn)行卷積的話,我們的濾波器也需要變成三維的,假設(shè)采用一個(gè) 3*3*3 的濾波器對(duì)其進(jìn)行卷積(這里需要注意的是,濾波器的通道數(shù)一定要等于輸入圖像的通道數(shù)),根據(jù) ((n+2p-f)/s)+1 的計(jì)算公式我們可以知道輸出圖像的大小為 4*4*1,由一個(gè)濾波器進(jìn)行卷積之后輸出圖像的通道不是 3 而是 1 了。
?我們用第一個(gè)濾波器進(jìn)行卷積得到一個(gè) 4*4 的輸出,然后用第二個(gè)濾波器進(jìn)行卷積又得到一個(gè) 4*4 的輸出,將這個(gè)輸出放到第一個(gè)輸出后面,形成了一個(gè) 4*4*2 的輸出,這里的 2 的就是濾波器的個(gè)數(shù)。
????? 關(guān)于多通道卷積的另一種理解類(lèi)似于 DNN 中的標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)中的 Z=Wx+b 的線性計(jì)算,其中 x 為輸入的原始圖像,W 為濾波器,b 偏差項(xiàng),卷積過(guò)程就類(lèi)似與標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)的線性計(jì)算,完了之后利用激活函數(shù)進(jìn)行激活。還有一個(gè)關(guān)鍵問(wèn)題就是卷積層有多少參數(shù),卷積層的參數(shù)通常在于濾波器 W,根據(jù)濾波器的大小,我們可以計(jì)算一個(gè)濾波器的參數(shù)數(shù)量為 f*f*nc,其中 nc 為通道熟量,那 k 個(gè)濾波器所含的參數(shù)數(shù)量則為 ?f*f*nc*k。
????卷積過(guò)程到此就差不多解釋完了。我們?cè)倏?CNN 的另一個(gè)重要操作——池化(pooling)。簡(jiǎn)單來(lái)說(shuō),池化層是用來(lái)縮減模型大小,提高模型計(jì)算速度以及提高所提取特征的魯棒性。池化操作通常有兩種,一種是常用的最大池化(max pooling),另一種是不常用的平均池化(average pooling)。池化操作過(guò)程也非常簡(jiǎn)單,假設(shè)池化層的輸入為一個(gè) ?4*4 的圖像,我們用最大池化對(duì)其進(jìn)行池化,執(zhí)行最大池化的樹(shù)池是一個(gè) ?2*2 的矩陣,執(zhí)行過(guò)程就是將輸入矩陣拆分為不同區(qū)域,對(duì)于 ?2*2 的輸出而言,輸出的每個(gè)元素都是其對(duì)應(yīng)區(qū)域的最大元素值