什么是卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)模型或類似于人工神經(jīng)網(wǎng)絡(luò)的多層感知器,常用來(lái)分析視覺(jué)圖像。卷積神經(jīng)網(wǎng)絡(luò)的創(chuàng)始人是著名的計(jì)算機(jī)科學(xué)家Yann LeCun,目前在Facebook工作,他是第一個(gè)通過(guò)卷積神經(jīng)網(wǎng)絡(luò)在
上解決手寫(xiě)數(shù)字問(wèn)題的人。卷積神經(jīng)網(wǎng)絡(luò)最早出現(xiàn)在圖像處理和圖像識(shí)別領(lǐng)域,它能夠捕捉每個(gè)樣本中數(shù)據(jù)點(diǎn)之間的空間關(guān)系,也就能識(shí)別出圖像中的是貓還是狗在駕駛推土機(jī)。卷積網(wǎng)絡(luò)(convolutional net),也稱為
(這個(gè)多出來(lái)的n很難發(fā)音),不像傳統(tǒng)的 那樣對(duì)每個(gè)元素(圖像中的每個(gè)像素)分配權(quán)重,而是定義了一組在圖像上移動(dòng)的過(guò)濾器(filter,也稱為卷積核、濾波器或者 )。這就是卷積!在圖像識(shí)別中,每個(gè)數(shù)據(jù)點(diǎn)的元素可以是黑白圖像中的每個(gè)像素點(diǎn),取值是1(on)或0(off)。
為什么選擇卷積?
有時(shí)候可能會(huì)問(wèn)自己,為什么要首先使用卷積操作?為什么不從一開(kāi)始就展開(kāi)輸入圖像矩陣?在這里給出答案,如果這樣做,我們最終會(huì)得到大量需要訓(xùn)練的參數(shù),而且大多數(shù)人都沒(méi)有能夠以最快的方式解決計(jì)算成本高昂任務(wù)的能力。此外,由于卷積神經(jīng)網(wǎng)絡(luò)具有的參數(shù)會(huì)更少,因此就可以避免出現(xiàn)過(guò)擬合現(xiàn)象。
CNN的體系結(jié)構(gòu)
當(dāng)使用普通神經(jīng)網(wǎng)絡(luò)時(shí),需要將輸入數(shù)據(jù)轉(zhuǎn)換為單個(gè)向量。該向量作為神經(jīng)網(wǎng)絡(luò)的輸入,然后向量穿過(guò)神經(jīng)網(wǎng)絡(luò)的各層。在這些層中,每個(gè)神經(jīng)元都與前一層中的所有神經(jīng)元相連接。值得注意的是,同層的神經(jīng)元互不連接。它們僅與相鄰層的神經(jīng)元相連。網(wǎng)絡(luò)中的最后一層是輸出層,它代表最終輸出。
若將這種結(jié)構(gòu)用于圖像處理,它將很快變得難以管理。例如,一個(gè)由256x256RGB圖像組成的圖像數(shù)據(jù)集。由于這是3維圖像,因此將有256 * 256 * 3 = 196,608個(gè)權(quán)重。請(qǐng)意,這僅適用于單個(gè)神經(jīng)元!每層都有多個(gè)神經(jīng)元,因此權(quán)重的數(shù)量迅速增加。這意味著在訓(xùn)練過(guò)程中,該模型將需要大量參數(shù)來(lái)調(diào)整權(quán)重。這就是該結(jié)構(gòu)復(fù)雜和耗時(shí)的原因。將每個(gè)神經(jīng)元連接到前一層中的每個(gè)神經(jīng)元,稱為完全連接,這顯然不適用于圖像處理。
CNN在處理數(shù)據(jù)時(shí)明確考慮圖像的結(jié)構(gòu)。CNN中的神經(jīng)元按三維排列——寬度、高度和深度。當(dāng)前層中的每個(gè)神經(jīng)元都連接到前一層輸出的小塊。這就像在輸入圖像上疊加NxN過(guò)濾器一樣。這與完全連接的層相反,完全連接層的每個(gè)神經(jīng)元均與前一層的所有神經(jīng)元相連。
由于單個(gè)過(guò)濾器無(wú)法捕獲圖像的所有細(xì)微差別,因此需要花費(fèi)數(shù)倍的時(shí)間(假設(shè)M倍)確保捕獲所有細(xì)節(jié)。這M個(gè)過(guò)濾器充當(dāng)特征提取器。如果查看這些過(guò)濾器的輸出,可以查看層的提取特征,如邊緣、角等。這適用于CNN中的初始層。隨著在神經(jīng)網(wǎng)絡(luò)層中的圖像處理的進(jìn)展,可看到后面的層將提取更高級(jí)別的特征。
卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)強(qiáng)大的深度學(xué)習(xí)模型,應(yīng)用廣泛,性能優(yōu)異。卷積神經(jīng)網(wǎng)絡(luò)的使用只會(huì)隨著數(shù)據(jù)變大和問(wèn)題變得更加復(fù)雜變得更加具有挑戰(zhàn)性。
WRITE-BUG研發(fā)團(tuán)隊(duì)衷心希望【W(wǎng)RITE-BUG數(shù)字空間】可以給每位同學(xué)一個(gè)屬于自己的秘密空間,同時(shí)祝愿大家在“公開(kāi)圈子”世界里,遇見(jiàn)志同道合的伙伴們,因?yàn)槲覀兣c大家一樣,都曾孤獨(dú)前行著。



