《Scikit-Learn與TensorFlow機(jī)器學(xué)習(xí)實(shí)用指南》第13章 卷積神經(jīng)網(wǎng)絡(luò)

來(lái)源:ApacheCN《Sklearn 與 TensorFlow 機(jī)器學(xué)習(xí)實(shí)用指南》翻譯項(xiàng)目
譯者:@akonwang @WilsonQu
校對(duì): @飛龍
盡管 IBM 的深藍(lán)超級(jí)計(jì)算機(jī)在1996年擊敗了國(guó)際象棋世界冠軍 Garry Kasparvo,直到近幾年計(jì)算機(jī)都不能可靠地完成一些看起來(lái)較為復(fù)雜的任務(wù),比如判別照片中是否有狗以及識(shí)別語(yǔ)音。為什么這些任務(wù)對(duì)于人類而言如此簡(jiǎn)單?答案在于感知主要發(fā)生在我們意識(shí)領(lǐng)域之外,在我們大腦中的專門視覺(jué),聽(tīng)覺(jué)和其他感官模塊內(nèi)。當(dāng)感官信息達(dá)到我們的意識(shí)時(shí),它已經(jīng)被裝飾了高級(jí)特征;例如,當(dāng)你看著一只可愛(ài)的小狗的照片時(shí),你不能選擇不看這只小狗,或不注意它的可愛(ài)。你也不能解釋你如何認(rèn)出這是一只可愛(ài)的小狗,這對(duì)你來(lái)說(shuō)很明顯。因此,我們不能相信我們的主觀經(jīng)驗(yàn):感知并不是微不足道的,理解它我們必須看看感官模塊是如何工作的。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是從大腦視覺(jué)皮層的研究中出現(xiàn)的,自 20 世紀(jì) 80 年代以來(lái)它們一直用于圖像識(shí)別。在過(guò)去的幾年里,由于計(jì)算能力的增加,可用訓(xùn)練數(shù)據(jù)的數(shù)量以及第 11 章介紹的訓(xùn)練深度網(wǎng)絡(luò)的技巧,CNN 致力于在某些復(fù)雜的視覺(jué)任務(wù)中做出超出人類的表現(xiàn)。他們使圖像搜索服務(wù),自動(dòng)駕駛汽車,視頻自動(dòng)分類系統(tǒng)等變得強(qiáng)大。此外,CNN 并不局限于視覺(jué)感知:它們?cè)谄渌蝿?wù)中也很成功,如語(yǔ)音識(shí)別或自然語(yǔ)言處理(NLP); 然而,我們現(xiàn)在將專注于視覺(jué)應(yīng)用。
在本章中,我們將介紹 CNN 的來(lái)源,構(gòu)建它們模塊的外觀以及如何使用 TensorFlow 實(shí)現(xiàn)它們。然后我們將介紹一些最好的 CNN 架構(gòu)。
閱讀全文:http://t.cn/RuoETP6