最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

ResNet論文逐段精讀【論文精讀】

2023-08-17 22:13 作者:TYの阿凱  | 我要投稿

Motivation:

網(wǎng)絡(luò)變深之后,出現(xiàn)degradation problem,訓(xùn)練精度和測(cè)試精度相比淺層網(wǎng)絡(luò)都下降了

核心思想:

假設(shè)我們要學(xué)的function是H(x),假設(shè)網(wǎng)絡(luò)輸出是F(x),要通過學(xué)習(xí)使F(x)與H(x)之間的差別盡可能地小

現(xiàn)在我們不學(xué)這個(gè),去學(xué)H(x) - x也就是殘差

現(xiàn)在就變成了F(x) = H(x) - x

即F(x) + x = H(x),因此每層網(wǎng)絡(luò)的輸出現(xiàn)在要加上輸入x 再過激活函數(shù)

因?yàn)檎撐闹杏X得,學(xué)習(xí)殘差比學(xué)習(xí)原始的mapping function H(x)會(huì)更容易

另外對(duì)于高通道數(shù)的殘差塊(),加了一個(gè)bottleneck architecture,先用1x1卷積層把通道數(shù)降低,然后再用1x1卷積層把通道數(shù)升回去

一個(gè)細(xì)節(jié):對(duì)于非bottleneck architecture,每個(gè)大層 (論文中table 1的conv2_x就是一個(gè)大層) 的第一個(gè)殘差塊中第一個(gè)3x3的conv,stride是2,因此把輸出的長(zhǎng)寬都減半,而第二個(gè)3x3的conv 則stride為1,輸出的長(zhǎng)寬不變 (源碼中有padding,具體可以看這里的講解https://blog.csdn.net/u014453898/article/details/97115891),所以對(duì)于這樣的殘差塊我們必須要用projection mapping因?yàn)槊總€(gè)feature map (對(duì)每個(gè)channel convolution的output shape) shape不一樣了,對(duì)于剩下的3x3 conv,shape一樣的,我們用identity mapping

這篇知乎文章也講的很好:

https://zhuanlan.zhihu.com/p/152268938

效果:

有殘差連接,收斂更快,網(wǎng)絡(luò)越深時(shí)精度越高


ResNet論文逐段精讀【論文精讀】的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
上栗县| 海兴县| 平南县| 永济市| 惠州市| 嘉祥县| 和顺县| 周口市| 黔西| 西昌市| 辽宁省| 浦北县| 陇南市| 双鸭山市| 大埔县| 独山县| 阜宁县| 南昌县| 马龙县| 盐边县| 永昌县| 宿松县| 莱州市| 峡江县| 金乡县| 东平县| 驻马店市| 安义县| 星子县| 瓦房店市| 新邵县| 新乐市| 枣阳市| 秀山| 河北省| 龙口市| 吐鲁番市| 永康市| 扎兰屯市| 循化| 南木林县|