【論文復現(xiàn)代碼數(shù)據(jù)集見置頂評論】3小時高效復現(xiàn)CV計算機視覺經(jīng)典論文!論文精講&

讀什么論文

如何找論文
(知網(wǎng),找優(yōu)質綜述快速入門)
百度學術、google scholar
arXiv

如何找論文
PMID(PubMed Unique Identifier,PubMed唯一標識碼):PubMed搜索引擎中收錄的生命科學和醫(yī)學等領域的文獻編號
DOI(Digit Object Unique Identifier,數(shù)字對象唯一標識符),相當于文獻的數(shù)字身份證

如何整理論文
時間-作者-題名
時間-關鍵詞-題名

論文管理軟件,endnote,Mendeley,

讀論文的困境

不同人群閱讀差異

讀論文三部曲、泛讀、精讀、總結


回答問題

可借鑒地方總結

論文結構

論文代碼學習:任務定義-數(shù)據(jù)來源-運行環(huán)境-運行結果-如何實現(xiàn)

基礎知識

baseline
CV\NLP

細分專題

學習路徑

本篇論文
《ImageNet Classification with Deep Convolutional Neural Network》

前期知識儲備

論文總覽

學習目標:卷積核可視化、模型結構設計、ILSVRC(數(shù)據(jù)集)
減輕過擬合

研究背景

ILSVRC:大規(guī)模圖像識別挑戰(zhàn)賽


強大計算資源——GPU

研究背景、成果及意義
研究成果

研究意義:拉開卷積神經(jīng)網(wǎng)絡統(tǒng)治計算機視覺的序幕,加速計算機視覺應用落地
端到端實現(xiàn)


安防領域的人臉識別、行人檢測、智能視頻分析、行人跟蹤

論文結構

摘要


AlexNet結構


卷積輸出特征圖大小計算

連接數(shù)量計算公式

AlexNet結構特點

ReLU非線性


LRN:局部響應標準化


訓練技巧:減少過擬合

數(shù)據(jù)增強



Dropout

實驗結果及分析



卷積可視化

可用Alexnet提取高級特征進行圖像檢索,圖像聚類

論文總結

關鍵點:
- 大量帶標簽數(shù)據(jù)——ImageNet
- 高性能計算資源——GPU
- 合理算法模型——深度卷積神經(jīng)網(wǎng)絡
創(chuàng)新點:
- 采用ReLU加快大型神經(jīng)網(wǎng)絡訓練
- 采用LRU提升大型網(wǎng)絡泛化能力
- 采用Overlapping Pooling提升指標
- 采用隨機裁剪翻轉及色彩擾動增加數(shù)據(jù)多樣性
- 采用Dropout減輕過擬合
啟發(fā)點


【論文復現(xiàn)代碼數(shù)據(jù)集見置頂評論】3小時高效復現(xiàn)CV計算機視覺經(jīng)典論文!論文精講&的評論 (共 條)
