CV EfficeintDet:將多尺度特征融合和模型縮放結(jié)合的高效目標(biāo)檢...

學(xué)習(xí)目標(biāo)

整篇文章課程安排

論文導(dǎo)讀

單階段vs雙階段

雙階段目標(biāo)檢測(cè)更多出現(xiàn)在anchor base的這一大的主流思想
anchor free思想
anchor-base(無論是單階段or雙階段)就是在output的特征圖上生成大量anchor,這些anchor就會(huì)映射回原圖生成密密麻麻的先驗(yàn)框
anchor-free思想認(rèn)為anchor-base消耗了大量資源,會(huì)使得網(wǎng)絡(luò)速度變慢,所以直接對(duì)關(guān)鍵點(diǎn)預(yù)測(cè),不會(huì)生成大量anchor
無論anchor base還是anchor free都離不開兩個(gè)任務(wù):1、特征提取 2、特征融合
特征提?。壕拖袢祟愐粯樱覀?cè)谂袛鄨D片是什么的時(shí)候,我們會(huì)從圖片中提取有用信息(顏色、輪廓),通過這些特征判斷這是一只貓or一只狗,通過背景判斷我們知道其所處環(huán)境,目標(biāo)檢測(cè)中把特征提取交給CNN(搭建一個(gè)復(fù)雜網(wǎng)絡(luò),使得圖片進(jìn)來以后,特征會(huì)逐層被分離,變成一個(gè)高維信息)
特征融合:在特征提取時(shí),隨著網(wǎng)絡(luò)進(jìn)行,圖片會(huì)越來越小,維度越來越深,不同大小下的特征圖(100x100,10x10)進(jìn)行融合,特征多次利用使得最終目標(biāo)檢測(cè)精度(precision和recall)都會(huì)很高
最終任務(wù)落到2個(gè)地方:1、backbone網(wǎng)絡(luò) 2、多尺度特征融合 3、不同設(shè)備、不同復(fù)雜程度

網(wǎng)絡(luò)結(jié)構(gòu)
注:efficientdet是efficientnet加上特征提取部分組合而成
efficientnet解決分類的事,根據(jù)網(wǎng)絡(luò)復(fù)雜程度可分為B0-B7,與efficientnet對(duì)應(yīng)的det也有從d0-d7的檢測(cè)任務(wù)

橫坐標(biāo)flops,縱坐標(biāo)map
我們用更加簡(jiǎn)單,復(fù)雜程度更小的網(wǎng)絡(luò)就可以達(dá)到之前比較復(fù)雜網(wǎng)絡(luò)的map


研究意義

論文泛讀

摘要

1、BIFPN,簡(jiǎn)單搞笑的多尺度特征融合
2、復(fù)合縮放方法,對(duì)不同尺度進(jìn)行統(tǒng)一縮放(網(wǎng)絡(luò)分辨率,深度,寬度,所有主干,特征融合網(wǎng)絡(luò),box預(yù)測(cè)和分類的預(yù)測(cè)),根據(jù)不同縮放得到d0-d7八個(gè)不同模型

