目標(biāo)檢測論文《Oriented R-CNN FOR Object Detection》解讀
來源:投稿
作者:摩卡
編輯:學(xué)姐
這篇文是粉絲的投稿哦~寫的簡單易懂。值得大家認(rèn)真閱讀,借鑒一下。如果你也有稿子,可以來投給學(xué)姐,有豐厚稿費(fèi)的哦!
Motivation
由于當(dāng)前的旋轉(zhuǎn)目標(biāo)檢測模型(e.g., Rotated RPN, RoI Transformer)通過引入大量不同大小、角度的Anchors以此提升旋轉(zhuǎn)目標(biāo)檢測的性能,或者是在生成水平Anchors的基礎(chǔ)上進(jìn)行RoI Alignment從而生成更精準(zhǔn)的Oriented Anchors. 但是上述的這些方法在預(yù)測出更精細(xì)Oriented Anchors的同時(shí)也耗費(fèi)了大量的計(jì)算資源。
為了提出一個(gè)優(yōu)雅且高效的旋轉(zhuǎn)目標(biāo)檢測框架,通過本文的調(diào)查,發(fā)現(xiàn)主要限制當(dāng)前模型速度的階段是候選框生成階段,所以能否設(shè)計(jì)一個(gè)簡單、通用的有向候選框生成方法,用于直接生成高質(zhì)量候選框呢?
本文提出了一種有向目標(biāo)檢測方法 Oriented R-CNN。
Method
本文提出了一個(gè)兩階段的有向目標(biāo)檢測方法Oriented R-CNN。Oriented R-CNN由Oriented RPN (Oriented Region Proposal Network)和Oriented R-CNN Head構(gòu)成。
首先通過Oriented RPN (Oriented Region Proposal Network)生成高質(zhì)量有向候選框,然后通過Rotated RoIAlign提取固定大小尺寸的特征,最后將這些特征作為有向頭檢測的輸入,執(zhí)行分類和回歸。網(wǎng)絡(luò)框架圖如下所示:

Oriented RPN是在RPN網(wǎng)絡(luò)上構(gòu)建的,拓展了RNP回歸分支的輸出維度(由原來的4個(gè)變?yōu)?個(gè))以此來生成有向候選框。對于每個(gè)位置的Anchor, Oriented RPN輸出為(x, y, w, h,Δα?, Δβ), 其中(x, y)為有向候選框的中心坐標(biāo),w, h表示有向候選框的寬和高。
(Δα?, Δβ ), 表示有向候選框外接矩形頂邊和右邊的偏移。接下來通過Midpoint Offset Representation得到有向候選框的頂點(diǎn)坐標(biāo)集ν={ν1,ν2,ν3,ν4}。

這樣就在原有水平候選框回歸的基礎(chǔ)上,回歸任意兩條相鄰邊中點(diǎn)的偏移,就能實(shí)現(xiàn)有向候選框的生成。結(jié)果如下圖所示:

Oriented R-CNN Head: 在此階段本文先進(jìn)行候選框調(diào)整操作,將上述提到的有向候選框的頂點(diǎn)坐標(biāo)集ν={ν1,ν2,ν3,ν4}由平行四邊形轉(zhuǎn)換為矩形(將平行四邊形較長的對對角線作為調(diào)整為矩形的對角線)。
然后對所有調(diào)整后的后有向候選框進(jìn)行rotated RoI alignment操作,將得到的特征圖作為有向檢測頭的輸入,執(zhí)行分類和回歸任務(wù)。
Results: Oriented R-CNN在DOTA和HRSC2016 兩個(gè)數(shù)據(jù)集上進(jìn)行驗(yàn)證。

表1:Oriented R-CNN在DOTA數(shù)據(jù)集的結(jié)果。?表示使用多尺度訓(xùn)練多尺度測試。

?表2:Oriented R-CNN在HRSC2016數(shù)據(jù)集的結(jié)果。

表3:Oriented R-CNN與其他有向目標(biāo)檢測方法在速度方面的對比(DOTA數(shù)據(jù)集)。
由上述實(shí)驗(yàn)結(jié)果可以看出Oriented R-CNN是一個(gè)提升有向目標(biāo)檢測效率的同時(shí)還兼顧檢測精度的模型。
未獲得授權(quán),不可以轉(zhuǎn)載,否則將追究法律責(zé)任
—— 正文完 ——
關(guān)注學(xué)姐帶你玩AI
獲得更多論文解讀
在這里等著你學(xué)習(xí)
