【沈向洋帶你讀論文】Dynamic Head——首次突破COCO單模型測(cè)試60A

多重注意力機(jī)制統(tǒng)一目標(biāo)檢測(cè)

動(dòng)機(jī)

單類(lèi)別到多類(lèi)別
骨干網(wǎng)提特征,第二個(gè)目標(biāo)檢測(cè)頭
骨干網(wǎng)得到的特征適配到目標(biāo)檢測(cè)的任務(wù)上
尺度問(wèn)題很重要,相機(jī)拍攝的時(shí)候它總是有透視變化,近大遠(yuǎn)小,不同物體也會(huì)有大有小
空間性,物體看的角度不同,它呈現(xiàn)出的旋轉(zhuǎn)或者大小都會(huì)有差別
任務(wù)性,不光要檢測(cè)這個(gè)物體還要把它所對(duì)應(yīng)的mask也弄出來(lái),甚至來(lái)說(shuō)表達(dá)這個(gè)物體的時(shí)候,我們不光可以用框也可以用這個(gè)點(diǎn),甚至用一些extreme point來(lái)表達(dá)這個(gè)物體,任務(wù)多樣性就是
這篇文章考慮到不同的work側(cè)重的點(diǎn)都不一樣,輸入的角度也不一樣,考慮能否把這些事情統(tǒng)一起來(lái),提供一個(gè)統(tǒng)一的框架來(lái)更好的表達(dá)

統(tǒng)一模型

級(jí)聯(lián)
decouple
作為插件普適性,插拔

實(shí)驗(yàn),不同組合有效性
先后順序沒(méi)有做徹底

開(kāi)源代碼

?
14:40
?transformer的大數(shù)據(jù)適配能力是非常強(qiáng)的
參數(shù)動(dòng)態(tài)
transformer vs CNN

標(biāo)簽: