多目標檢測漲點神器:CO-MOT:提升基于端到端 Transformer 的多目標跟蹤性能
CO-MOT以高效的方式在多個數據集上實現了顯著的性能提升,只需要 MOTRv2 38% 的 FLOPs 即可獲得類似的性能,推理速度提高了 1.4 倍!?
現有的端到端多目標跟蹤(e2e-MOT)方法尚未超越非端到端檢測跟蹤方法。 一個潛在的原因是它在訓練期間的標簽分配策略,始終將跟蹤對象與跟蹤查詢綁定在一起,然后將少數新生兒分配給檢測查詢。 通過一對一的二分匹配,這樣的分配將產生不平衡的訓練,如用于檢測查詢的正樣本稀缺,特別是對于封閉的場景,因為大多數newborns?在開始時就上臺。因此,與其他檢測跟蹤方法相比,e2e-MOT 將更容易產生跟蹤終端,而無需更新或重新初始化。為了緩解這個問題,我們提出了 Co-MOT,這是一種簡單有效的方法,通過具有影子概念的新穎的合作競爭標簽分配來促進 e2e-MOT。 具體來說,在執(zhí)行用于訓練中間解碼器的標簽分配時,我們將跟蹤對象添加到檢測查詢的匹配目標中。對于查詢初始化,我們通過一組對其自身干擾有限的影子對應項來擴展每個查詢。通過廣泛的消融,Co-MOT 在無需額外成本的情況下實現了卓越的性能,例如,DanceTrack 上的 HOTA 為 69.4%,BDD100K 上的 TETA 為 52.8%。令人印象深刻的是,Co-MOT 只需要 MOTRv2 38% 的 FLOPs 即可獲得類似的性能,推理速度提高了 1.4 倍。附上代碼以供重新實現。









論文地址:https://openreview.net/forum?id=WLgbjzKJkk
更多論文創(chuàng)新點加微信群:Lh1141755859
公眾號:CV算法小屋
標簽: