研究目標(biāo)檢測(cè)的同學(xué)看過(guò)來(lái):超越Y(jié)OLOv8!華為提出Gold-YOLO:高效實(shí)時(shí)
超越Y(jié)OLOv8!華為提出Gold-YOLO:高效實(shí)時(shí)目標(biāo)檢測(cè)器 超越Y(jié)OLO系列(v5、v6、v7、v8)!Gold-YOLO:一種全新的實(shí)時(shí)目標(biāo)檢測(cè)器,提出一種GD新機(jī)制,通過(guò)卷積和自注意力操作來(lái)實(shí)現(xiàn),增強(qiáng)了多尺度特征融合能力,并首次在 YOLO 系列中實(shí)現(xiàn)了 MAE 式的預(yù)訓(xùn)練,在所有模型尺度上實(shí)現(xiàn)了延遲和準(zhǔn)確性之間的理想平衡,代碼剛剛開(kāi)源!單位:華為諾亞方舟實(shí)驗(yàn)室 在過(guò)去的幾年中,YOLO 系列模型已成為實(shí)時(shí)目標(biāo)檢測(cè)領(lǐng)域的領(lǐng)先方法。 許多研究通過(guò)修改架構(gòu)、增加數(shù)據(jù)和設(shè)計(jì)新的損失,將基線(xiàn)提升到更高的水平。 然而,我們發(fā)現(xiàn)以前的模型仍然存在信息融合問(wèn)題,盡管特征金字塔網(wǎng)絡(luò)(FPN)和路徑聚合網(wǎng)絡(luò)(PANet)已經(jīng)緩解了這個(gè)問(wèn)題。 因此,本研究提供了一種先進(jìn)的Gatherand-Distribute機(jī)制(GD)機(jī)制,通過(guò)卷積和自注意力操作來(lái)實(shí)現(xiàn)。 這種新設(shè)計(jì)的模型被命名為Gold-YOLO,它增強(qiáng)了多尺度特征融合能力,并在所有模型尺度上實(shí)現(xiàn)了延遲和準(zhǔn)確性之間的理想平衡。 此外,我們首次在 YOLO 系列中實(shí)現(xiàn)了 MAE 式的預(yù)訓(xùn)練,使 YOLO 系列模型可以從無(wú)監(jiān)督預(yù)訓(xùn)練中受益。 Gold-YOLO-N 在 COCO val2017 數(shù)據(jù)集上獲得了出色的 39.9% AP,在 T4 GPU 上獲得了 1030 FPS,比之前具有類(lèi)似 FPS 的 SOTA 模型 YOLOv6-3.0-N 提高了 2.4%。
論文地址:https://arxiv.org/abs/2309.11331 代碼地址:https://github.com/huaweinoah/Efficient-Computing/Detection/Gold-YOLO
研究目標(biāo)檢測(cè)的同學(xué)看過(guò)來(lái):超越Y(jié)OLOv8!華為提出Gold-YOLO:高效實(shí)時(shí)的評(píng)論 (共 條)
