YOLO改進(jìn)系列之注意力機(jī)制(ParNetAttention介紹)

ParNet注意力是一種用于自然語言處理任務(wù)的注意力機(jī)制,它是由谷歌在2019年提出的。ParNet注意力旨在解決傳統(tǒng)注意力機(jī)制在處理長序列時(shí)的效率問題。傳統(tǒng)的注意力機(jī)制在計(jì)算注意力權(quán)重時(shí),需要對(duì)所有輸入序列的位置進(jìn)行逐一計(jì)算,這導(dǎo)致了在長序列上的計(jì)算復(fù)雜度較高。而ParNet注意力通過將序列分割成多個(gè)子序列,并對(duì)每個(gè)子序列進(jìn)行獨(dú)立的注意力計(jì)算,從而降低了計(jì)算復(fù)雜度。ParNet Block Attention是ParNet模型的子模塊,可即插即用到其他網(wǎng)絡(luò)模型中。
論文地址:https://arxiv.org/pdf/2110.07641.pdf
倉庫地址:https://github.com/imankgoyal/NonDeepNetworks
模型結(jié)構(gòu)
ParNet是一種基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu),主要用于自然語言處理(NLP)任務(wù)。它的名字來源于其在網(wǎng)絡(luò)中的特點(diǎn):參考性(Par)和注意力(Net)。ParNet的核心思想是通過注意力機(jī)制,讓網(wǎng)絡(luò)在處理序列中的不同位置之間建立參考關(guān)系,從而更好地捕捉序列中的長距離依賴關(guān)系。ParNet的主要特點(diǎn)包括:
l?注意力機(jī)制:ParNet使用注意力機(jī)制來模擬序列中的長距離依賴關(guān)系,這使得網(wǎng)絡(luò)能夠更好地捕捉序列中的上下文信息。這與傳統(tǒng)的RNN和LSTM等序列模型相比,能夠更好地處理長距離依賴關(guān)系。
l?參考性:ParNet通過建立參考關(guān)系,讓網(wǎng)絡(luò)在處理序列中的不同位置之間建立聯(lián)系。這使得網(wǎng)絡(luò)能夠在處理序列時(shí),更好地利用之前的上下文信息,從而提高模型的性能。
l?結(jié)構(gòu)簡潔:ParNet的結(jié)構(gòu)相對(duì)簡單,易于實(shí)現(xiàn)和訓(xùn)練。這使得它成為一種可行的方法,用于解決各種NLP任務(wù)。
ParNet的主要應(yīng)用包括:
l?文本分類:ParNet可以用于文本分類任務(wù),如情感分析、新聞分類等。通過使用注意力機(jī)制,ParNet能夠更好地捕捉文本中的上下文信息,從而提高分類性能。
l?文本摘要:ParNet可以用于文本摘要任務(wù),如自動(dòng)摘要生成、文本縱覽等。通過建立參考關(guān)系,ParNet能夠更好地捕捉文本中的關(guān)鍵信息,從而生成更準(zhǔn)確的摘要。
l?機(jī)器翻譯:ParNet可以用于機(jī)器翻譯任務(wù)。通過使用注意力機(jī)制,ParNet能夠更好地捕捉源語言和目標(biāo)語言之間的上下文信息,從而提高翻譯質(zhì)量。
總體來說,ParNet是一種基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu),它在NLP任務(wù)中表現(xiàn)出色。其注意力機(jī)制和參考性使得網(wǎng)絡(luò)能夠更好地捕捉序列中的長距離依賴關(guān)系,從而提高模型的性能。ParNet的結(jié)構(gòu)簡潔,易于實(shí)現(xiàn)和訓(xùn)練,使其成為一種可行的方法,用于解決各種NLP任務(wù)。ParNet及ParNet block結(jié)構(gòu)如下圖所示。

本文將ParNet Block Attention結(jié)構(gòu)應(yīng)用到Y(jié)OLOv5結(jié)構(gòu)中,利用其捉序列中的長距離依賴關(guān)系來更好的建模前后特征圖之間的聯(lián)系。
實(shí)現(xiàn)代碼

YOLOv5模型改進(jìn)
本文在YOLOv5目標(biāo)檢測算法的Backbone和Head部分分別加入SKAttention來增強(qiáng)目標(biāo)提取能力,以下分別是在Backbone以及Head中改進(jìn)的模型結(jié)構(gòu)和參數(shù)(以YOLOv5s為例)。
在Backbone部分


在Head部分

總結(jié)
ParNet的核心思想是通過注意力機(jī)制,讓網(wǎng)絡(luò)在處理序列中的不同位置之間建立參考關(guān)系,從而更好地捕捉序列中的長距離依賴關(guān)系。本文將ParNet注意力機(jī)制應(yīng)用到Y(jié)OLOv5模型中。此外,ParNet注意力可進(jìn)一步應(yīng)用于YOLOv7、YOLOv8等模型中,歡迎大家關(guān)注本博主的微信公眾號(hào) BestSongC,后續(xù)更多的資源如模型改進(jìn)、可視化界面等都會(huì)在此發(fā)布。另外,本博主最近也在MS COCO數(shù)據(jù)集上跑了一些YOLOv5的改進(jìn)模型,實(shí)驗(yàn)表明改進(jìn)后的模型能在MS COCO 2017驗(yàn)證集上分別漲點(diǎn)1-3%,感興趣的朋友關(guān)注后回復(fù)YOLOv5改進(jìn)。
?