詳解遙感影像變化檢測(cè)新方法MLDANets
來源:投稿 作者:xin
編輯:學(xué)姐
論文標(biāo)題:
Multilevel Deformable Attention-Aggregated Networks for Change Detection in Bitemporal Remote Sensing Imagery
Motivation
本文指出:
(1)當(dāng)前基于自注意力(Self-attention, SA)的變化檢測(cè)方法只處理了單一特征層級(jí)的長(zhǎng)期依賴,而忽略了跨多個(gè)特征級(jí)別的上下文依賴關(guān)系。所以模型不能充分的利用多尺度上下文信息而限制模型性能;
(2)此外提取全局依賴信息通常會(huì)有很高的計(jì)算復(fù)雜度。為了緩解上述問題,論文提出了多級(jí)可變形注意聚合網(wǎng)絡(luò)(MLDANets)。
Method:
MLDANets的框架如下圖所示,下面從特征提取、特征變換、多層變化感知變形注意力(MCDA Model)、解碼器幾方面進(jìn)行介紹。


MCDA Model:
MCDA模塊將作為輸入,對(duì)特征進(jìn)行參考系內(nèi)歸一化、位置編碼、可變形采樣、以及注意力特征聚合操作。下面將介紹具體操作。

坐標(biāo)系內(nèi)特征歸一化: 為了規(guī)范多層特征中像素的位置,論文使用笛卡爾坐標(biāo)系和參考點(diǎn)建立了參考系。參考系將二維圖像空間劃分為各個(gè)網(wǎng)格,然后使用公式(2)的方法進(jìn)行歸一化,確定圖像中第z個(gè)像素的位置。

位置編碼: 為了將空間信息注入到BDFH中并且確保每個(gè)查詢特征(Query)都有唯一的一個(gè)位置向量,故對(duì)BDFH使用正弦函數(shù)、余弦函數(shù)進(jìn)行了空間編碼,其計(jì)算公式如下:


可變形采樣: 受到可變形卷積啟發(fā),引入可變形采樣策略,使得使MCDA模塊根據(jù)每個(gè)查詢?cè)氐膮⒖嘉恢?,逐步聚焦于一組包含信息特征的特定關(guān)鍵空間采樣位置。給定查詢?cè)兀ㄟ^線性映射學(xué)習(xí)采樣偏移量
。接著通過
便可得到最終的采樣位置。將BDFH
通過線性變換
得到投影特征值V,接著利用類似于可變形卷積雙線性差值的方式計(jì)算采樣特征值。
注意力權(quán)重: 本文在計(jì)算注意力權(quán)重時(shí)使用了一種基于位置的函數(shù),其中對(duì)齊分?jǐn)?shù)僅從使用帶有位置編碼的查詢特性計(jì)算。這簡(jiǎn)化了對(duì)齊評(píng)分函數(shù),因?yàn)樗灰蕾囉谕ㄟ^線性投影獲得的位置嵌入查詢特征。計(jì)算過程如公式(3)所示:

特征值聚合: 在得到采樣特征值和注意力權(quán)重后,采用對(duì)應(yīng)元素相加的方法便可得到單個(gè)注意力頭的聚合特征,再將所有頭的特征拼接起來,通過線性變換,便得到所有注意力頭的特征值。
CNN解碼器: 在獲取到MCDA模塊的輸出特征后,使用轉(zhuǎn)置卷積構(gòu)成解碼器將特征恢復(fù)到原圖大小。

Results:



表1、表2、表3表明,論文提出的方法在Levir、LM以及SECOND數(shù)據(jù)集上達(dá)到了SOTA效果。
關(guān)注【學(xué)姐帶你玩AI】公眾號(hào)
回復(fù)“遙感”免費(fèi)獲取遙感經(jīng)典高分論文PDF