EGE-UNET,超強二分類醫(yī)療圖像分割網(wǎng)絡(luò)
在二分類分割任務(wù)上表現(xiàn)優(yōu)異,參數(shù)量少的情況下仍然有超強表現(xiàn)的網(wǎng)絡(luò)。
Key Word:
1.Group multi-axis Hadamard Product Attention module (GHPA):對每一組做一次HPA,獲得不同視角的信息
2.Group Aggregation Bridge module (GAB):融合多尺度特征雖然大模型的準(zhǔn)確度在皮膚病分割上表現(xiàn)足夠好,但是參數(shù)量太大,提出的UNext等模型雖然參數(shù)少但是表現(xiàn)不夠好,所以提出了HPA方法來減少注意力機制的參數(shù)量,根據(jù)multi-head mode又提出了GHPA,還可以融合多視角信息。
參數(shù)量和MIoU:

網(wǎng)絡(luò)結(jié)構(gòu):

該網(wǎng)絡(luò)的encoder由六個階段組成,channel分別為{8,16,24,32,48,64},前三階段使用普通卷積,后三階段使用提出的GHPA來提取不同層級的信息,使用GAB來代替普通的skip connection,進而連接encoder和decoder部分,與此同時,該模型還借鑒了Unet++里的deep supervision來生成不同尺度下的mask,并將其運用于loss和GAB的輸入部分。
流程偽代碼:

卷積部分使用深度可分離卷積,降低參數(shù)量,四個維度分別操作,每個維度為C/4 1.將輸入在維度角度分成四等分,并且分別對height-width、channel-height、channel-width三個兩兩聯(lián)合的維度進行HPA操作,對應(yīng)上面的Pxy、Pzx和Pzy以及x1、x2、x3,對于第四個部分x4只進行深度可分離卷積DW,最后concatenate并且用DW聚合不同角度的信息。 ps:所有DW的kernel size都是3。
Group Aggregation Bridge(GAB)結(jié)構(gòu):

三個部分作為輸入,分別是高層次特征、低層次特征和mask。 1.首先對高層次特征進行kernel size=1的深度可分離卷積,之后進行雙線性插值。 2.將處理后的高層次特征和低層次特征進行分割,在維度方面變成四等分,再一一對應(yīng)組合成為fused features,最后組合上mask。 3.不同dilated rates={1,2,5,7}、kernelsize=3的空洞卷積被運用到四個fused features,從而獲得不同尺度下的信息。 4.最后將這四個尺度信息concatenate起來,對整合后的特征進行kernelsize=1普通卷積,從而讓不同尺度信息交互融合。 ps:經(jīng)過卷積后,sum(Xh,1,4)=sum(Xl,1,4)
Loss函數(shù):

因為GAB操作中需要涉及到不同尺度下的mask信息,所以引入了UNet++的deep supervision操作來計算不同階段的loss,loss function如上圖所述。 Bce:binary cross entropy Dice:Dice loss 權(quán)重lambda:1,0.5,0.4,0.3,0.2,0.1對應(yīng)六個階段,可以看到第一個階段的權(quán)重是最大的。
設(shè)備及超參數(shù):

實驗結(jié)果:
ISIC2017及ISIC2018結(jié)果:


消融實驗:

從消融實驗中可以看到,這幾個模塊也都是有用的,可以嘗試遷移應(yīng)用。
后面作者本人又遷移到了自己的一個二分類醫(yī)療分割項目中,驗證EGE-UNET確實具有論文中效果,結(jié)果可復(fù)現(xiàn),是個好文章。
Ruan, Jiacheng, et al. "EGE-UNet: an Efficient Group Enhanced UNet for skin lesion segmentation."?arXiv preprint arXiv:2307.08473?(2023).
EGE-UNET,超強二分類醫(yī)療圖像分割網(wǎng)絡(luò)的評論 (共 條)
