Pixel-BERT
目的:之前都是用Faster R-CNN做目標檢測提取視覺特征,存在噪音冗余和語義鴻溝,通過pixel-based 特征提取,提高視覺表達的魯棒性;
pixel-based:random pixel sampling mechanism,視覺特征提取后,在每個feature map里提取pixel作為視覺特征,相當于feature map內部的dropout。