深度學(xué)習(xí)多模態(tài)情感識(shí)別科研論文小班第2期
# 查找標(biāo)簽中的每個(gè)像素的類索引,如果說(shuō)每次都遍歷數(shù)組的話是一件非常耗時(shí)的事情# 所以這里構(gòu)建了一個(gè)類似dictionary的數(shù)組# 下標(biāo):256顏色,值:對(duì)應(yīng)的labeldef voc_colormap2label():
? ?"""構(gòu)建從RGB到VOC類別索引的映射"""
? ?# 一維向量
? ?colormap2label = torch.zeros(256**3,dtype=torch.long)
? ?for i, colormap in enumerate(VOC_COLORMAP):
? ? ? ?# 這就是256進(jìn)制轉(zhuǎn)十進(jìn)制,可以這么理解
? ? ? ?colormap2label[(colormap[0]*256+colormap[1])*256 + colormap[2]] = i ? ?return colormap2label# 這里是給你一個(gè)分類后的像素點(diǎn),獲取labeldef voc_label_indices(colormap, colormap2label):
? ?"""將VOC標(biāo)簽中的RGB值映射到他們的類別索引"""
? ?# 因?yàn)橐话憔矸e的輸入都是,通道x高x寬,圖象是高x寬x通道,這里把卷積輸入的格式變成圖象格式
? ?colormap = colormap.permute(1,2,0).numpy().astype('int32')
? ?# print(colormap.shape) # (281, 500, 3),方便計(jì)算下標(biāo)
? ?idx = ((colormap[:, :, 0] * 256 + colormap[:, :, 1]) * 256 + colormap[:, :, 2])
? ?# print(idx.shape) # (281, 500)