從計算機圖像、深度學(xué)習(xí)和OpenCV開始(目錄P7)
實例分割和語義分割
用于圖像理解的算法主要有三種:
圖像分類算法使您能夠獲得表示圖像內(nèi)容的單個標(biāo)簽。你可以把圖像分類想象為將一張圖像輸入到網(wǎng)絡(luò)中,并獲得一張標(biāo)簽作為輸出。
目標(biāo)檢測算法不僅能告訴你圖像中是什么,還能告訴你給定目標(biāo)在圖像中的位置。因此,對象檢測器接受單個輸入圖像,然后返回多個值作為輸出。輸出本身是一個值列表,包含(1)類標(biāo)簽和(2)特定對象在圖像中位置的邊界框(x,y)-坐標(biāo)。
實例分割和語義分割使目標(biāo)檢測走得更遠。實例/語義分割方法不是返回邊界框坐標(biāo),而是生成像素級掩碼,告訴我們(1)對象的類標(biāo)簽,(2)對象的邊界框坐標(biāo),以及(3)屬于對象的像素坐標(biāo)。
這些分割算法是中級/高級技術(shù),因此請務(wù)必閱讀上面的深度學(xué)習(xí)部分,以確保您了解基礎(chǔ)知識。
Step #1:配置開發(fā)環(huán)境(初級)
Step #2:分割與目標(biāo)檢測(中級)
Step #3:使用?Mask R-CNN(中級)
Step #4:使用OpenCV進行語義切分(中級)
標(biāo)簽: