最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

從這個角度理解圖像分割比較容易入門

2023-04-25 12:31 作者:深度之眼官方賬號  | 我要投稿

來源:投稿 作者:卷舒
編輯:學(xué)姐

前言

人類對計算機視覺感興趣的最重要的問題是圖像分類 (Image Classification)、目標(biāo)檢測 (Object Detection) 和圖像分割 (Image Segmentation),同時它們的難度也是依次遞增。

在分類任務(wù) (Image Classification) 中,我們只關(guān)注圖片中物體的類別。

目標(biāo)檢測 (Object Detection)任務(wù)中,我們不僅要識別出圖片中物體的類別,同時還要知道這些物體各自在什么地方,我們使用bounding box將這些目標(biāo)框出

而圖像分割 (Image Segmentation)任務(wù)跟目標(biāo)檢測任務(wù)其實有一定的相似,都是識別圖片中的物體并在圖片中標(biāo)注出物體的位置。

只不過不再是用bbox來框出物體,而是精確到像素級,需要我們準(zhǔn)確的知道物體的邊緣在什么地方。通過下方的左右兩張圖片我們可以很明顯地看出目標(biāo)檢測與圖像分割的區(qū)別。

什么是圖像分割

我們知道一張圖片是由一堆像素構(gòu)成的,那么圖像分割(Image Segmentation)可以理解成對每一個像素進行分類的任務(wù)。

有兩種最常見的圖像分割技術(shù):語義分割 (Semantic Segmentation) 和實例分割 (Instance Segmentation)。

語義分割時,在一張圖片中有多個同一類物體的時候,這兩個物體不用被明確的區(qū)分開,他們的像‘’素標(biāo)簽都會是同一類別。

而實例分割時,當(dāng)一張圖片中有多個同一類物體時,不僅需要識別出物體的類別,還需要把兩個同類物體給區(qū)分開。

如上圖所示,在進行語義分割的時候,左邊的兩只狗會被分為同一類,用同一種顏色表示;而在實例分割的時候,左邊的兩只狗會被用不同顏色區(qū)分開,即這兩只狗的上的像素的標(biāo)簽為不同類。

在看下面這張圖。圖(b)就是語義分割,途中的多輛汽車被分為了同一類,用同一種顏色表示;而圖(c)是實例分割,雖然有多輛車,但是他們的標(biāo)簽類別卻是不一樣的,被用不同的顏色標(biāo)記出來。

這里再簡單提一句圖(d)的全景分割(panoptic segmentation)。

我們可以看到對于給定圖片(a)各任務(wù)的groundtruth分別是:

  • 圖(b)的語義分割是逐像素的class labels;

  • 圖(c)的實例分割是逐object的mask和class label;?

  • 圖(d)的全景分割是逐像素的class labels和instance labels。全景分割同時完成語義分割和實例分割任務(wù),需要對圖片中的每一個可見object和region進行辨別與描述。?

全景分割與實例分割,語義分割的不同:?

  • 對比語義分割,全景分割需要區(qū)分不同的 object instances;?

  • 對比實例分割,全景分割不僅分割things(即實力分割中的object),同時分割stuff(指具有相似紋理或材料的無定形區(qū)域,例如草、天空、道路。);?

  • 全景分割需要同時識別stuff和things。?

本教程主要將以語義分割為主。

圖像分割的應(yīng)用

圖像分割的應(yīng)用有很多,下面舉了幾個圖像分割在現(xiàn)實生活中的應(yīng)用

醫(yī)學(xué)影像診斷

通過對MRI,CT,X光等醫(yī)學(xué)影片進行圖像分割,可以輔助醫(yī)生診斷,甚至可以定位到病灶給出診斷結(jié)果。如下圖,左邊第一張圖是大腦的MR原圖,右邊兩張是進行圖像分割后的圖片。

再比如這張胸片,通過圖像分割后,我們可以很清晰的分辨出肺、鎖骨和心臟的位置。

自動駕駛

圖像分割最著名的應(yīng)用應(yīng)該非自動駕駛莫屬了。圖像分割可以幫助汽車通過攝像頭分辨路面、路牌、行人與車輛。可以想象,如果是較為粗略的目標(biāo)檢測的話,很難勝任安全要求如此之高的自動駕駛?cè)蝿?wù)。

自動扣圖

既然圖像分割可以把每個物體所在位置的像素給分別標(biāo)注出來,那么這是不是跟我們的摳圖任務(wù)有類似呢。比如把一張商品的圖片送進模型,通過圖像分割我們是不是可以分辨出哪些像素屬于背景,哪些像素屬于前景(商品)呢?

虛擬試穿

再說最后一個我們生活中有遇到過的運用。不知道大家有沒有在某些購物APP上,使用過3D試穿功能呢。就是選擇好我們想是穿的衣物,通過手機攝像頭對準(zhǔn)我們要試穿的身體部位,那么手機上就會呈現(xiàn)出我們穿上這一衣物的樣子。

這其實也是需要通過圖像分割來分割出我們身體上應(yīng)該穿上衣服的部位的。

同時,還有一種虛擬化妝的任務(wù),其實原理也跟虛擬試穿類似。

Reference

  • Anil Chandra Naidu Matcha. “A 2021 guide to Semantic Segmentation.” https://nanonets.com/blog/semantic-image-segmentation-2020/

  • Jeremy Jordan. “An overview of semantic image segmentation.” https://www.jeremyjordan.me/semantic-segmentation/

  • Fei-Fei Li & Justin Johnson & Serena Yeung. “CS231n: Deep Learning for Computer Vision.” (2017). Lecture11. http://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture11.pdf

  • Pham, Dzung L. et al. “A Survey of Current Methods in Medical Image Segmentation.” (1999).

  • Novikov, Alexey A., et al. "Fully convolutional architectures for multiclass segmentation in chest radiographs." IEEE transactions on medical imaging, 37.8 (2018): 1865-1876.

  • Dhanoop Karunakaran. “Semantic segmentation — Udaity’s self-driving car engineer nanodegree.” https://medium.com/intro-to-artificial-intelligence/semantic-segmentation-udaitys-self-driving-car-engineer-nanodegree-c01eb6eaf9d

  • Wang, Bochao, et al. "Toward characteristic-preserving image-based virtual try-on network." Proceedings of the European Conference on Computer Vision (ECCV). 2018.

關(guān)注【學(xué)姐帶你玩AI】公眾號

回復(fù)“500”獲取圖像分割論文資源

CVPR圖像分割方向論文回復(fù)“CVPR”獲取

從這個角度理解圖像分割比較容易入門的評論 (共 條)

分享到微博請遵守國家法律
乌拉特前旗| 竹山县| 富川| 盘山县| 龙井市| 凉城县| 容城县| 江华| 清镇市| 昔阳县| 锡林浩特市| 甘南县| 濮阳县| 清远市| 仁怀市| 闽清县| 宜黄县| 措勤县| 辽中县| 元氏县| 开平市| 甘孜县| 英超| 静海县| 余姚市| 巴彦淖尔市| 娱乐| 莲花县| 双城市| 习水县| 凤山县| 仁怀市| 平昌县| 绥中县| 富顺县| 仙游县| 阜平县| 涞水县| 平度市| 巴彦淖尔市| 陈巴尔虎旗|