唐宇迪深度學(xué)習(xí)-物體檢測-YOLO系列
對象識別和定位,可以看成兩個任務(wù):找到圖片中某個存在對象的區(qū)域,然后識別出該區(qū)域中具體是哪個對象。
對象識別這件事(一張圖片僅包含一個對象,且基本占據(jù)圖片的整個范圍),最近幾年基于CNN卷積神經(jīng)網(wǎng)絡(luò)的各種方法已經(jīng)能達(dá)到不錯的效果了。所以主要需要解決的問題是,對象在哪里。
最簡單的想法,就是遍歷圖片中所有可能的位置,地毯式搜索不同大小,不同寬高比,不同位置的每個區(qū)域,逐一檢測其中是否存在某個對象,挑選其中概率最大的結(jié)果作為輸出。顯然這種方法效率太低。
?
標(biāo)簽: