機(jī)器視覺(jué),與人相近的認(rèn)知外界的方式

人類對(duì)外界的認(rèn)知主要來(lái)源于五種感官,即視覺(jué)、聽覺(jué)、嗅覺(jué)、味覺(jué)和觸覺(jué)五感。因此,當(dāng)前業(yè)界在賦予機(jī)器以類人的知覺(jué)時(shí),也主要據(jù)此分成五個(gè)分支。無(wú)論是虛擬機(jī)器還是實(shí)體機(jī)器,只要是往類人的方向發(fā)展,則都繞不開對(duì)這五類感官的模仿。只不過(guò)根據(jù)定位與功能的不同,而在感官種類與感知程度上有所差異。

深度學(xué)習(xí)能力是反映機(jī)器智能化程度的重要標(biāo)志,因而也是當(dāng)前各大科技公司研發(fā)的重點(diǎn)。通過(guò)研究和模擬人類神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及運(yùn)轉(zhuǎn)方式,并將科研成果逐步應(yīng)用于設(shè)計(jì)實(shí)踐,機(jī)器的深度學(xué)習(xí)能力不斷增強(qiáng),智力日益提高,“思維”變得越來(lái)越像人。不過(guò),要讓機(jī)器能真正像人一樣思考,不僅需要為其配備類人的“大腦”,與人相近的認(rèn)知外界的方式也是不可或缺的。

那么,什么是“與人相近的認(rèn)知外界的方式”呢?機(jī)器視覺(jué)!
機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支。簡(jiǎn)單說(shuō)來(lái),機(jī)器視覺(jué)就是用機(jī)器代替人眼來(lái)做測(cè)量和判斷。機(jī)器視覺(jué)基于仿生的角度發(fā)展而來(lái),比如模擬眼睛是通過(guò)視覺(jué)傳感器進(jìn)行圖像采集,并在獲取之后由圖像處理系統(tǒng)進(jìn)行圖像處理和識(shí)別。
從字面意思來(lái)理解, “視”是將外界信息通過(guò)成像來(lái)顯示成數(shù)字信號(hào)反饋給計(jì)算機(jī),需要依靠一整套的硬件解決方案,包括光源、相機(jī)、圖像采集卡、視覺(jué)傳感器等?!坝X(jué)”則是計(jì)算機(jī)對(duì)數(shù)字信號(hào)進(jìn)行處理和分析,主要是軟件算法。
因此,機(jī)器視覺(jué)系統(tǒng)架構(gòu)主要分為硬件設(shè)備和軟件算法兩部分,其中硬件設(shè)備主要包括光源系統(tǒng)、鏡頭、攝像機(jī)、圖像采集卡和視覺(jué)處理器;軟件包中核心算法主要包括傳統(tǒng)的數(shù)字圖像處理算法和基于深度學(xué)習(xí)的圖像處理算法,例如“DLIA工業(yè)缺陷檢測(cè)”就是一個(gè)基于深度學(xué)習(xí)的圖像處理軟件。

在某些特殊工業(yè)環(huán)境中,比如一些不適于人工作業(yè)的危險(xiǎn)工作環(huán)境(如焊接、火藥制造)人工視覺(jué)可能會(huì)對(duì)操作工的人身安全造成威脅,而機(jī)器視覺(jué)從某種程度上有效地規(guī)避了這些風(fēng)險(xiǎn);或者人工視覺(jué)難以滿足要求(機(jī)械縫隙零件檢測(cè))的場(chǎng)合,常用機(jī)器視覺(jué)來(lái)替代人工視覺(jué)。隨著人工智能應(yīng)用的爆發(fā),作為代表技術(shù)之一的機(jī)器視覺(jué),有望迎來(lái)更大發(fā)展,在智能工廠、無(wú)人商店、自動(dòng)駕駛、機(jī)器人等領(lǐng)域掀起新的風(fēng)暴!