深藍(lán)視覺SLAM理論與實(shí)踐(第四期)
視覺SLAM技術(shù)
視覺SLAM是什么?
視覺SLAM主要是基于相機(jī)來(lái)完成環(huán)境的感知工作,相對(duì)而言,相機(jī)成本較低,容易放到商品硬件上,且圖像信息豐富,因此視覺SLAM也備受關(guān)注。
目前,視覺SLAM可分為單目、雙目(多目)、RGBD這三類,另還有魚眼、全景等特殊相機(jī),但目前在研究和產(chǎn)品中還屬于少數(shù),此外,結(jié)合慣性測(cè)量器件(Inertial Measurement Unit,IMU)的視覺SLAM也是現(xiàn)在研究熱點(diǎn)之一。從實(shí)現(xiàn)難度上來(lái)說,大致將這三類方法排序?yàn)椋簡(jiǎn)文恳曈X>雙目視覺>RGBD。

單目相機(jī)SLAM簡(jiǎn)稱MonoSLAM,僅用一支攝像頭就能完成SLAM。最大的優(yōu)點(diǎn)是傳感器簡(jiǎn)單且成本低廉,但同時(shí)也有個(gè)大問題,就是不能確切的得到深度。
一方面是由于絕對(duì)深度未知,單目SLAM不能得到機(jī)器人運(yùn)動(dòng)軌跡及地圖的真實(shí)大小,如果把軌跡和房間同時(shí)放大兩倍,單目看到的像是一樣的,因此,單目SLAM只能估計(jì)一個(gè)相對(duì)深度。另一方面,單目相機(jī)無(wú)法依靠一張圖像獲得圖像中物體離自己的相對(duì)距離。為了估計(jì)這個(gè)相對(duì)深度,單目SLAM要靠運(yùn)動(dòng)中的三角測(cè)量,來(lái)求解相機(jī)運(yùn)動(dòng)并估計(jì)像素的空間位置。即是說,它的軌跡和地圖,只有在相機(jī)運(yùn)動(dòng)之后才能收斂,如果相機(jī)不進(jìn)行運(yùn)動(dòng)時(shí),就無(wú)法得知像素的位置。同時(shí),相機(jī)運(yùn)動(dòng)還不能是純粹的旋轉(zhuǎn),這就給單目SLAM的應(yīng)用帶來(lái)了一些麻煩。
而雙目相機(jī)與單目不同的是,立體視覺既可以在運(yùn)動(dòng)時(shí)估計(jì)深度,亦可在靜止時(shí)估計(jì),消除了單目視覺的許多麻煩。不過,雙目或多目相機(jī)配置與標(biāo)定均較為復(fù)雜,其深度量程也隨雙目的基線與分辨率限制。通過雙目圖像計(jì)算像素距離,是一件非常消耗計(jì)算量的事情,現(xiàn)在多用FPGA來(lái)完成。
RGBD相機(jī)是2010年左右開始興起的一種相機(jī),它最大的特點(diǎn)是可以通過紅外結(jié)構(gòu)光或TOF原理,直接測(cè)出圖像中各像素離相機(jī)的距離。因此,它比傳統(tǒng)相機(jī)能夠提供更豐富的信息,也不必像單目或雙目那樣費(fèi)時(shí)費(fèi)力地計(jì)算深度。