論文解讀 | IROS 2022:基于三維激光雷達(dá)的語義位置識(shí)別和姿態(tài)估計(jì)
原創(chuàng) | 文 BFT機(jī)器人

01 研究背景

這篇論文的背景是在自動(dòng)駕駛和機(jī)器人導(dǎo)航等領(lǐng)域,需要實(shí)現(xiàn)高精度、高效率的定位和地點(diǎn)識(shí)別。然而,傳統(tǒng)的基于GPS或視覺的方法存在一些局限性,尤其在城市峽谷等環(huán)境中無法提供準(zhǔn)確的位置信息。為了解決這一問題,使用3D LiDAR進(jìn)行定位和地點(diǎn)識(shí)別已經(jīng)成為一個(gè)熱門的研究方向。
然而,現(xiàn)有的方法在實(shí)際應(yīng)用中存在一些挑戰(zhàn)。首先,這些方法通常需要大量的存儲(chǔ)空間和計(jì)算資源,限制了它們?cè)趯?shí)際系統(tǒng)中的可行性和效率。其次,對(duì)于復(fù)雜場景中的遮擋和噪聲等問題,現(xiàn)有方法缺乏足夠的魯棒性,導(dǎo)致定位和地點(diǎn)識(shí)別的準(zhǔn)確性下降。
因此,本篇論文的目標(biāo)是提出一種輕量級(jí)、高效、魯棒性強(qiáng)的算法,以解決上述問題。該算法旨在降低存儲(chǔ)需求和計(jì)算復(fù)雜度,以提高系統(tǒng)的效率。同時(shí),它還致力于解決復(fù)雜場景中的遮擋和噪聲等挑戰(zhàn),以提高定位和地點(diǎn)識(shí)別的準(zhǔn)確性。
02?該篇論文的創(chuàng)新點(diǎn)
這篇論文的創(chuàng)新點(diǎn)主要涉及兩個(gè)方面。
1、首先,作者提出了一種名為BoxGraph的新方法,該方法利用3D LiDAR數(shù)據(jù)進(jìn)行語義地點(diǎn)識(shí)別和姿態(tài)估計(jì)。相比傳統(tǒng)方法,BoxGraph方法具有更強(qiáng)的魯棒性和輕量級(jí)計(jì)算的優(yōu)勢。這意味著它能夠更好地應(yīng)對(duì)復(fù)雜場景中的遮擋和噪聲等問題,并且在實(shí)際應(yīng)用中更高效。
2、其次,作者將基于相機(jī)的語義圖像識(shí)別系統(tǒng)特化為基于3D點(diǎn)云的語義圖形識(shí)別系統(tǒng),并對(duì)該系統(tǒng)進(jìn)行了擴(kuò)展,以實(shí)現(xiàn)更精確的姿態(tài)估計(jì)。這一擴(kuò)展使得系統(tǒng)能夠更準(zhǔn)確地估計(jì)物體的位置和方向,從而提高定位和地點(diǎn)識(shí)別的精度。
03?算法具體介紹

圖1本篇論文提出的方法的系統(tǒng)框架圖
使用LiDAR傳感器獲取點(diǎn)云數(shù)據(jù)時(shí),希望將這些數(shù)據(jù)與預(yù)先構(gòu)建好的地圖進(jìn)行匹配,以便實(shí)現(xiàn)定位、導(dǎo)航等應(yīng)用。本文提出了一種匹配方法,具體步驟如下:
1.形狀相似度計(jì)算:
首先,將LiDAR傳感器流的點(diǎn)云表示為一個(gè)圖形^Gs,將預(yù)先構(gòu)建的地圖中的點(diǎn)云表示為另一個(gè)圖形^Gm。然后,使用形狀相似度σv(vi)來找到這兩個(gè)圖形中相同類別的頂點(diǎn)之間的最佳匹配。形狀相似度可以衡量兩個(gè)頂點(diǎn)之間的相似程度。
2.異常值去除:
接下來,使用RANSAC算法來去除匹配中的異常值。RANSAC算法是一種迭代算法,可以通過擬合模型來剔除異常值。在本文中,使用RANSAC算法來估計(jì)相對(duì)變換Ts,即LiDAR傳感器流點(diǎn)云相對(duì)于地圖點(diǎn)云的變換。
3.相似度得分計(jì)算:
為了綜合考慮匹配頂點(diǎn)和邊之間的相似度,引入了相似度得分S。相似度得分S考慮了精細(xì)圖^Gs和^Gm中匹配頂點(diǎn)和邊之間的相似度。具體而言,σe(e12; e56)表示邊之間的相似度,σv(v1; v5)和σv(v2; v6)表示匹配頂點(diǎn)之間的相似度。
4.最佳頂點(diǎn)對(duì)應(yīng)關(guān)系獲?。?/span>
在計(jì)算相似度得分后,可以得到兩個(gè)圖形中最佳頂點(diǎn)的對(duì)應(yīng)關(guān)系W s,m。這個(gè)對(duì)應(yīng)關(guān)系指示了LiDAR傳感器流點(diǎn)云中的每個(gè)頂點(diǎn)與地圖點(diǎn)云中的哪個(gè)頂點(diǎn)匹配。
5.姿態(tài)估計(jì):
有了最佳頂點(diǎn)對(duì)應(yīng)關(guān)系后,使用奇異值分解(SVD)技術(shù)對(duì)頂點(diǎn)質(zhì)心進(jìn)行估計(jì),以獲得6自由度的姿態(tài)。通過計(jì)算頂點(diǎn)質(zhì)心的位移和旋轉(zhuǎn),可以得到LiDAR傳感器流點(diǎn)云相對(duì)于地圖點(diǎn)云的姿態(tài)信息。
6.錯(cuò)誤匹配去除:
為了提高姿態(tài)估計(jì)的質(zhì)量,再次利用RANSAC算法來去除可能存在的錯(cuò)誤匹配。通過迭代計(jì)算,并剔除與擬合模型不符合的匹配對(duì),可以得到更準(zhǔn)確的姿態(tài)估計(jì)結(jié)果。
綜上所述,這種匹配方法通過形狀相似度計(jì)算、RANSAC算法的異常值去除、相似度得分計(jì)算以及奇異值分解和RANSAC算法的姿態(tài)估計(jì)與錯(cuò)誤匹配去除,實(shí)現(xiàn)了LiDAR傳感器流點(diǎn)云與預(yù)先構(gòu)建的地圖點(diǎn)云的精確匹配,并得到了相對(duì)變換和姿態(tài)信息。這種方法可以提高匹配準(zhǔn)確性和姿態(tài)估計(jì)質(zhì)量,為定位和導(dǎo)航等應(yīng)用提供更可靠的結(jié)果。
04?實(shí)驗(yàn)部分

表1展示了使用不同位置識(shí)別方法存儲(chǔ)單個(gè)掃描的全局定位系統(tǒng)的內(nèi)存消耗分析。

表2?SemanticKITTI數(shù)據(jù)集的查準(zhǔn)率和查全率的總和

表3?SemanticKITTI數(shù)據(jù)集的查準(zhǔn)率和查全率曲線
實(shí)驗(yàn)結(jié)果:
在對(duì)語義KITTI數(shù)據(jù)集進(jìn)行的實(shí)驗(yàn)中,作者提出的方法表現(xiàn)出卓越的姿態(tài)估計(jì)和地點(diǎn)識(shí)別性能,為解決相關(guān)問題提供了重要的解決方案。實(shí)驗(yàn)結(jié)果顯示,該方法在各項(xiàng)指標(biāo)上取得了顯著的成績,并具備了在實(shí)際場景中的實(shí)用潛力。
首先,作者的方法在地點(diǎn)識(shí)別方面表現(xiàn)出色,具備準(zhǔn)確的姿態(tài)估計(jì)能力。這意味著該方法能夠精確地確定目標(biāo)在三維空間中的位置、方向和姿態(tài)信息。這對(duì)于自動(dòng)駕駛、導(dǎo)航和環(huán)境感知等應(yīng)用至關(guān)重要,因?yàn)闇?zhǔn)確的姿態(tài)估計(jì)可以為車輛或機(jī)器人做出正確的決策提供關(guān)鍵信息。
其次,作者的方法在沒有地面真值分割的情況下仍然表現(xiàn)出良好的魯棒性。這意味著該方法能夠應(yīng)對(duì)實(shí)際場景中存在的噪聲、不完整數(shù)據(jù)或未標(biāo)記數(shù)據(jù)等挑戰(zhàn),并仍然保持良好的性能水平。這種魯棒性使得該方法具備了在實(shí)際應(yīng)用中部署的能力,并能夠適應(yīng)不同的場景和數(shù)據(jù)條件。
此外,作者的方法在使用預(yù)測分割時(shí)表現(xiàn)出了優(yōu)異的性能,甚至超過了使用地面真值分割的其他方法。這意味著該方法對(duì)于語義分割任務(wù)的預(yù)測能力非常強(qiáng),能夠準(zhǔn)確地將點(diǎn)云數(shù)據(jù)進(jìn)行語義分類,從而提供更準(zhǔn)確的地點(diǎn)識(shí)別結(jié)果。
綜上所述,實(shí)驗(yàn)結(jié)果明確證明了作者提出的方法在語義KITTI數(shù)據(jù)集上具備出色的姿態(tài)估計(jì)和地點(diǎn)識(shí)別性能,并且在實(shí)際應(yīng)用中具有巨大的潛力。這些成果將為相關(guān)領(lǐng)域的研究和應(yīng)用提供有力支持,并為未來的自動(dòng)駕駛和智能導(dǎo)航系統(tǒng)等領(lǐng)域帶來更準(zhǔn)確和可靠的解決方案。
05?結(jié)論
作者提出的基于語義圖的3D點(diǎn)云姿態(tài)估計(jì)和地點(diǎn)識(shí)別方法在KITTI數(shù)據(jù)集上取得了很好的性能,甚至在沒有g(shù)round truth分割時(shí)仍然具有很好的魯棒性。該方法使用預(yù)測分割表現(xiàn)出了很好的性能,甚至優(yōu)于使用ground-truth分割的其他方法。因此,該方法具有很大潛力在實(shí)際應(yīng)用中得到廣泛應(yīng)用。
論文標(biāo)題:
BoxGraph: Semantic Place Recognition and Pose Estimation from 3D LiDAR
更多精彩內(nèi)容請(qǐng)關(guān)注公眾號(hào):BFT機(jī)器人
本文為原創(chuàng)文章,版權(quán)歸BFT機(jī)器人所有,如需轉(zhuǎn)載請(qǐng)與我們聯(lián)系。若您對(duì)該文章內(nèi)容有任何疑問,請(qǐng)與我們聯(lián)系,將及時(shí)回應(yīng)。