論文解讀 | IROS 2022:對稱性感知形狀先驗(yàn)變形用于直接類別級的物體位姿估計(jì)
原創(chuàng) | 文 BFT機(jī)器人

01?研究內(nèi)容

本篇論文主要研究的是如何準(zhǔn)確地估計(jì)物體的姿態(tài)。
在計(jì)算機(jī)視覺領(lǐng)域中,姿態(tài)估計(jì)是一個(gè)很重要的問題,因?yàn)樗梢詰?yīng)用到很多領(lǐng)域,比如機(jī)器人操作、增強(qiáng)現(xiàn)實(shí)和自動駕駛等。以前的方法通常需要分兩步來完成,第一步是提取物體的特征,第二步是根據(jù)這些特征來估計(jì)物體的姿態(tài)。
但這種方法存在一些問題,比如特征提取和姿態(tài)估計(jì)之間不太一致、形狀先驗(yàn)?zāi)P筒粔驕?zhǔn)確等。因此,本文提出了一種新的方法SSP-Pose來解決這些問題,并在公共基準(zhǔn)測試中取得了最先進(jìn)的性能。
本文所遇到的難點(diǎn)是如何在沒有CAD模型的情況下,對來自已知類別的新實(shí)例進(jìn)行姿態(tài)估計(jì)。這是一個(gè)更具挑戰(zhàn)性的問題,因?yàn)椴煌瑢?shí)例之間存在形狀差異和姿態(tài)變化。此外,傳統(tǒng)的物體姿態(tài)估計(jì)方法通常需要兩個(gè)步驟,即特征提取和姿態(tài)回歸,這兩個(gè)步驟之間可能存在不一致性。
02??該篇論文的創(chuàng)新點(diǎn)
1. 提出了一種新的端到端可訓(xùn)練網(wǎng)絡(luò)SSP-Pose,用于解決物體姿態(tài)估計(jì)中存在的問題,包括形狀先驗(yàn)?zāi)P筒粔驕?zhǔn)確、特征提取和姿態(tài)回歸之間存在不一致性等。
2. 利用對稱先驗(yàn)知識來指導(dǎo)形狀先驗(yàn)變形,并提出了一種對稱性感知匹配損失來緩解形狀先驗(yàn)匹配步驟中的歧義性,從而穩(wěn)定和促進(jìn)類別級別姿態(tài)敏感特征的學(xué)習(xí)。
3. 在公共基準(zhǔn)測試中取得了最先進(jìn)的性能,并且實(shí)現(xiàn)了實(shí)時(shí)推理速度,約為25 FPS。

圖1是本篇論文中的一個(gè)示意圖,用于說明SSP-Pose算法的整體流程。
整體流程:
首先,使用一個(gè)現(xiàn)成的物體檢測器(例如MaskRCNN)對感興趣的物體進(jìn)行分割(b),并從深度圖生成反投影點(diǎn)云(a)。
然后,采用3DGCN作為編碼器來提取觀察到點(diǎn)云F_obs的特征。接下來,使用形狀先驗(yàn)?zāi)P蛯c(diǎn)云進(jìn)行形狀變形,并利用對稱性先驗(yàn)知識來指導(dǎo)形狀先驗(yàn)變形,并使用對稱性感知匹配損失來緩解形狀先驗(yàn)匹配步驟中的歧義性。
最后,將變形后的形狀先驗(yàn)與直接回歸的姿態(tài)進(jìn)行一致性檢查,并輸出物體的姿態(tài)估計(jì)結(jié)果。整個(gè)算法是端到端可訓(xùn)練的,并且可以在公共基準(zhǔn)測試中取得最先進(jìn)的性能。
03??實(shí)驗(yàn)結(jié)果
本篇論文的實(shí)驗(yàn)部分主要使用NOCS-REAL275和NOCS-CAMERA25數(shù)據(jù)集來評估SSP-Pose算法的性能。
其中,NOCS-REAL275是一個(gè)真實(shí)世界的數(shù)據(jù)集,包含了6個(gè)已知類別的物體(瓶子、碗、相機(jī)、罐頭、筆記本電腦和杯子)的4.3k張訓(xùn)練圖像和6個(gè)場景的2.75k張測試圖像。
而NOCS-CAMERA25是一個(gè)合成數(shù)據(jù)集,通過在真實(shí)背景上渲染虛擬物體來生成,與NOCS-REAL275具有相同的類別。它提供了275k張訓(xùn)練圖像和25k張測試圖像。在這些數(shù)據(jù)集上進(jìn)行了大量實(shí)驗(yàn),并與其他最先進(jìn)的方法進(jìn)行了比較,證明了SSP-Pose算法在物體姿態(tài)估計(jì)方面具有很高的準(zhǔn)確性和魯棒性。

圖2 SSP-Pose與DualPoseNet的定量比較。演示了NOCS-REAL275在不同誤差閾值下的精度,包括3D IoU,旋轉(zhuǎn)和平移。

圖3是對SSP-Pose算法在NOCS-REAL275數(shù)據(jù)集上與DualPoseNet算法進(jìn)行比較的結(jié)果。
圖中顯示了不同物體類別的姿態(tài)估計(jì)結(jié)果,包括瓶子、碗、相機(jī)、罐頭、筆記本電腦和杯子。從圖中可以看出,SSP-Pose算法在所有物體類別上都取得了更好的性能表現(xiàn),特別是在相機(jī)這一類別上表現(xiàn)最為突出。
05??總結(jié)
該論文提出了一種新的姿態(tài)估計(jì)算法SSP-Pose,該算法利用形狀先驗(yàn)和類別先驗(yàn)來提高姿態(tài)估計(jì)的準(zhǔn)確性和魯棒性。
實(shí)驗(yàn)結(jié)果表明,SSP-Pose算法在多個(gè)數(shù)據(jù)集上都取得了比其他最先進(jìn)的方法更好的性能表現(xiàn),并且具有25Hz的實(shí)時(shí)推理速度。此外,作者還計(jì)劃將該算法擴(kuò)展到更復(fù)雜的場景中。

標(biāo)題:
SSP-Pose: Symmetry-Aware Shape Prior Deformation for Direct
Category-Level Object Pose Estimation
更多精彩內(nèi)容請關(guān)注公眾號:BFT機(jī)器人
本文為原創(chuàng)文章,版權(quán)歸BFT機(jī)器人所有,如需轉(zhuǎn)載請與我們聯(lián)系。若您對該文章內(nèi)容有任何疑問,請與我們聯(lián)系,將及時(shí)回應(yīng)。