最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

CVPR論文解讀 | DSC-PoseNet:通過雙尺度一致性學習6DoF物體姿態(tài)估計

2023-05-22 15:40 作者:BFT白芙堂機器人  | 我要投稿

原創(chuàng) | 文 BFT機器人


圖片


傳統(tǒng)的手工特征描述符通常具有內(nèi)在的旋轉(zhuǎn)不變性,但是最近的深度匹配器通常通過數(shù)據(jù)增強來獲得旋轉(zhuǎn)不變性。


然而,由于增強旋轉(zhuǎn)數(shù)量有限,無法覆蓋連續(xù)SO(3)空間中所有可能的旋轉(zhuǎn),因此這些方法通常在面對罕見旋轉(zhuǎn)時表現(xiàn)不穩(wěn)定。


為了解決這個問題,本篇論文提出了RoITr方法,使用注意力機制和基于點對特征的坐標來處理姿態(tài)變化,并在剛性和非剛性基準測試中進行了廣泛實驗以證明其優(yōu)越性。


圖片


01??該篇論文的創(chuàng)新點


本篇論文的創(chuàng)新點是提出了一種名為RoITr(Ro tation-Invariant Tr ansformer)的新方法,用于解決點云匹配任務中的姿態(tài)變化問題。


該方法使用注意力機制和基于點對特征的坐標來處理姿態(tài)變化,并在剛性和非剛性基準測試中進行了廣泛實驗以證明其優(yōu)越性。與現(xiàn)有的深度匹配器相比,RoITr具有更高的魯棒性和旋轉(zhuǎn)不變性,并且在效率和準確性方面都表現(xiàn)出色。


圖片

圖1是本篇論文中的一個概覽圖,它展示了RoITr的整體架構(gòu)。


本文提出了一種名為RoITr的點云配準算法,它能夠在姿態(tài)不確定的情況下實現(xiàn)高精度的點云配準。RoITr算法主要分為三個步驟:局部幾何編碼、全局上下文聚合和粗到細的匹配。


第一步是局部幾何編碼。


RoITr使用了一個名為Point Pair Feature Transformer(PPFTrans)的編碼器-解碼器架構(gòu),用于對點云進行局部幾何編碼。PPFTrans包含一個編碼器和一個解碼器,其中編碼器由多個Attentional Abstraction Layer(AAL)和Point Pair Feature Attention Layer(PAL)組成。


AAL用于下采樣和抽象化,而PAL則用于對局部幾何進行編碼和上下文聚合。這些層都基于本文提出的PPF Attention Mechanism(PAM),它使得RoITr具有姿態(tài)不變性。


第二步是全局上下文聚合。


RoITr使用了一個堆疊的全局Transformer網(wǎng)絡來對整個點云進行上下文聚合。


這個網(wǎng)絡由多個Transformer塊組成,每個塊都包含多頭自注意力機制和前饋神經(jīng)網(wǎng)絡層。這些塊可以有效地捕獲點云中的全局結(jié)構(gòu)信息,并將其與局部幾何信息相結(jié)合。


第三步是粗到細的匹配。


RoITr使用了一種粗到細的匹配策略,該策略通過逐層下采樣和上采樣來實現(xiàn)。


首先,RoITr將輸入點云分別編碼為超級點P和Q,并提取它們之間的初始匹配集C0。然后,RoITr對P和Q進行逐層下采樣,生成更粗糙的超級點,并提取它們之間的匹配集Ci。


接下來,RoITr對Ci進行上采樣,生成更細致的超級點,并提取它們之間的匹配集Ci+1。這個過程一直持續(xù)到達到所需的匹配精度為止。


02??實驗


實驗主要是針對三維點云匹配和配準問題進行的。


作者提出了一種新的方法RoITr,并將其與七種現(xiàn)有方法進行了比較。實驗使用了3DMatch和3DLoMatch數(shù)據(jù)集,并在旋轉(zhuǎn)和非旋轉(zhuǎn)情況下進行了評估。表格和圖表展示了定量和定性結(jié)果,以及不同方法之間的比較。

圖片

表1展示了在旋轉(zhuǎn)和非旋轉(zhuǎn)的3DMatch和3DLoMatch數(shù)據(jù)集上的定量結(jié)果。


評估使用了5,000個點/對應關(guān)系。只有RMSE小于0.2m的點云被視為正確配準。

圖片

圖2展示了在3DLoMatch數(shù)據(jù)集上的定性結(jié)果。


基準方法是GeoTrans。


圖中的(b)和(c)列顯示了兩個點云之間的對應關(guān)系,而(d)和(e)列則展示了配準結(jié)果。綠色線表示內(nèi)點,紅色線表示外點。


消融實驗:


在本文的Ablation Study中,作者主要對RoITr方法進行了改進和削弱,并比較了這些變化對匹配和配準性能的影響。


具體來說,作者使用Point-Transformer(PT)替換PPFTrans,并將PPF-based local coordinates嵌入到PT中,同時采用PT在PAM中使用的相對坐標。結(jié)果表明,本地坐標表示顯著提高了PT在點云匹配任務中的性能,并使其具有旋轉(zhuǎn)不變性。然而,相對坐標在PAM中失敗了,因為作者采用了一種更有效的注意力機制。


此外,在消融實驗中還比較了不同模型組件的貢獻。例如,在RoITr方法中,Attention Abstraction Layer(AAL)、PPF Attention Layer(PAL)和Transition Up Layer(TUL)是構(gòu)成PPFTrans(PPF Transformer)的關(guān)鍵組件。通過逐步去除這些組件并重新訓練模型,作者發(fā)現(xiàn)每個組件都對最終性能有重要貢獻。


總之,在Ablation Study中,作者通過逐步改變模型并比較結(jié)果來探索RoITr方法的優(yōu)缺點,并確定哪些組件對于該方法的成功至關(guān)重要。

圖片

圖3展示了在4DLoMatch上使用Lepard 作為基準的非剛性匹配的定性結(jié)果。綠色/紅色線表示內(nèi)點/外點。


03??結(jié)論


引入了一種用于點云匹配的內(nèi)在旋轉(zhuǎn)不變模型RoITr。提出了PAM (PPF注意機制),該機制嵌入了基于PPF的局部坐標來編碼旋轉(zhuǎn)不變幾何。


該設計以AAL (Attention Abstraction Layer)、PAL (PPF Attention Layer)和TUL (Transition Up Layer)為核心,它們被連續(xù)堆疊組成PPFTrans (PPF Transformer),用于具有代表性和姿態(tài)無關(guān)的幾何描述。


通過引入一種新的全局變壓器架構(gòu)進一步增強了特征,該架構(gòu)確保了旋轉(zhuǎn)不變的跨幀空間感知。在剛性和非剛性基準上進行了大量的實驗,以證明該方法的優(yōu)越性,特別是對任意旋轉(zhuǎn)的顯著魯棒性。


網(wǎng)址:https://blog.csdn.net/qinglostsoul/article/details/108224863標題Rotation-Invariant Transformer for Point Cloud Matching



更多精彩內(nèi)容請關(guān)注公眾號:BFT機器人

本文為原創(chuàng)文章,版權(quán)歸BFT機器人所有,如需轉(zhuǎn)載請與我們聯(lián)系。若您對該文章內(nèi)容有任何疑問,請與我們聯(lián)系,將及時回應。

CVPR論文解讀 | DSC-PoseNet:通過雙尺度一致性學習6DoF物體姿態(tài)估計的評論 (共 條)

分享到微博請遵守國家法律
永嘉县| 桐梓县| 漳浦县| 珠海市| 德钦县| 临江市| 淳化县| 大化| 凤山县| 张家口市| 梁平县| 宜阳县| 福泉市| 团风县| 廊坊市| 桑植县| 会东县| 呼图壁县| 扶余县| 河曲县| 田东县| 天全县| 游戏| 贵溪市| 广饶县| 白玉县| 开远市| 东海县| 凤山市| 大渡口区| 九寨沟县| 姜堰市| 莆田市| 宁海县| 台江县| 巴林右旗| 昭觉县| 永嘉县| 开平市| 德令哈市| 启东市|