CVPR2022車道線檢測(cè)Efficient Lane Detection via Curve Modeling
分享前段時(shí)間看的一篇車道線檢測(cè)方向的新工作,也是中了最近公開結(jié)果的2022CVPR,是上海交大、華東師大、香港城市大學(xué)和商湯科技合作完成的,代碼已經(jīng)開源。關(guān)于車道線檢測(cè)任務(wù),我之前也分享過幾篇文章:
相關(guān)鏈接(點(diǎn)擊進(jìn)入):
車道線檢測(cè)新工作VIL-100: A New Dataset and A Baseline Model for Video Instance Lane Detection
自動(dòng)駕駛視覺感知之語義分割+車道線檢測(cè)demo


論文鏈接:
https://arxiv.org/abs/2203.02431
代碼鏈接:
https://github.com/voldemortX/pytorch-auto-drive
簡介

Lane detection strategies
如上圖所示,基于深度學(xué)習(xí)的車道線檢測(cè)方法可分為三大類:基于分割的方案(圖中綠色示例)、基于點(diǎn)檢測(cè)的方案(圖中藍(lán)色示例)和基于多項(xiàng)式曲線的方案(圖中黃色示例)。
其中基于分割和點(diǎn)檢測(cè)的方案一般效果性能更好,但基于分割方案和基于點(diǎn)檢測(cè)方案的表征是局部的、間接的,且在多項(xiàng)式曲線中的抽象因子(a, b, c, d)難于優(yōu)化。為此,文章提出了基于三次B′ezier 曲線的方案,即上圖中的紅色曲線和虛線框,因?yàn)樨惾麪柷€具有易于計(jì)算、穩(wěn)定、轉(zhuǎn)換自由等特點(diǎn)。此外,作者也設(shè)計(jì)了基于可形變卷積的特征翻轉(zhuǎn)融合模塊,進(jìn)行車道線對(duì)稱屬性的探究。
最終文章的方案在保持高速度(>150FPS)和小尺寸(<10M)的同時(shí),在車道線檢測(cè)基準(zhǔn)數(shù)據(jù)集LLAMAS上取得了新的SOTA表現(xiàn),同時(shí)在TuSimple和CULane數(shù)據(jù)集上取得了競爭力的精度表現(xiàn)。
B′ezier 曲線相關(guān)補(bǔ)充
貝塞爾曲線(以3階為例)是依據(jù)四個(gè)位置任意的點(diǎn)坐標(biāo)繪制出的一條光滑曲線。其通過控制曲線上的四個(gè)點(diǎn)(起始點(diǎn)、終止點(diǎn)以及兩個(gè)相互分離的中間點(diǎn))來創(chuàng)造、編輯圖形。其中起重要作用的是位于曲線中央的控制線。這條線是虛擬的,中間與貝塞爾曲線交叉,兩端是控制端點(diǎn)。移動(dòng)兩端的端點(diǎn)時(shí)貝塞爾曲線改變曲線的曲率(彎曲的程度);移動(dòng)中間點(diǎn)(也就是移動(dòng)虛擬的控制線)時(shí),貝塞爾曲線在起始點(diǎn)和終止點(diǎn)鎖定的情況下做均勻移動(dòng)。



對(duì)于任意階貝塞爾曲線,可通過以下公式進(jìn)行表示:

文章也對(duì)貝塞爾曲線和多項(xiàng)式方程曲線進(jìn)行了對(duì)比實(shí)驗(yàn),如下表所示,表中指標(biāo)是在TuSimple測(cè)試集上的結(jié)果,越低越好。

通過上述實(shí)驗(yàn),文章選擇使用經(jīng)典的3階貝塞爾曲線(n=3), 因?yàn)閷?shí)驗(yàn)中發(fā)現(xiàn)3階足夠用來進(jìn)行車道線建模,同時(shí)與3階多項(xiàng)式曲線相比具有更好的擬合能力,而3階多項(xiàng)式曲線是之前眾多方案中的基礎(chǔ)方程(論文中如此說),實(shí)際小湯在自己參與的部分工作及和同行交流中得知,目前各家實(shí)際量產(chǎn)中的方案也大都為3階多項(xiàng)式曲線方案。文章也指出更高階的曲線并沒有帶來相應(yīng)的性能提升,但卻會(huì)由于高自由度而造成不穩(wěn)定性。
The Proposed Architecture

對(duì)于輸入的RGB圖像,經(jīng)過特征提取得到的特征圖送入特征翻轉(zhuǎn)融合模塊,得到 CxH/16xW/16 大小的特征圖,再經(jīng)過平均池化得到的CxW/16的特征圖,最后經(jīng)過一個(gè)分類和一個(gè)回歸分支得到相應(yīng)的貝塞爾曲線結(jié)果。
Feature Flip Fusion

特征翻轉(zhuǎn)模塊是文章的主要工作之一。
通過對(duì)車道線作為歷史曲線來建模,文章集中于各條車道線的幾何特性,如瘦、長、連續(xù)等特性。當(dāng)從前視相機(jī)的角度來考慮車道線的全局結(jié)構(gòu)事,道路具有空間等分的車道線,近似于對(duì)稱,例如。左邊車道線的存在可能暗示其右側(cè)存在對(duì)應(yīng)的車道線。文章對(duì)這種對(duì)稱性進(jìn)行建模,為此設(shè)計(jì)了特征翻轉(zhuǎn)模塊。
an auxiliary binary segmentation branch
文章還在ResNet backbone上設(shè)計(jì)了一個(gè)額外的二分類分割分支,旨在加強(qiáng)對(duì)于空間細(xì)節(jié)的學(xué)習(xí)。并通過實(shí)驗(yàn)發(fā)現(xiàn)這個(gè)額外的分支只有在和特征翻轉(zhuǎn)融合模塊一起工作時(shí)才起作用。這是因?yàn)榉指钊蝿?wù)的定位有利于提供一個(gè)空間上更準(zhǔn)確的特征圖,這個(gè)反過來支持翻轉(zhuǎn)特征圖之間更準(zhǔn)確融合。
這個(gè)額外的二分類分割分支只在訓(xùn)練時(shí)使用,推理時(shí)關(guān)掉。

文章通過上圖所示的Grad-CAM可視化效果對(duì)這一設(shè)計(jì)的影響進(jìn)行了說明,詳細(xì)細(xì)節(jié)可以閱讀原文。
Overall Loss




因?yàn)樵谲嚨谰€檢測(cè)數(shù)據(jù)集中,并不存在正負(fù)樣本不平衡問題,所以分類和分割都使用了簡單的加權(quán)交叉熵?fù)p失。
Experiments



ablation studies

可視化示例:



視頻demo:

文章給出的是效果比較好的結(jié)果,但是在匝道、大拐彎等場景效果還是有問題,感興趣的朋友可以自己跑一下代碼看看。(以下四張是用文章開源代碼和權(quán)重跑的結(jié)果,感興趣的可以自己跑一下看看)




最后,由于自己對(duì)車道線看的不多,寫作能力也有限,有不對(duì)的地方歡迎大家批評(píng)指正。也歡迎對(duì)車道線檢測(cè)、自動(dòng)駕駛、計(jì)算機(jī)視覺等方向感興趣的朋友加入 自動(dòng)駕駛交流群?一起學(xué)習(xí)一起玩??!
推薦閱讀:(點(diǎn)擊進(jìn)入)
https://www.bilibili.com/video/BV1E54y1V7G4
https://www.bilibili.com/video/BV1Lb4y1Z7fT
https://www.bilibili.com/video/BV15q4y1E7gU?