【軌跡預測】軌跡預測常用方法介紹
軌跡預測是一項廣泛應用于多個領域的科學技術,無論是交通規(guī)劃、無人駕駛汽車、運動員訓練,還是風暴路徑預測,都離不開軌跡預測。本文旨在介紹軌跡預測的基本概念、主要方法和發(fā)展趨勢,以期為感興趣的讀者提供一個科普性的參考。
1.軌跡預測的定義
運動預測(motion prediction)指機器人能夠預測物體的未來狀態(tài),包括軌跡預測、路徑預測、位姿預測等。軌跡預測是運動預測的一個子領域,指在給定一個目標過去或當前運動軌跡的情況下,對其未來位置、速度、方向等狀態(tài)信息進行預測的任務。它是許多領域中重要的組成部分,在機器人、自動駕駛、無人飛行器、運動分析等領域有著廣泛的應用。路徑預測(path prediction)是軌跡預測的一個子領域,軌跡被定義為帶時間戳的幾何位置的序列[1],路徑則不包含時間屬性。下圖是一個行人軌跡預測示意圖[2]。

軌跡的表示方法常見的有三種:單一軌跡(single trajectory)、參數(shù)分布(parametric distribution)、非參數(shù)分布(non-parametric distribution)[3]。軌跡預測根據時間長短可分為兩種:短期(short-term)預測和長期(long-term)預測,短期預測一般指0-2秒的預測范圍,長期預測一般指2-20秒(不同領域中時間范圍不同)。
2.軌跡預測的建模方法
軌跡預測的建模一般可分為3類:基于物理模型的方法(Physics-based Approaches)、基于運動模式的方法(Pattern-based Approaches)和基于規(guī)劃的方法(Planning-based Approaches)[3]。
▌基于物理模型的方法:這類方法利用物理模型(如動力學模型或運動學模型)來描述目標的運動規(guī)律,并根據當前狀態(tài)來推斷未來狀態(tài)。其流程屬于“感知-預測”,方法包括基于單模型的方法(勻速模型、勻加速度模型、自回歸模型等)和基于多模型的方法。這類方法簡單高效,不需要訓練數(shù)據,但忽略了環(huán)境和交互因素,因此不適用于復雜環(huán)境,只適用于短期軌跡預測,只適用于無障礙物的開放環(huán)境。
▌基于運動模式的方法:這類方法遵循“感知-學習-預測”的流程,從訓練數(shù)據中學習得到動態(tài)模型,統(tǒng)計行為模式,然后進行預測。這類方法可分為兩類:基于概率的模型(例如不確定性感知的方法、基于高斯過程的方法、基于可及集的方法)和基于學習的模型(例如CNN、RNN、LSTM、基于軌跡聚類的方法等)。這些方法適用于有復雜未知動態(tài)物體的環(huán)境,適用于長期軌跡預測,但需要大量的訓練數(shù)據。
▌基于規(guī)劃的方法:這類方法遵循“感知-推理-預測”的流程,結合運動目的來推斷長期路徑,包含意圖推斷的內容,也可結合環(huán)境語義信息。這類方法也可分為兩類:前向規(guī)劃的方法(例如Motion and path planning methods、Multi-agent forward planning)和反向規(guī)劃的方法(例如Single agent inverse learning、Imitation learning、Multi-agent inverse learning)。這些方法同樣適用于長期的軌跡預測。這些方法可參考下表[3]:

這三類建模方法也可以進行互相結合,例如基于規(guī)劃的方法和基于物理模型的方法進行結合,或者兩種基于學習的方法互相結合,如CNN+LSTM,可得到更高的預測精度。圖2展示了一個利用CNN和LSTM來進行4D軌跡預測(aircraft領域)的框架[4],該框架結合了卷積神經網絡(CNN)和長短時記憶(LSTM)。一維卷積被用于提取軌跡的空間維度特征,而長短時記憶被用來挖掘軌跡的時間維度特征。文中將CNN+LSTM方法應用于固定翼大型客機的軌跡預測,流程框架如圖2所示。

圖3展示了Google利用VectorNet(一種分層圖神經網絡)來進行軌跡預測的方法[5]。

Uber公司則使用了不同的策略,他們提出了LaneRCNN,一個以圖為中心的運動預測模型,以分布式和結構化的方式捕捉智能體之間以及智能體與地圖的關系,依靠專門設計的圖形編碼器為每個智能體編碼其過去的運動和本地地圖拓撲結構[6]。LaneRCNN示意圖如圖4所示。

3.軌跡預測的語義信息
文獻[7]調研了自動駕駛領域行人和車輛的運動預測(motion prediction)。作者將預測系統(tǒng)分成了三部分:情景感知(situational awareness)、預測模型(modelling approach)、預測輸出(output type),如圖5所示。其中情景感知屬于環(huán)境語義信息,其可作為運動預測的輸入特征來輔助進行運動預測,以提高預測的精確性;預測模型部分則重點討論了軌跡預測(trajectory prediction)的內容;運動預測的輸出格式除了軌跡預測之外,還包含意圖預測等內容。

語義信息作為軌跡預測的輔助信息,本身并不直接產生預測的軌跡,而是和上面軌跡預測的建模方法相結合,以產生更精確的預測信息。語義信息通??煞譃槿悾耗繕酥悄荏w信息(Target Agent)、動態(tài)智能體信息(Dynamic Agents)、靜態(tài)環(huán)境信息(Static Environment)[3],如下表所示。

4軌跡預測的評價指標評價指標是用來衡量預測模型的質量和性能的標準。文獻[3]中將軌跡預測的評價指標分為兩類:基于幾何精度和基于概率精度?;趲缀尉鹊闹笜肆炕祟A測軌跡與真實軌跡之間的偏差或距離,例如最終位移誤差、平均位移誤差等指標。但幾何精度指標的缺點之一是無法衡量不確定性,也無法衡量預測的多模態(tài)性質,當預測的軌跡以軌跡簇的形式給出,或者以概率位置分布的形式給出時,這種場景下可使用概率精度的指標來評估。這兩種評價指標總結如下所示:

5.軌跡預測的未來發(fā)展方向
軌跡預測領域仍然有許多有待探索的方向。例如:
如何利用更多的環(huán)境信息和語義信息來提高預測結果的可靠性?
如何設計更有效的交互建模方法來提高預測結果的魯棒性?
如何結合不同類型的預測方法來提高預測結果的準確性?
如何利用社會規(guī)則和心理模型來增強軌跡預測的可解釋性和可靠性?
如何利用不確定性量化和風險評估來保證軌跡預測的安全性和穩(wěn)定性?
軌跡預測技術正處于快速發(fā)展的階段,未來有望取得更大的突破。計算機視覺、深度學習和神經網絡等新興技術的應用,也為軌跡預測提供了更強大的工具。此外,與其他領域的交叉應用將會推動軌跡預測的創(chuàng)新,例如結合人工智能和大量真實數(shù)據,實現(xiàn)更智能的軌跡預測。本文對軌跡預測的基本概念、主要方法和發(fā)展趨勢進行了簡要介紹,希望能夠激發(fā)讀者對這一領域的了解和興趣,也希望有更多的讀者加入到這一領域的探索中。
參考文獻
[1] Chekol, A.G. and Fufa, M.S. (2022) “A survey on next location prediction techniques, applications, and challenges,” EURASIP Journal on Wireless Communications and Networking, 2022(1). Available at: https://doi.org/10.1186/s13638-022-02114-6.
[2] Korbmacher, R. and Tordeux, A. (2022) “Review of pedestrian trajectory prediction methods: Comparing deep learning and knowledge-based approaches,” IEEE Transactions on Intelligent Transportation Systems, 23(12), pp. 24126–24144. Available at: https://doi.org/10.1109/tits.2022.3205676.
[3] Rudenko, A. et al. (2020) “Human motion trajectory prediction: A survey,” The International Journal of Robotics Research, 39(8), pp. 895–935. Available at: https://doi.org/10.1177/0278364920917446.
[4] Ma, L. and Tian, S. (2020) “A hybrid CNN-LSTM model for aircraft 4D trajectory prediction,” IEEE Access, 8, pp. 134668–134680. Available at: https://doi.org/10.1109/access.2020.3010963.? ??
[5] Gao J, Sun C, Zhao H, et al. Vectornet: Encoding hd maps and agent dynamics from vectorized representation[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 11525-11533.
[6] Zeng W, Liang M, Liao R, et al. LaneRCNN: Distributed Representations for Graph-Centric Motion Forecasting[J]. arXiv preprint arXiv:2101.06653, 2021.
[7] Gulzar, M., Muhammad, Y. and Muhammad, N. (2021) “A survey on motion prediction of pedestrians and vehicles for autonomous driving,” IEEE Access, 9, pp. 137957–137969. Available at: https://doi.org/10.1109/access.2021.3118224.封面圖:Alahi A, Goel K, Ramanathan V, et al. Social LSTM: Human trajectory prediction in crowded spaces[C]. Proceedings of the IEEE conference on computer vision and pattern recognition. 2016: 961-971.

本文共2946字申請文章授權請聯(lián)系后臺運營人員
