機(jī)器人學(xué)中部分可觀測(cè)的馬爾可夫決策過程綜述
#論文# TRO 2023| 機(jī)器人學(xué)中部分可觀測(cè)的馬爾可夫決策過程綜述 【Partially Observable Markov Decision Processes in Robotics A Survey】 文章鏈接:Partially Observable Markov Decision Processes in ... 作者單位:漢堡大學(xué)、新加坡國(guó)立大學(xué)、阿爾托大學(xué) 噪聲感知、不完美控制和環(huán)境變化是許多實(shí)際機(jī)器人任務(wù)的定義特征。部分可觀測(cè)馬爾可夫決策過程( POMDP )為不確定性環(huán)境下機(jī)器人決策與控制任務(wù)的建模與求解提供了一種原則性的數(shù)學(xué)框架。在過去的十年中,它已經(jīng)出現(xiàn)了許多成功的應(yīng)用,涵蓋了定位與導(dǎo)航、搜索與跟蹤、自動(dòng)駕駛、多機(jī)器人系統(tǒng)、操縱和人機(jī)交互等領(lǐng)域。 本研究旨在彌補(bǔ)POMDP模型和算法的發(fā)展與應(yīng)用于不同機(jī)器人決策任務(wù)之間的差距。它分析這些任務(wù)的特點(diǎn),并將其與POMDP框架的數(shù)學(xué)和算法特性聯(lián)系起來,以便進(jìn)行有效的建模和求解。 對(duì)于從業(yè)者來說,該調(diào)查提供了一些關(guān)鍵的任務(wù)特征,以決定何時(shí)以及如何成功地將POMDP應(yīng)用于機(jī)器人任務(wù)。對(duì)于POMDP算法設(shè)計(jì)者而言,該綜述為將POMDP應(yīng)用于機(jī)器人系統(tǒng)的獨(dú)特挑戰(zhàn)提供了新的見解,并為進(jìn)一步研究指明了有希望的新方向。