浙大、西交大、悉尼科技大開(kāi)源CARE:使用貝葉斯核推理和優(yōu)化的富置信度自主機(jī)器人
#論文##開(kāi)源# RA-L 2023 | 浙大、西交大、悉尼科技大開(kāi)源CARE:使用貝葉斯核推理和優(yōu)化的富置信度自主機(jī)器人探索 【CARE: Confidence-rich Autonomous Robot Exploration using Bayesian Kernel Inference and Optimization】 文章鏈接:[2309.05200] CARE: Confidence-rich Autonomous Robo... 開(kāi)源代碼:GitHub - Shepherd-Gregory/BKIO-Exploration 在本文中,我們考慮在未知和復(fù)雜環(huán)境中提高基于信息的自主機(jī)器人探索的效率。首先利用高斯過(guò)程( Gaussian process,GP )回歸學(xué)習(xí)一個(gè)代理模型來(lái)推斷查詢控制動(dòng)作的富置信度互信息( confidence-rich Mutual Information,CRMI ),然后采用由CRMI預(yù)測(cè)值和預(yù)測(cè)不確定性組成的目標(biāo)函數(shù)進(jìn)行貝葉斯優(yōu)化( Bayesian optimization,BO ),即基于高斯過(guò)程的貝葉斯優(yōu)化( GP-based BO,GPBO )??梢詫?shí)現(xiàn)具有最高CRMI值的最佳動(dòng)作(利用)和具有高預(yù)測(cè)方差的動(dòng)作(探索)之間的權(quán)衡。為了進(jìn)一步提高GPBO算法的效率,我們提出了一種基于貝葉斯核推理和優(yōu)化的輕量級(jí)信息增益推理方法( BKIO ) BKIO還可以利用有界累積遺憾的BO推斷CRMI并生成最佳行動(dòng),這確保了其與GPBO相當(dāng)?shù)臏?zhǔn)確性,并具有更高的效率。大量的數(shù)值和真實(shí)實(shí)驗(yàn)表明,在不同的非結(jié)構(gòu)化、雜亂環(huán)境中,我們提出的方法在不損失探索性能的情況下達(dá)到了預(yù)期的效率。