自然-通訊:無私探索策略大幅提升機(jī)器人合作效率
▌研究背景
自然界中有許多讓人嘆為觀止的動物集群行為。例如多個(gè)螞蟻可以協(xié)作搬運(yùn)一個(gè)比自己大很多的食物;大雁可以組成隊(duì)形節(jié)省能量從而實(shí)現(xiàn)長途遷徙??茖W(xué)家受到動物集群的啟發(fā)對多機(jī)器人集群系統(tǒng)進(jìn)行了大量的研究。
多機(jī)器人集群系統(tǒng)中一個(gè)重要研究問題是通過分布式協(xié)調(diào)機(jī)制形成期望的隊(duì)形。該隊(duì)形往往對多機(jī)器人系統(tǒng)完成協(xié)同搬運(yùn)、協(xié)同感知等任務(wù)起到重要的作用。
該隊(duì)形控制問題相比許多集群問題有一個(gè)獨(dú)特而重要的技術(shù)挑戰(zhàn):全局隊(duì)形實(shí)際上是一個(gè)全局約束條件。該約束條件使得本來是合作的機(jī)器人之間產(chǎn)生了競爭關(guān)系。從本質(zhì)上來說,正是這種競爭關(guān)系給隊(duì)形控制帶來了極大困難。
傳統(tǒng)方法中往往通過目標(biāo)分配來解決這些競爭問題。然而,當(dāng)分配的目標(biāo)不合理或者某些機(jī)器人出現(xiàn)故障時(shí),需要不斷重分配目標(biāo),因此會導(dǎo)致效率較低,而且容錯(cuò)性適應(yīng)性較弱。
▌新型方法
近期西湖大學(xué)智能無人系統(tǒng)實(shí)驗(yàn)室聯(lián)合北京航空航天大學(xué)、清華大學(xué)以及英國謝菲爾德大學(xué),研發(fā)了一種新型基于“無私”探索機(jī)制的機(jī)器人協(xié)調(diào)算法。相較于現(xiàn)有算法,在集群規(guī)模較大的時(shí)候,“無私”探索算法的效率能夠有數(shù)十倍的提升,并且這種提升會隨著集群規(guī)模的增加而進(jìn)一步增強(qiáng)。此外,該算法由于不依賴于目標(biāo)分配,天然地具有良好的容錯(cuò)性和適應(yīng)能力,可以輕易地拓展應(yīng)用于復(fù)雜空間探索、協(xié)同搬運(yùn)等任務(wù)。

▌算法原理
該算法包含了三個(gè)組成部分,人-集群交互系統(tǒng)、分布式機(jī)器人協(xié)商算法、分布式控制算法(如圖1所示)。其中最核心的是通過Mean-shift的算思想來實(shí)現(xiàn)的無私探索:即當(dāng)一個(gè)機(jī)器人預(yù)測到將與周圍機(jī)器人針對同一個(gè)目標(biāo)位置產(chǎn)生競爭的時(shí)候,會主動放棄該目標(biāo)位置,轉(zhuǎn)而投向更廣闊的區(qū)域。正因?yàn)槭侵鲃颖苊鉀_突而被稱為“無私”策略。該工作也驗(yàn)證了“無私”在集群合作中的關(guān)鍵作用。

▌機(jī)器人平臺
基于該算法,我們研發(fā)了包含50臺地面小車的機(jī)器人集群系統(tǒng)(如圖2所示)。

▌自組織復(fù)雜構(gòu)型
通過機(jī)器人集群系統(tǒng)的驗(yàn)證,該算法能夠形成復(fù)雜非凸形狀。例如一個(gè)“雪花”的形狀是一個(gè)較難形成的隊(duì)形,因?yàn)樗朔浅XS富的枝丫,但是在該算法的推動下,集群系統(tǒng)仍然能夠精確實(shí)現(xiàn)隊(duì)形,而不會陷入局部最優(yōu)(如圖3所示)。


▌高效率
相比最新算法,所提出的“無私”探索算法的效率在集群規(guī)模較大的時(shí)候(例如300個(gè)機(jī)器人)能夠有數(shù)十倍的提升,并且這種提升會隨著集群規(guī)模的增加而進(jìn)一步增強(qiáng)(如圖4所示)。

▌自適應(yīng)性
該算法由于不依賴于目標(biāo)分配等傳統(tǒng)方法,天然地具有對機(jī)器人故障等問題的自適應(yīng)。例如,當(dāng)一部分機(jī)器人被移出集群時(shí),整個(gè)系統(tǒng)不需要任何的故障檢測或容錯(cuò)控制,可以無縫重新組成隊(duì)形,這使得整個(gè)系統(tǒng)具有了一定的“再生”能力(如圖5所示)。


▌協(xié)同貨物搬運(yùn)
無私探索算法的另外一個(gè)特點(diǎn)是能夠通過引入“領(lǐng)導(dǎo)者”實(shí)現(xiàn)對移動目標(biāo)編隊(duì)的跟蹤。這種能力的一個(gè)重要應(yīng)用是實(shí)現(xiàn)多機(jī)器人協(xié)同搬運(yùn)。在這個(gè)過程當(dāng)中一方面機(jī)器人要實(shí)現(xiàn)保持隊(duì)形,另外一方面要跟隨領(lǐng)導(dǎo)者實(shí)現(xiàn)對運(yùn)動軌跡的跟蹤,從而將實(shí)現(xiàn)貨物的搬運(yùn)(如圖6所示)。

▌復(fù)雜環(huán)境探索
此外,該算法可以用于探索復(fù)雜環(huán)境例如迷宮(如圖7所示)。雖然迷宮當(dāng)中有許多轉(zhuǎn)角等非凸結(jié)構(gòu),該方法由于其良好的探索性,能夠成功實(shí)現(xiàn)對迷宮的全覆蓋探索,而不會陷入局部最優(yōu)點(diǎn)。


最后,本工作的視頻介紹請參見以下視頻。
[Nature Communications-2023] 無私探索大幅提升合作效率:基于均值偏移的機(jī)器人集群隊(duì)形控制策略

本文共2714字,申請文章授權(quán)請聯(lián)系后臺運(yùn)營人員?
