四足機(jī)器狗最新突破!只用攝像頭,就能在崎嶇地形靈活前進(jìn)!(附論文原文下載)
原創(chuàng)/文 BFT機(jī)器人
近日,2022 CS Rankings全球計(jì)算機(jī)專業(yè)繼續(xù)蟬聯(lián)第一的卡內(nèi)基梅隆大學(xué),發(fā)表了關(guān)于四足機(jī)器狗的最新研究。

卡內(nèi)基梅隆大學(xué)附近的公園最近出現(xiàn)了一道引人注目的“風(fēng)景線”。
這個(gè)四足機(jī)器狗,是阿加瓦爾的“新寵”,它是一個(gè)特別的機(jī)器狗。其獨(dú)特性在于,它與其他嚴(yán)重依賴內(nèi)置地圖才能實(shí)現(xiàn)四處走動(dòng)的機(jī)器狗不同,它的行動(dòng)依賴于內(nèi)置攝像頭,以此達(dá)到計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)的作用。
阿加瓦爾是卡內(nèi)基梅隆大學(xué)的一名在讀博士生,他所在的研究團(tuán)隊(duì)開發(fā)了一種新型技術(shù)——可以讓機(jī)器人利用計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)在復(fù)雜地形上行走,他們希望這項(xiàng)技術(shù)能夠幫助機(jī)器人更方便部署到融入人們的生活之中。
技術(shù)詳解
自然界的動(dòng)物能夠依據(jù)自身的視覺來捕捉周圍環(huán)境,從而進(jìn)行精確而敏捷的運(yùn)動(dòng),復(fù)制動(dòng)物的這項(xiàng)能力一直以來都是機(jī)器人領(lǐng)域長(zhǎng)期追求的目標(biāo)。傳統(tǒng)的實(shí)現(xiàn)方法,是將這個(gè)問題分解為高程映射和立足點(diǎn)規(guī)劃階段。這種方法的局限在于,高程映射容易出現(xiàn)故障并且會(huì)受到噪音影響,并需要搭配專門的硬件。
阿加瓦爾團(tuán)隊(duì)研究的這項(xiàng)新技術(shù),開發(fā)了一個(gè)能夠穿越樓梯、路邊、墊腳石和縫隙的端到端運(yùn)動(dòng)系統(tǒng),并首次在使用單個(gè)前置深度相機(jī)的中型四足機(jī)器狗上運(yùn)用了這一技術(shù)。

研究人員在模擬中訓(xùn)練,訓(xùn)練包括兩個(gè)階段。首先,使用強(qiáng)化學(xué)習(xí)訓(xùn)練一個(gè)具有廉價(jià)計(jì)算的深度圖像變體的策略,然后在第 2 階段將其提煉成使用深度學(xué)習(xí)的最終策略。由此產(chǎn)生的策略無需任何微調(diào)就能輕松轉(zhuǎn)移到現(xiàn)實(shí)世界中,并且可以穿越各種地形,同時(shí)對(duì)推動(dòng)、濕滑表面和巖石地形等擾動(dòng)具有魯棒性。
墊腳石和縫隙
該機(jī)器狗能夠跨過各種配置的酒吧臺(tái)凳,并調(diào)整步幅大小以跨過大間隙。由于后腳附近沒有視野,機(jī)器狗必須記住酒吧臺(tái)凳的位置并相應(yīng)地放置后腳。


樓梯和路邊
該機(jī)器狗能夠爬上 24 厘米高、30 厘米寬的樓梯,同時(shí)爬上 26 厘米高的路邊。先前的運(yùn)動(dòng)技術(shù),依賴于機(jī)器人周圍和下方地形的度量高程地圖。這種深度圖像融合成一個(gè)單一的高程圖,需要不同時(shí)間的攝像機(jī)之間的相對(duì)姿勢(shì)來規(guī)劃腳步和關(guān)節(jié)角度。因此,在現(xiàn)實(shí)世界中需要使用視覺或慣性測(cè)距法跟蹤以獲得這種相對(duì)姿勢(shì)。

由于四足機(jī)器狗的尺寸相對(duì)較小,即使是合理高度的障礙物也無法越過。而這項(xiàng)新技術(shù)可以在沒有任何先驗(yàn)因素的情況下,穿越復(fù)雜地形,使機(jī)器人在髖關(guān)節(jié)高度為28厘米的情況下,能夠穿越高度為25厘米的樓梯,相當(dāng)于其自身身高的89%,顯著高于任何其他依賴步態(tài)先驗(yàn)的現(xiàn)有方法。

研究人員的策略適用于在各種照明條件下的不同樓梯和路邊。

在分布不均的樓梯和路緣石上,機(jī)器狗最初會(huì)被卡住,但最終能夠使用緊急攀爬行為穿越它們。

非結(jié)構(gòu)化地形
機(jī)器狗可以穿越不屬于其訓(xùn)練類別之一的非結(jié)構(gòu)化地形。這顯示了新技術(shù)系統(tǒng)的泛化能力。


黑暗中的運(yùn)動(dòng)
深度相機(jī)使用紅外光投射圖案,即使在幾乎沒有環(huán)境光的情況下也能準(zhǔn)確估計(jì)深度。

魯棒性
機(jī)器狗訓(xùn)練有素的策略對(duì)大力量(從高處投擲 5 公斤重物)和濕滑表面(水倒在塑料布上)具有魯棒性。

但也有失敗案例
機(jī)器人狗從高路邊掉下來,由于傾角太大,沒有自上而下的攝像頭和前置攝像頭指向正前方,無法從前置攝像頭看到它的范圍,機(jī)器狗從路邊高處臺(tái)階掉了下來。

由于從記憶中檢索凳子位置錯(cuò)誤,機(jī)器狗后腿踩到了缺口(相機(jī)只能看到前面的凳子)。這是也是研究人員在不同凳子配置的 16 次運(yùn)行中,觀察到的唯一一次失敗運(yùn)行。

加州大學(xué)伯克利分校的研究生 Ashish Kumar 說,與市場(chǎng)上現(xiàn)有的機(jī)器狗不同,例如波士頓動(dòng)力公司的spot,它使用內(nèi)部地圖四處移動(dòng),而這種機(jī)器狗僅使用攝像頭來指導(dǎo)其在野外的運(yùn)動(dòng)。也有其他使用攝像機(jī)提示來引導(dǎo)機(jī)器人移動(dòng)的技術(shù)嘗試,但僅限于平坦地形,而無法讓他們的機(jī)器人走上樓梯、爬上石頭并跳過縫隙。
這個(gè)四足機(jī)器狗首先被訓(xùn)練在一個(gè)模擬器的不用環(huán)境中運(yùn)動(dòng),因此它對(duì)在公園里行走或上下樓梯有一個(gè)大致的了解。當(dāng)它被部署在現(xiàn)實(shí)世界中時(shí),它前面的單個(gè)攝像頭的視覺效果會(huì)引導(dǎo)它的運(yùn)動(dòng)。該機(jī)器狗使用強(qiáng)化學(xué)習(xí)來調(diào)整其步態(tài),以在樓梯和不平坦的地面等事物中自由前進(jìn)(強(qiáng)化學(xué)習(xí)是一種允許系統(tǒng)通過反復(fù)試驗(yàn)改進(jìn)的人工智能技術(shù))。?
學(xué)者評(píng)價(jià)
卡內(nèi)基梅隆大學(xué)助理教授迪帕克·帕薩克(Deepak Pathak) 表示,取消對(duì)內(nèi)部地圖的必要需求,這使機(jī)器人更加健壯,因?yàn)樗辉偈艿降貓D中潛在錯(cuò)誤的限制。?
谷歌研究科學(xué)家 Jie Tan表示,機(jī)器人很難將相機(jī)的原始像素轉(zhuǎn)化為在周圍環(huán)境中導(dǎo)航所需的那種精確和平衡的運(yùn)動(dòng)。他說,這項(xiàng)工作是他第一次看到小型低成本機(jī)器人展現(xiàn)出如此驚人的機(jī)動(dòng)性。?
華盛頓大學(xué)研究機(jī)器學(xué)習(xí)和機(jī)器人控制的研究員 Guanya Shi 說,該團(tuán)隊(duì)已經(jīng)實(shí)現(xiàn)了“機(jī)器人學(xué)習(xí)和自主性的突破”。?
從事機(jī)器學(xué)習(xí)和機(jī)器人技術(shù)研究的Facebook人工智能研究部的研究科學(xué)家 Akshara Rai,也對(duì)這項(xiàng)新技術(shù)表示認(rèn)可。?
“這項(xiàng)技術(shù)是朝著構(gòu)建這種有感知力的四足機(jī)器人,并將其部署在野外邁出的有希望的一步。”Rai 說。
未來展望
然而,這項(xiàng)技術(shù)目前仍然有所限制。雖然該團(tuán)隊(duì)的工作有助于改進(jìn)機(jī)器人的行走方式,但卻無法幫助機(jī)器人提前確定前進(jìn)方向?!皩?dǎo)航對(duì)于在現(xiàn)實(shí)世界中部署機(jī)器人來說是很重要的。” Rai 說。
在機(jī)器狗能夠在公園里蹦蹦跳跳或在家里取東西之前,還需要做更多的工作。Tan表示,雖然機(jī)器狗可以通過前置攝像頭了解深度,但它無法應(yīng)對(duì)濕滑地面或高草叢等情況;它可能會(huì)陷入水坑或陷入泥濘。?

據(jù)悉,這項(xiàng)技術(shù)即將在12月14日于新西蘭奧克蘭舉行的2022年機(jī)器人學(xué)習(xí)大會(huì)(CoRL2022)上亮相,屆時(shí)讓我們期待該項(xiàng)技術(shù)的更多的詳情!
文章參考:
https://vision-locomotion.github.io/
https://www.technologyreview.com/2022/11/21/1063585/watch-this-robot-dog-scramble-over-tricky-terrain-just-by-using-its-camera/
查看本公眾號(hào)原文尾部獲取論文原文pdf
更多精彩內(nèi)容請(qǐng)關(guān)注公眾號(hào):BFT機(jī)器人
本文為原創(chuàng)文章,版權(quán)歸BFT機(jī)器人所有,如需轉(zhuǎn)載請(qǐng)與我們聯(lián)系。若您對(duì)該文章內(nèi)容有任何疑問,請(qǐng)與我們聯(lián)系,將及時(shí)回應(yīng)。