CoRL 2023 獲獎(jiǎng)?wù)撐娜窒恚C(jī)器人學(xué)習(xí)領(lǐng)域最新熱門主題一次看完
今年大模型及具身智能領(lǐng)域有了非常多的突破性進(jìn)展,作為機(jī)器人學(xué)與機(jī)器學(xué)習(xí)交叉領(lǐng)域的全球頂級(jí)學(xué)術(shù)會(huì)議之一,CoRL也得到了更多的關(guān)注。
CoRL 是面向機(jī)器人學(xué)習(xí)的頂會(huì),涵蓋機(jī)器人學(xué)、機(jī)器學(xué)習(xí)和控制等多個(gè)主題,包括理論與應(yīng)用。今年的CoRL 2023共有199 篇論文入選,熱門主題包括控制、強(qiáng)化學(xué)習(xí)等。大會(huì)已經(jīng)于上周11 月 6 日- 9 日在美國(guó)亞特蘭大舉行,在本次大會(huì)上,公布了最佳論文獎(jiǎng)、最佳學(xué)生論文獎(jiǎng)、最佳系統(tǒng)論文獎(jiǎng)等獎(jiǎng)項(xiàng)。
下面我們一起起來看看CoRL 2023的獲獎(jiǎng)?wù)撐脑斍椋?/p>
PS:除了今年的獲獎(jiǎng)?wù)撐?,學(xué)姐也整理了去年CoRL 2022的獲獎(jiǎng)?wù)撐?,有想法發(fā)頂會(huì)的同學(xué)建議都看看哦。
掃碼添加小享,回復(fù)“CoRL”
免費(fèi)領(lǐng)取全部論文+源碼合集

CoRL 2023
最佳論文獎(jiǎng)
Distilled Feature Fields Enable Few-Shot Language-Guided Manipulation
標(biāo)題:蒸餾特征場(chǎng)實(shí)現(xiàn)少樣本語言引導(dǎo)操作
作者:William Shen, Ge Yang, Alan Yu, Jensen Wong, Leslie Pack Kaelbling, Phillip Isola
內(nèi)容:本研究通過利用蒸餾特征場(chǎng),將準(zhǔn)確的3D幾何與2D基礎(chǔ)模型中的豐富語義相結(jié)合,填補(bǔ)了機(jī)器人操作中2D到3D的空白。作者提出了一種用于6自由度抓取和放置的少樣本學(xué)習(xí)方法,利用這些強(qiáng)大的空間和語義先驗(yàn)知識(shí)實(shí)現(xiàn)對(duì)未見過物體的野外泛化。通過從視覺語言模型CLIP中提取的特征,作者展示了一種通過自由文本自然語言指定新對(duì)象進(jìn)行操作的方法,并證明了其能夠泛化到未見過的表達(dá)和新類別的物體上。

最佳學(xué)生論文獎(jiǎng)
Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners
標(biāo)題:大型語言模型規(guī)劃器的不確定性對(duì)齊
作者:Allen Z. Ren, Anushri Dixit, Alexandra Bodrova, Sumeet Singh, Stephen Tu, Noah Brown, Peng Xu, Leila Takayama, Fei Xia, Jake Varley, Zhenjia Xu, Dorsa Sadigh, Andy Zeng, Anirudha Majumdar
內(nèi)容:本研究提出了一種名為KNOWNO的框架,用于測(cè)量和對(duì)齊基于大型語言模型(LLM)的規(guī)劃器的不確定性。該框架可以幫助規(guī)劃器在不知道時(shí)知道并請(qǐng)求幫助。KNOWNO建立在共形預(yù)測(cè)理論的基礎(chǔ)上,提供任務(wù)完成的統(tǒng)計(jì)保證,同時(shí)最小化復(fù)雜多步規(guī)劃設(shè)置中需要人類幫助的情況。實(shí)驗(yàn)結(jié)果表明,在涉及不同模態(tài)的模糊性的任務(wù)中,KNOWNO在提高效率和自主性方面優(yōu)于現(xiàn)代基線方法(可能涉及集成或廣泛的提示調(diào)整),并提供正式保證。

Predicting Object Interactions with Behavior Primitives: An Application in Stowing Tasks
標(biāo)題:使用行為原語預(yù)測(cè)物體交互
作者:Haonan Chen, Yilong Niu, Kaiwen Hong, Shuijing Liu, Yixuan Wang, Yunzhu Li, Katherine Rose Driggs-Campbell
內(nèi)容:本研究提出了一種使用行為原語從預(yù)測(cè)物體交互的預(yù)測(cè)模型和單個(gè)演示中學(xué)習(xí)泛化機(jī)器人裝載策略的方法。作者提出了一種新的框架,利用圖神經(jīng)網(wǎng)絡(luò)在行為原語參數(shù)空間內(nèi)預(yù)測(cè)物體交互。進(jìn)一步地,作者使用增強(qiáng)的原語軌跡優(yōu)化來搜索預(yù)定義的異構(gòu)行為原語庫的參數(shù)以實(shí)例化控制動(dòng)作。該框架使機(jī)器人能夠通過幾個(gè)關(guān)鍵幀(3-4)從單個(gè)演示中熟練地執(zhí)行長(zhǎng)期裝載任務(wù)。

Language Embedded Radiance Fields for Zero-Shot Task-Oriented Grasping
標(biāo)題:用于零樣本面向任務(wù)抓取的語言嵌入輻射場(chǎng)
作者:Satvik Sharma, Adam Rashid, Chung Min Kim, Justin Kerr, Lawrence Yunliang Chen, Angjoo Kanazawa, Ken Goldberg
內(nèi)容:本研究提出了一種新的語言嵌入輻射場(chǎng)用于面向任務(wù)的物體抓取的方法LERF-TOGO。該方法使用視覺語言模型,在給定自然語言查詢的情況下,零樣本輸出一個(gè)物體的抓取分布。為了實(shí)現(xiàn)這一點(diǎn),作者首先構(gòu)建了一個(gè)場(chǎng)景的LERF,將CLIP嵌入到多尺度3D語言字段中,可使用文本進(jìn)行查詢。然而,LERF沒有物體邊界的感覺,因此其相關(guān)性輸出通常返回對(duì)象上的不完整激活,這對(duì)于抓取是不夠的。LERF-TOGO通過提取DINO特征的3D物體掩碼來彌補(bǔ)這種缺乏空間分組的問題,然后在此掩碼上條件性地查詢LERF以獲得物體上的一個(gè)語義分布,從而從現(xiàn)成的抓取規(guī)劃器中對(duì)抓取進(jìn)行排序。

最佳系統(tǒng)論文獎(jiǎng)
RoboCook: Long-Horizon Elasto-Plastic Object Manipulation with Diverse Tools
標(biāo)題:使用多種工具進(jìn)行長(zhǎng)期彈性-塑性物體操縱
作者:Haochen Shi, Huazhe Xu, Samuel Clarke, Yunzhu Li, Jiajun Wu
內(nèi)容:本研究開發(fā)了一種名為RoboCook的智能機(jī)器人系統(tǒng),能夠感知、建模和操縱各種工具的彈塑性物體。RoboCook使用點(diǎn)云場(chǎng)景表示法,利用圖神經(jīng)網(wǎng)絡(luò)(GNN)對(duì)工具-物體交互進(jìn)行建模,并將工具分類與自監(jiān)督策略學(xué)習(xí)相結(jié)合,制定操縱計(jì)劃。作者展示了一個(gè)通用的機(jī)器人手臂可以從每個(gè)工具僅需20分鐘的實(shí)際交互數(shù)據(jù)中學(xué)習(xí)復(fù)雜的長(zhǎng)期軟體物體操縱任務(wù),如制作餃子和字母餅干。

掃碼添加小享,回復(fù)“CoRL”
免費(fèi)領(lǐng)取全部論文+源碼合集

MimicPlay: Long-Horizon Imitation Learning by Watching Human Play
標(biāo)題:通過觀察人類玩耍進(jìn)行長(zhǎng)期模仿學(xué)習(xí)
作者:Chen Wang, Linxi Fan, Jiankai Sun, Ruohan Zhang, Li Fei-Fei, Danfei Xu, Yuke Zhu, Anima Anandkumar
內(nèi)容:本研究提出了一種分層學(xué)習(xí)框架MimicPlay,通過觀察人類玩耍的視頻序列來學(xué)習(xí)機(jī)器人的長(zhǎng)期模仿技能。作者認(rèn)為,即使形態(tài)不同,人類玩耍數(shù)據(jù)仍然包含豐富的物理交互信息,可以促進(jìn)機(jī)器人策略學(xué)習(xí)。受此啟發(fā),MimicPlay從人類玩耍數(shù)據(jù)中學(xué)習(xí)潛在計(jì)劃,以指導(dǎo)在少量遠(yuǎn)程操作演示上訓(xùn)練的低層次視覺運(yùn)動(dòng)控制。通過對(duì)14個(gè)現(xiàn)實(shí)世界中的長(zhǎng)期操縱任務(wù)進(jìn)行系統(tǒng)評(píng)估,作者發(fā)現(xiàn)MimicPlay在任務(wù)成功率、泛化能力和對(duì)干擾的魯棒性方面優(yōu)于最先進(jìn)的模仿學(xué)習(xí)方法。

Robot Parkour Learning
標(biāo)題:機(jī)器人跑酷學(xué)習(xí)
作者:Ziwen Zhuang, Zipeng Fu, Jianren Wang, Christopher G Atkeson, S?ren Schwertfeger, Chelsea Finn, Hang Zhao
內(nèi)容:本研究提出了一種用于學(xué)習(xí)多樣化跑酷技能的端到端視覺跑酷策略的系統(tǒng),該系統(tǒng)使用簡(jiǎn)單的獎(jiǎng)勵(lì),而無需任何參考運(yùn)動(dòng)數(shù)據(jù)。作者開發(fā)了一種受直接定位啟發(fā)的強(qiáng)化學(xué)習(xí)方法來生成跑酷技能,包括攀爬高障礙物、躍過大間隙、爬行低障礙物、擠過窄縫和奔跑等。作者將這些技能提煉為單一的視覺跑酷策略,并使用其自我中心的深度相機(jī)將其轉(zhuǎn)移到四足機(jī)器人上。

CoRL 2022
最佳論文獎(jiǎng)
Training Robots to Evaluate Robots: Example-Based Interactive Reward Functions for Policy Learning
用于策略學(xué)習(xí)的基于示例的交互式獎(jiǎng)勵(lì)函數(shù)
簡(jiǎn)述:本研究提出了一種名為“交互式獎(jiǎng)勵(lì)函數(shù)”(IRFs)的方法,用于訓(xùn)練機(jī)器人自動(dòng)獲取物理互動(dòng)行為,以評(píng)估嘗試執(zhí)行的機(jī)器人技能的結(jié)果,從而提高任務(wù)執(zhí)行的性能。

最佳論文入圍名單
Learning Agile Skills via Adversarial Imitation of Rough Partial Demonstrations
通過對(duì)手的粗略部分演示進(jìn)行對(duì)抗性模仿來學(xué)習(xí)敏捷技能
簡(jiǎn)述:本研究提出了一種生成對(duì)抗網(wǎng)絡(luò)方法,用于從部分和可能物理不兼容的演示中推斷獎(jiǎng)勵(lì)函數(shù),以成功獲取技能。

Supercharging Imitation with Regularized Optimal Transport
用正則化最優(yōu)傳輸加強(qiáng)模仿
簡(jiǎn)述:本研究提出了一種新的模仿學(xué)習(xí)算法——正則化最優(yōu)傳輸(ROT),該算法結(jié)合了軌跡匹配獎(jiǎng)勵(lì)和行為克隆,可以顯著加速模仿學(xué)習(xí),并在多個(gè)視覺控制任務(wù)上表現(xiàn)出色。

最佳系統(tǒng)論文獎(jiǎng)
Legged Locomotion in Challenging Terrains using Egocentric Vision
基于自我中心視覺的挑戰(zhàn)性地形中的腿部運(yùn)動(dòng)
簡(jiǎn)述:本研究提出了一種全新的端到端移動(dòng)系統(tǒng),能夠跨越多種地形,并在小型四足機(jī)器人上實(shí)現(xiàn)實(shí)時(shí)運(yùn)行。該系統(tǒng)使用單個(gè)前置深度相機(jī)進(jìn)行自我中心視覺,并通過強(qiáng)化學(xué)習(xí)和有監(jiān)督學(xué)習(xí)訓(xùn)練了策略。
特別創(chuàng)新獎(jiǎng)
Do As I Can, Not As I Say: Grounding Language in Robotic Affordances
基于機(jī)器人可供性的語言
簡(jiǎn)述:本研究提出了一種通過預(yù)訓(xùn)練技能提供真實(shí)世界基礎(chǔ)的方法,以約束語言模型提出既可行又適合上下文的自然語言行動(dòng)。

掃碼添加小享,回復(fù)“CoRL”
免費(fèi)領(lǐng)取全部論文+源碼合集

CoRL 2023 獲獎(jiǎng)?wù)撐娜窒恚C(jī)器人學(xué)習(xí)領(lǐng)域最新熱門主題一次看完的評(píng)論 (共 條)
