最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

用GPT3等大模型實現(xiàn)機器人自然語言控制視覺導(dǎo)航

2023-04-28 17:10 作者:dliting  | 我要投稿

? ? ? ?LM-Nav是Google和UC Berkeley等大學(xué)發(fā)布的一種機器人導(dǎo)航系統(tǒng)。在LM-Nav中,使用自然語言對機器人進行控制可以大大簡化人機交互的過程,增加機器人的使用便利性。舉例來說,如果用戶需要讓機器人到達房間的某個位置,他可以用自然語言命令告訴機器人“去這個房間的XX位置”,機器人就會根據(jù)用戶的指令進行導(dǎo)航。此外,在實際情況下,由于自然語言的歧義性,LM-Nav系統(tǒng)還可以對指令進行消歧,確保機器人能夠正確地理解和執(zhí)行指令。

通過語言指令實現(xiàn)機器人視覺目標導(dǎo)航

? ? ? ?LM-Nav利用了ChatGPT相關(guān)技術(shù)實現(xiàn)自然語言控制機器人視覺目標導(dǎo)航。具體而言,LM-Nav系統(tǒng)通過先前訓(xùn)練的自然語言處理、視覺處理和行動規(guī)劃模型來實現(xiàn)此目標。在機器人領(lǐng)域,ChatGPT相關(guān)技術(shù)的應(yīng)用和發(fā)展也是非常廣泛的。例如,可以使用ChatGPT實現(xiàn)機器人對話系統(tǒng)。

? ? ? ?這種機器人導(dǎo)航系統(tǒng)的突破性創(chuàng)新在于它不需要使用標記指令數(shù)據(jù)集,而是利用大型預(yù)訓(xùn)練模型來完成自然語言理解任務(wù)。通過這種方法,系統(tǒng)可以避免針對每種任務(wù)都要進行數(shù)據(jù)注釋的高昂成本。此外,這種系統(tǒng)也可以通過訓(xùn)練大規(guī)模未注釋軌跡數(shù)據(jù)集,從而實現(xiàn)更好的泛化能力。

? ? ? ?LM-Nav系統(tǒng)中的三個大型預(yù)訓(xùn)練模型分別用于自然語言理解、將圖像與語言相關(guān)聯(lián)以及視覺導(dǎo)航。大型語言模型(GPT3)被用于完成自然語言理解的任務(wù),它經(jīng)過了大型網(wǎng)絡(luò)文本語料庫上的訓(xùn)練。將圖像與語言相關(guān)聯(lián)的模型(CLIP)則可以根據(jù)圖像和相應(yīng)的自然語言指令,為機器人提供目標位置的估計。視覺導(dǎo)航模型(ViNG)則被用于規(guī)劃機器人的行動路徑。

LM-Nav集成了大語言模型(LLM)、視覺語言模型(VLM)和視覺導(dǎo)航模型(VNM)

? ? ? ?此類機器人導(dǎo)航系統(tǒng)具有廣泛的應(yīng)用前景。通過利用大型預(yù)訓(xùn)練模型,它可以避免需要對每種任務(wù)都進行數(shù)據(jù)注釋的高昂成本。同時,通過訓(xùn)練大規(guī)模未注釋軌跡數(shù)據(jù)集,它可以實現(xiàn)更好的泛化能力。因此,這種系統(tǒng)在通用人工智能方面具有重要的發(fā)展?jié)摿Α?/p>

參考:

[1] Shah D, Osiński B, Levine S. Lm-nav: Robotic navigation with large pre-trained models of language, vision, and action[C]//Conference on Robot Learning. PMLR, 2023: 492-504.

[2]?https://sites.google.com/view/lmnav


用GPT3等大模型實現(xiàn)機器人自然語言控制視覺導(dǎo)航的評論 (共 條)

分享到微博請遵守國家法律
吴忠市| 墨竹工卡县| 安阳县| 蒲江县| 西畴县| 潞西市| 剑阁县| 陆丰市| 无棣县| 新泰市| 淮北市| 宁蒗| 白河县| 黄平县| 东源县| 桂林市| 日照市| 陵川县| 舟山市| 阳谷县| 沧源| 防城港市| 连城县| 商河县| 得荣县| 万年县| 永丰县| 青田县| 漠河县| 锦州市| 贞丰县| 连城县| 宁都县| 通榆县| 新宁县| 策勒县| 泰宁县| 香河县| 晋江市| 衡水市| 专栏|