最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

機(jī)器人行業(yè)報(bào)告:AI賦能人形機(jī)器人,關(guān)注核心零部件發(fā)展機(jī)遇

2023-07-07 10:34 作者:報(bào)告派  | 我要投稿

報(bào)告出品方:西南證券

以下為報(bào)告原文節(jié)選

------

1AI賦能機(jī)器人,具身智能發(fā)展正當(dāng)時(shí)

1.1機(jī)器人是AI落地的最佳載體

具身智能(EmbodiedIntelligence)是AI進(jìn)入物理世界進(jìn)行交互的載體。根據(jù)智能程度,可以將機(jī)器人分為兩類:非智能機(jī)器人和智能機(jī)器人;同時(shí)根據(jù)有無載體,也可以將人工智能分為兩類:虛擬AI和實(shí)體AI。機(jī)器人與人工智能的交集,即:作為AI實(shí)物載體的智能機(jī)器人。一般的工業(yè)機(jī)器人只能被編程為執(zhí)行重復(fù)的一系列運(yùn)動(dòng),所有的運(yùn)動(dòng)軌跡、位置、動(dòng)作、力度都需要提前設(shè)定,更突出其“機(jī)器”屬性,智能機(jī)器人則可以與外界交互,根據(jù)自身對外界的感知,決定完成任務(wù)的方式,并且可以在失敗中不斷學(xué)習(xí)進(jìn)步,相較于非智能機(jī)器人的“機(jī)器”屬性,智能機(jī)器人更像是“人”。




AI機(jī)器人可以分成五大部分。1)感知系統(tǒng),相當(dāng)于機(jī)器人的“五官”,包括聲音、光、溫度、壓力、定位、接觸等傳感器,用以將外部環(huán)境信號轉(zhuǎn)換為機(jī)器人可以理解的信息或者數(shù)據(jù);2)驅(qū)動(dòng)系統(tǒng),相當(dāng)于機(jī)器人的“肌肉”,電機(jī)驅(qū)動(dòng)包括電機(jī)、減速器、編碼器等;3)末端執(zhí)行系統(tǒng),相當(dāng)于機(jī)器人的“手”,用以和外界環(huán)境進(jìn)行交互;4)能源供應(yīng),電源或者電池;5)運(yùn)算系統(tǒng)及軟件,相當(dāng)于機(jī)器人的“大腦”。

AI機(jī)器人在完成任務(wù)時(shí)需要經(jīng)歷三個(gè)層次。給到機(jī)器人一個(gè)任務(wù)時(shí),機(jī)器人一般要經(jīng)歷三層信息處理:1)第一層是感知,理解需求和環(huán)境。機(jī)器人通過傳感器感知周圍環(huán)境,并且識別到任務(wù)體在環(huán)境內(nèi)所處的位置。2)第二層是規(guī)劃,拆解成任務(wù)和路徑規(guī)劃,機(jī)器人理解任務(wù)之后,它需要將任務(wù)拆解成多個(gè)步驟,按順序執(zhí)行步驟達(dá)到完成任務(wù)的目標(biāo)。3)第三層是執(zhí)行,驅(qū)動(dòng)硬件執(zhí)行任務(wù),把運(yùn)動(dòng)規(guī)劃轉(zhuǎn)變成為機(jī)械指令,確定能量、動(dòng)量、速度等參數(shù),開始執(zhí)行任務(wù)。非智能機(jī)器人無法對外界進(jìn)行自主感知,需要人類計(jì)算出運(yùn)動(dòng)路徑并設(shè)定運(yùn)動(dòng)參數(shù),而智能機(jī)器人可以自主感知外界,并拆解任務(wù)、設(shè)計(jì)路徑,最終完成任務(wù)。




人形機(jī)器人賽道迎來快速發(fā)展階段。進(jìn)入到21世紀(jì)以來,以本田、波士頓動(dòng)力為首的各大廠商紛紛布局人形機(jī)器人產(chǎn)品,但是受限于硬件和軟件的成熟度,早期的人形機(jī)器人發(fā)展緩慢。在算法和硬件的不斷進(jìn)步中,人形機(jī)器人賽道也出現(xiàn)了很多“新面孔”,2022年以來特斯拉、小米等各大廠商陸續(xù)推出了自己的人形機(jī)器人產(chǎn)品,尤其特斯拉以“量產(chǎn)”為目標(biāo),預(yù)計(jì)將推動(dòng)整個(gè)行業(yè)迎來快速發(fā)展。





1.2AI大模型助力具身智能發(fā)展

各大科技巨頭紛紛推出AI大模型,有望解決人形機(jī)器人的通用性問題。1950年圖靈首次提出具身智能的概念,此后幾十年里,受制于落后的AI技術(shù),具身智能并沒有取得很大的進(jìn)展。近年來隨著硬件和軟件算力的不斷提升,各大公司相繼推出AI大模型算法,包括Open A I的GP T-4、谷歌的RT-1、PaLM-E等,有望解決機(jī)器人的通用性問題,具身智能迎來快速發(fā)展。




2022年12月,谷歌發(fā)布多任務(wù)模型RoboticsTransformer1(RT-1),用以大幅推進(jìn)機(jī)器人總結(jié)、歸納、推理的能力。RT-1是一種多任務(wù)模型,可以標(biāo)記機(jī)器人輸入和輸出動(dòng)作以在運(yùn)行時(shí)實(shí)現(xiàn)高效推理。訓(xùn)練模型使用的數(shù)據(jù)集涵蓋700多項(xiàng)任務(wù)的13萬個(gè)數(shù)據(jù)帶點(diǎn),使用13臺(tái)機(jī)器人在17個(gè)月內(nèi)收集而成。RT-1可以顯著改進(jìn)機(jī)器人對新任務(wù)、環(huán)境和對象的零樣本泛化,機(jī)器人執(zhí)行從未做過的任務(wù)的成功率明顯上升,對不同環(huán)境甚至有干擾的情況下的成功率也有上升;此外使用別的機(jī)器人數(shù)據(jù)來訓(xùn)練模型,使得自己機(jī)器人的執(zhí)行任務(wù)的準(zhǔn)確率得到提升。




2023年3月,谷歌和柏林工業(yè)大學(xué)共同發(fā)布可以用于機(jī)器人的多模態(tài)視覺語言模型PaLM-E,用視覺數(shù)據(jù)來增強(qiáng)其語言處理能力,可以指導(dǎo)機(jī)器人完成復(fù)雜的任務(wù)。PaLM-E主要基于谷歌現(xiàn)有的PaLM大語言模型,并且加入了感知信息的能力,能讓機(jī)器人真正“理解”任務(wù),將看到的圖像轉(zhuǎn)化成可以理解的語言文本,從而做到在面對零樣本新任務(wù)時(shí)的“舉一反三”。PaLM-E無需對相關(guān)數(shù)據(jù)進(jìn)行預(yù)處理或注釋。




2023年4月,Meta發(fā)布了圖像分割模型SAM。SAM可以在不需要額外訓(xùn)練的情況下對不熟悉的對象和圖像進(jìn)行零樣本泛化,從而“剪切”任何圖像中的任何對象。在SAM發(fā)布之前,想把圖像準(zhǔn)確分割,需要人類手動(dòng)分割后再交給機(jī)器人學(xué)習(xí),這需要大量專家進(jìn)行高度專業(yè)化的工作,費(fèi)時(shí)費(fèi)力。SAM使得機(jī)器人將所學(xué)到的分割圖像進(jìn)行細(xì)致標(biāo)注,讓機(jī)器人理解對象(Object)是什么,因此可以為任何圖像或視頻中的任何對象生成遮罩,即使是在訓(xùn)練中沒有見過的對象。




2特斯拉人形機(jī)器人Optimus的AI賦能分析

2.1軟硬件不斷迭代升級,核心為優(yōu)化成本和效率

特斯拉人形機(jī)器人Optimus問世,核心為優(yōu)化成本和效率。2021年8月,馬斯克首次發(fā)布特斯拉人形機(jī)器人(Tesla Bot)計(jì)劃,代號“擎天柱”(Optimus)。在2022年9月底舉辦的特斯拉AI DAY上,馬斯克公開了人形機(jī)器人Optimus原型機(jī),人形機(jī)器人體重73kg,靜坐100W功耗,快走500W功耗,全身自由度200+,手部自由度27,搭載與特斯拉車輛相同的完全自動(dòng)駕駛(FSD)大腦,2.3KWh電池組(集成充電管理、傳感器、冷卻系統(tǒng))可以滿足一天的工作需要。特斯拉人形機(jī)器人的核心為在滿足功能的前提下降低成本和能耗,即盡可能減少零部件數(shù)量和每個(gè)元件的功耗,例如減少四肢的感應(yīng)和線路。馬斯克稱特斯拉機(jī)器人有望在3-5年時(shí)間內(nèi)交付,產(chǎn)量可以達(dá)到數(shù)百萬臺(tái),價(jià)格可能不到2萬美元。

人形機(jī)器人Optimus軟硬件不斷迭代升級。2023年5月特斯拉股東大會(huì)發(fā)布人形機(jī)器人Optimus最近進(jìn)展,包括機(jī)器人走路、利用視覺感知周圍的環(huán)境、手臂精確控制力道不打碎雞蛋、手掌抓取線束等柔性物體、人類演示訓(xùn)練AI、機(jī)器人修理機(jī)器人等場景,表明人形機(jī)器人Optimus的硬件和軟件性能得到進(jìn)一步提升。

特斯拉人形機(jī)器人Optimus類似“汽車立起來裝上腳”,因此可以復(fù)用大量汽車相關(guān)技術(shù)進(jìn)行迭代升級:

1)感知系統(tǒng):可采用和汽車類似的計(jì)算機(jī)視覺技術(shù)。根據(jù)最新的特斯拉股東大會(huì),Optimus攝像頭方案為7個(gè)攝像頭配置(前方3個(gè),兩側(cè)各1個(gè),下方各1個(gè)),通過不同方向上的攝像頭觀察到的點(diǎn)來確定位置,投射到向量空間,讓機(jī)器人感知、識別并且理解周圍環(huán)境。

2)驅(qū)動(dòng)系統(tǒng):14個(gè)旋轉(zhuǎn)線性執(zhí)行器+14個(gè)線性執(zhí)行器;

3)末端執(zhí)行系統(tǒng):“靈巧手”共12個(gè)空心杯關(guān)節(jié);

4)能源供應(yīng):2.3KWh電池組(集成充電管理、傳感器、冷卻系統(tǒng));

5)運(yùn)算系統(tǒng)及軟件:搭載與特斯拉車輛相同的完全自動(dòng)駕駛(FSD)大腦,將FSD使用到的神經(jīng)網(wǎng)絡(luò)和模擬仿真訓(xùn)練技術(shù)遷移到機(jī)器人,唯一需要改變是訓(xùn)練數(shù)據(jù)集,通過處理視覺數(shù)據(jù),做出決策,包括路徑規(guī)劃、路徑記憶、環(huán)境互動(dòng)、導(dǎo)航充電等。




2.2 AI多次模擬,優(yōu)化設(shè)計(jì)方案

車輛碰撞模型技術(shù)橫向遷移,保護(hù)機(jī)器人的“大腦”。2022年9月,在特斯拉AIDay上,技術(shù)人員展示了如何借助現(xiàn)有的AI碰撞模型對人形機(jī)器人部件排布進(jìn)行優(yōu)化。車輛碰撞模型會(huì)先記錄一次實(shí)體碰撞時(shí)各個(gè)傳感器的數(shù)據(jù),然后將車輛數(shù)據(jù)和碰撞數(shù)據(jù)傳入系統(tǒng)中,生成一份數(shù)據(jù)庫,再由AI將車輛拆分成超過3500個(gè)自由度,模擬上萬次不同角度、力度的碰撞,最后將所有碰撞數(shù)據(jù)匯總,找到車輛現(xiàn)有構(gòu)型的缺點(diǎn)并加以改進(jìn)。工程師將此技術(shù)用于機(jī)器人部件排布設(shè)計(jì),將重要部件放置在遠(yuǎn)離碰撞受損核心處,并將外殼設(shè)計(jì)成更能抵抗外力的形狀,保證機(jī)器人即使意外摔倒也不會(huì)影響到軀干內(nèi)的核心零部件。




AI仿真模型尋找成本和效率的最佳組合。人類有超過200個(gè)自由度,手部27個(gè)自由度,同時(shí)快走功耗只有500W,低功耗的同時(shí)又具有高度的靈活性。在設(shè)計(jì)機(jī)器人時(shí),需要機(jī)器人在完成具體任務(wù)的情況下,盡可能降低成本,在運(yùn)動(dòng)能力和低成本間找到最佳平衡點(diǎn)。特斯拉為機(jī)器人設(shè)計(jì)了全身28個(gè)執(zhí)行器(不含手部),用以完成Pitch(繞X軸旋轉(zhuǎn))、Yaw(繞Z軸旋轉(zhuǎn))和Roll(繞Y軸旋轉(zhuǎn))等不同動(dòng)作,再通過AI仿真模型和實(shí)際驗(yàn)證,在低功耗、低成本和最輕質(zhì)量的目標(biāo)下,選取一個(gè)關(guān)節(jié)的最佳設(shè)計(jì)。




提高零部件通用程度,將28個(gè)關(guān)節(jié)簡化為6種執(zhí)行器。特斯拉工程師使用多個(gè)場景模擬機(jī)器人的工作狀態(tài),計(jì)算出每種場景下執(zhí)行器的消耗和質(zhì)量,并將其抽象為一個(gè)點(diǎn),求解整個(gè)質(zhì)點(diǎn)云的帕累托最優(yōu),得到可以滿足多種使用場景的關(guān)節(jié)設(shè)計(jì)。經(jīng)過AI的分析優(yōu)化,將關(guān)節(jié)選型做到復(fù)用,最終實(shí)際的執(zhí)行器減少到6種,包含3種規(guī)格的旋轉(zhuǎn)執(zhí)行器和3種規(guī)格的線性執(zhí)行器。




2.3FSD+Dojo加持,提高機(jī)器人執(zhí)行力

FSD技術(shù)助力機(jī)器人感知世界。FSD算法是指特斯拉的全自動(dòng)駕駛(FullSelf-Dri vi ng)系統(tǒng)采用的算法,用以實(shí)現(xiàn)車輛自主導(dǎo)航和自動(dòng)駕駛功能,讓車輛能夠在各種交通環(huán)境下進(jìn)行感知、決策和控制。FSD算法主要依賴神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)視覺技術(shù),通過處理和分析傳感器獲取的實(shí)時(shí)數(shù)據(jù),提取有關(guān)道路、車輛、行人和障礙物的信息,實(shí)現(xiàn)環(huán)境識別功能。目前特斯拉已經(jīng)打通FSD和機(jī)器人的底層模塊,將FSD技術(shù)復(fù)用至機(jī)器人,在機(jī)器人感知、決策、控制方面起到重要作用。




占據(jù)網(wǎng)絡(luò)讓機(jī)器人“擦亮”雙眼。在感知層面,F(xiàn)SD使用占據(jù)網(wǎng)絡(luò)(OccupancyNetwork)對3D空間內(nèi)的障礙物進(jìn)行持續(xù)檢測,來估計(jì)障礙物的位置、大小、運(yùn)動(dòng)情況。FSD算法可以幫助機(jī)器人感知周圍環(huán)境,識別物體、人和障礙物。




--- 報(bào)告摘錄結(jié)束 更多內(nèi)容請閱讀報(bào)告原文 ---

報(bào)告合集專題一覽 X 由【報(bào)告派】定期整理更新

(特別說明:本文來源于公開資料,摘錄內(nèi)容僅供參考,不構(gòu)成任何投資建議,如需使用請參閱報(bào)告原文。)

精選報(bào)告來源:報(bào)告派


科技 / 電子 / 半導(dǎo)體 /

人工智能 | Ai產(chǎn)業(yè) | Ai芯片 | 智能家居 | 智能音箱 | 智能語音 | 智能家電 | 智能照明 | 智能馬桶 | 智能終端 | 智能門鎖 | 智能手機(jī) | 可穿戴設(shè)備 |半導(dǎo)體 | 芯片產(chǎn)業(yè) | 第三代半導(dǎo)體 | 藍(lán)牙 | 晶圓 | 功率半導(dǎo)體 | 5G | GA射頻 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圓 | 封裝封測 | 顯示器 | LED | OLED | LED封裝 | LED芯片 | LED照明 | 柔性折疊屏 | 電子元器件 | 光電子 | 消費(fèi)電子 | 電子FPC | 電路板 | 集成電路 | 元宇宙 | 區(qū)塊鏈 | NFT數(shù)字藏品 | 虛擬貨幣 | 比特幣 | 數(shù)字貨幣 | 資產(chǎn)管理 | 保險(xiǎn)行業(yè) | 保險(xiǎn)科技 | 財(cái)產(chǎn)保險(xiǎn) | 機(jī)器人行業(yè)

機(jī)器人行業(yè)報(bào)告:AI賦能人形機(jī)器人,關(guān)注核心零部件發(fā)展機(jī)遇的評論 (共 條)

分享到微博請遵守國家法律
长岭县| 仲巴县| 阜康市| 安康市| 望谟县| 广昌县| 诸暨市| 大石桥市| 成安县| 漳州市| 临汾市| 兴安盟| 八宿县| 改则县| 威远县| 余江县| 剑川县| 宁南县| 丰县| 科技| 定州市| 香河县| 潜山县| 潮安县| 长宁区| 锦州市| 陇西县| 商都县| 云安县| 大方县| 华宁县| 吉木乃县| 永济市| 运城市| 启东市| 康定县| 当雄县| 芦溪县| 建始县| 涟水县| 红河县|