人形機器人:技術奇點時刻,新一次工業(yè)革命的開始
報告出品方:華創(chuàng)證券
以下為報告原文節(jié)選
------
一、人形機器人:技術奇點時刻,新一次工業(yè)革命的開始
(一)人形機器人:仿人形態(tài),商業(yè)化潛力亟待挖掘
人形機器人是通過模仿人類的形態(tài)和行為設計制造出的機器人。人形機器人(仿人機器人)是結合了仿生學、人工智能學、計算機科學以及材料科學的一個復雜產(chǎn)物。從形態(tài)上來看,人形機器人根據(jù)應用場景的不同分別或同時具有人的四肢、頭部和軀干,使用部分肢體的場景包括應用于工業(yè)領域的機械手臂、應用于醫(yī)療康復領域的輔助步行機器人等。從行為上來看,人形機器人通過模仿人類的關節(jié)、肌肉、感知系統(tǒng)、思維系統(tǒng)來實現(xiàn)移動、操作、感知、學習等行為,輔助人類從而解放更多的生產(chǎn)力。
隨著技術進步,全尺寸人形機器人即將迎來商業(yè)化。部分軀體機器人的應用已進入商業(yè)化初期,相較之下,全尺寸人形機器人商業(yè)化程度更低。隨著機器人技術的快速進步與成熟,全球多方勢力已加入了全尺寸人形機器人商業(yè)化布局的行列。2022 年,隨著小米、特斯拉陸續(xù)發(fā)布 CyberOne 和 Optimus,機器人行業(yè)將迎來全尺寸人形機器人商業(yè)化的到來。
市場上已有多種機器人,但進一步商業(yè)化的潛力巨大。在特斯拉產(chǎn)品發(fā)布之前也有多種全尺寸人形機器人,但主要用于科教、研究、娛樂等領域,可以實現(xiàn)的功能相對較少,且售價高昂,隨著特斯拉、小米等科技企業(yè)的進入,制造、算法等諸多優(yōu)勢將實現(xiàn)對人形機器人商業(yè)化潛力更深入地挖掘。
(二)人形機器人歷經(jīng)近百年,ChatGPT 有望引爆技術奇點
人形機器人從 1939 年第一臺電機械控制的 Elektro 開始至今已歷經(jīng)近百年時間,我們從技術變化的角度將其劃分成三個階段:電機械階段,實驗室智能階段和應用推廣階段。
1)電機械階段:此時的人形機器人僅僅是通過模仿人的行為去進行如移動、抬手、發(fā)聲等較簡單的動作。這個時期的代表為日本早稻田大學研發(fā)出的 WAP、WL 和 WABOT 系列機器人,該階段主要側重通過機械性地模擬人的行走使得機器人能夠移動。
2)實驗室智能階段:傳感系統(tǒng)、控制系統(tǒng)、軟件算法等多個技術實現(xiàn)發(fā)展,2000 年本田開發(fā)的 ASIMO 將人形機器人帶入實驗室智能階段,此時的機器人逐漸能夠通過傳感器獲取外部信息,通過簡單的分析判斷做出相應的決策??梢詫崿F(xiàn)如“8”字形行走、擰開瓶蓋、單雙腳跳躍等簡單動作。在智能化階段美國與日本齊頭并進,日本側重于外形仿真,而美國則更側重于用計算機模擬人腦的功能。
3)應用推廣階段:特斯拉的 Optimus 的發(fā)布引領全球人形機器人向 C 端應用發(fā)展,而2023 年 ChatGPT 的迅速迭代加強了人們對于人形機器人商業(yè)化的信心,全球科技巨頭紛紛下場布局研發(fā),我們認為 2023 年可以成為人形機器人正式進行應用推廣的元年。
ChatGPT 等大語言模型(LLM)AI 的應用有望加速人形機器人產(chǎn)業(yè)化進程。GPT、BERT等大模型的應用大幅提高了模型的“通用性”,相比于之前垂直領域的 AI 開發(fā),大模型可通過“預訓練+特定任務微調(diào)”的形式具備多個領域的基礎知識,加速 AI 的學習、訓練以及迭代。大模型的其他優(yōu)勢包括:對自然語言具備更好的理解能力、基本可用的持續(xù)交互能力、更強的零樣本/小樣本學習能力。下圖為機器人層級控制框架,層級控制中,高層級負責定義任務與規(guī)劃行為,低層級負責動作控制。隨著大模型 AI 的進步,人形機器人在感知、操作、交互等方面也將快速進步。
ChatGPT 等大語言模型有望促進人形機器人智能化并豐富交互性。大語言模型可以和圖像模型、三維視覺模型融合,形成多模態(tài)模型,極大的提升機器人的感知和執(zhí)行能力。目前的大型語言模型只能通過語言和圖像與用戶進行交互,無法在物理環(huán)境中執(zhí)行交互。為了實現(xiàn)人工智能與物理世界的連接,機器人技術的推進能夠作為使用者與物理環(huán)境之間的接口,從而實現(xiàn)更豐富和立體的人機交互。
特斯拉入局人形機器人,有望憑借技術與制造的積累更快實現(xiàn)商業(yè)化。
技術積累:硬+軟為基礎,加速推進產(chǎn)業(yè)化。硬件方面,特斯拉具備完整的研發(fā)、測試、優(yōu)化產(chǎn)品的可視化開發(fā)流程。以電動車的研發(fā)積累為基礎,特斯拉能夠?qū)崿F(xiàn)最大程度縮短研發(fā)周期,設計出更高效、更安全、更穩(wěn)定的機器人電氣結構。
軟件方面,機器人的視覺系統(tǒng)與汽車自動駕駛的模擬系統(tǒng)原理類似,因此特斯拉在自動駕駛積累的數(shù)據(jù)能夠加速機器人視覺系統(tǒng)的訓練。此外,特斯拉自研的超級計算機 Dojo配備了神經(jīng)網(wǎng)絡訓練芯片 D1,能夠通過處理海量的視頻數(shù)據(jù)加速 FSD 的升級迭代,并為 Optimus 提供更強的算力支持。
制造積累:在制造方面,特斯拉本身具有成熟的電動車供應鏈,而特斯拉的現(xiàn)有供應商能夠提供部分機器人所用的零部件(如攝像頭、熱管理、傳感器等),因此特斯拉在供應鏈方面有較強的遷移能力。另外,特斯拉在電動車降本方面也有著深厚的積累,無論是在車身結構(CTC)還是一體化壓鑄(9000 噸沖壓機)方面積累的經(jīng)驗都會對機器人的批量生產(chǎn)提供幫助,加速產(chǎn)業(yè)化落地進程。
二、從底層運行原理到基礎物理結構,深度拆解人形機器人
(一)底層運行原理:運行的三大環(huán)節(jié)+直立行走的理論基石
1、“感知-控制-執(zhí)行”三大環(huán)節(jié)實現(xiàn)指令到執(zhí)行的傳遞過程
人形機器人由三大部分—感知部分、執(zhí)行部分和控制部分組成。這三大部分分別負責感知、控制和執(zhí)行環(huán)節(jié)。感知環(huán)節(jié)是指機器人通過傳感器獲取環(huán)境信息,在此基礎上分析周圍環(huán)境,解析出外部信息??刂骗h(huán)節(jié)是指機器人將感知環(huán)節(jié)中獲取到的信息推理成具體的任務,制定出相應的行動計劃并進行決策后,發(fā)出行動計劃。執(zhí)行環(huán)節(jié)是指機器人根據(jù)決策環(huán)節(jié)中給出的行動計劃執(zhí)行相應的操作。
感知部分主要由信息檢測系統(tǒng)以及信息融合系統(tǒng)組成,分別負責體內(nèi)外環(huán)境信息的獲取以及不同感知信息的融合處理。
信息檢測系統(tǒng):主要由傳感器及其數(shù)據(jù)轉換處理模塊組成,獲取環(huán)境狀態(tài)中有意義的信息。信息檢測系統(tǒng)可以分為內(nèi)部傳感器模塊和外部傳感器模塊,內(nèi)部傳感器模塊主要檢測機器人的狀態(tài),例如速度、加速度、能量等,外部傳感器模塊包含超聲,激光雷達,觸覺傳感器,相機等,主要檢測機器人工作環(huán)境的狀態(tài),例如物品擺放情況和狀態(tài)、溫度、場景分布等。檢測到的信息可以直接被控制部分利用,并由控制系統(tǒng)直接做出判斷(類似于人的條件或無條件反射),更多的是經(jīng)過信息融合系統(tǒng)綜合處理后再傳送至控制部分(類似于人們綜合客觀環(huán)境影響后再做出判斷和行動的過程)。
信息融合系統(tǒng):機器人身上一般會安裝多個傳感器,以便檢測各種有用的環(huán)境狀態(tài)。有些環(huán)境狀態(tài)信息只需要單一的傳感器進行檢測,例如溫度、濕度等狀態(tài),而有些環(huán)境狀態(tài)則需要多個傳感器進行配合,共同作用才能成功得到該環(huán)境狀態(tài)的信息,這樣就需要將多個檢測信息進行融合處理,例如輪式機器人的速度,需要將各個輪子的速度檢測后,再按照相應速度合成算法進行計算,才能得到最終機器人的速度。信息融合系統(tǒng)將相互獨立的檢測信息,融合成更高級的感知信息,能夠幫助機器人更好地認知自身與外部環(huán)境。
控制部分由人機交互系統(tǒng)和決策系統(tǒng)組成,分別負責人機交流以及分析決策。
人機交互系統(tǒng):是使操作人員參與機器人控制并與機器人進行聯(lián)系交流的子系統(tǒng),人機交互系統(tǒng)涉及如何獲取外部控制命令,以及如何表達自身的狀態(tài)等。簡單的人機交互可能只是一個報警信號,復雜的人機系統(tǒng)則可能涉及許多學科,例如通信技術(如何獲取遠程甚至是超遠程的命令信息)、自然語言處理(如何分析操作人員的語言命令)等。人機交互系統(tǒng)也有可能會借助感知部分獲取必要的信息,例如在接收語音命令時,需要感知部分進行語音的檢測與信號的轉換,以及語音命令的分析等。
決策系統(tǒng):控制系統(tǒng)的任務是根據(jù)感知部分提供的感知信息以及執(zhí)行任務要求,進行合理的分析與決策,提供執(zhí)行指令給執(zhí)行部分完成指定的運動和功能。感知部分如果對執(zhí)行部分不進行監(jiān)測,如一般工業(yè)機器人末端的移動,這樣的控制方式稱為開環(huán)控制;如果進行信息的反饋,如具有跟蹤功能的機器人,這樣的控制方式稱為閉環(huán)控制。控制系統(tǒng)可以很簡單,如溫度報警,只需要溫度超過警戒溫度就立刻報警;也可以很復雜,美國 IBM 公司生產(chǎn)的深藍超級國際象棋電腦,有 32 個大腦(微處理器),每秒可以計算 2億步。1997 年的深藍超級國際象棋電腦可搜尋及估計隨后的 12 步棋,而一名人類象棋高手大約可估計隨后的 10 步棋。
執(zhí)行部分由驅(qū)動系統(tǒng)和機械系統(tǒng)組成,分別負責動力的提供以及實際運動的執(zhí)行。
驅(qū)動系統(tǒng):驅(qū)動系統(tǒng)主要指驅(qū)動機械系統(tǒng)的驅(qū)動設置,是機器人的動力來源。根據(jù)驅(qū)動源的不同,驅(qū)動系統(tǒng)可分為電動、液壓、氣動 3 種,以及把它們結合起來應用的綜合系統(tǒng)。驅(qū)動系統(tǒng)可以與機械系統(tǒng)直接相連,也可通過傳動裝置與機械系統(tǒng)間接相連。驅(qū)動系統(tǒng)影響機器人反應的快速性與準確性。
機械系統(tǒng):除了安裝感知、控制部分與其他必要結構的機械結構外,機械系統(tǒng)主要是指機器人的運動結構,常見的運動結構有關節(jié)式、輪式、復合式等。關節(jié)式結構的機器人常見的有工業(yè)機器人(典型關節(jié)式)、類人型機器人(足式);輪式機器人常見的有服務機器人、巡邏機器人等,輪式機器人的運動控制相對于足式機器人來說較為簡單,所以在服務領域應用廣泛;復合式運動結構主要應用在復雜地形中,如救援機器人,既要能在平地與低坡度表面運動,又能夠做上下樓梯等升降運動。
2、“ZMP+倒立擺”簡化模型奠定人形機器人行走的理論基石雙足機器人的控制具有很高的技術難度,尤其是步態(tài)控制和平衡問題。機器人在移動過程中,外力方面只受到重力和地面的作用力,而重力和地面作用力不能直接控制,只能轉而控制機器人關節(jié)的驅(qū)動力來控制機器人的行走,這樣給雙足機器人的控制增加了很大難度。
ZMP(零力矩點)概念的提出為機器人的穩(wěn)定移動提供了理論基礎。該理論首先是由 M.Vukobratovic 和 Stepaneko 在 1968 年提出,ZMP 可理解為地面上存在的一點,機器人在該點由慣性力與重力所產(chǎn)生的凈力矩為零。如果 ZMP 落在腳掌范圍內(nèi),即可認為機器人系統(tǒng)是穩(wěn)定的,機器人可以穩(wěn)定行走。
倒立擺+ZMP 簡化模型在機器人步態(tài)算法得到廣泛應用,成為目前主流移動控制法的理論基石,使人形機器人可穩(wěn)定行走。該模型將機器人簡化為一個倒立擺,整體控制的目的是使實際的 ZMP 位置與參考的 ZMP 位置之間的誤差盡可能小,這樣機器人在運動過程中才能夠穩(wěn)定,因此需要根據(jù)期望的 ZMP 位置(期望的落腳點)計算出質(zhì)心的運動情況和實際的 ZMP 位置,并且反饋跟蹤 ZMP 位置。該控制方法最具代表性的機器人就是本田的 Asimo 機器人,他是當時最先進的機器人,至今也很難被超越,除此之外,還有優(yōu)必選的 Walker,德國宇航局的 TORO 等?,F(xiàn)在主流的足式機器人控制方法一般是雙層結構,基于模型預測控制(MPC)的上層軌跡規(guī)劃和基于動力學模型的下層全身關節(jié)力控(WBC)被認為是經(jīng)典的 ZMP 控制的升級版,計算機性能的提升讓更復雜的優(yōu)化問題的求解成為可能,同時高性能的力控關節(jié)也取代了 ZMP 時代的高剛度位控關節(jié)。這種控制架構得到了廣泛的使用,并取得了很好的效果。
(二)從車鏈和果鏈看,國內(nèi)硬件供應商有較大的機會
借鑒特斯拉汽車零部件供應鏈國產(chǎn)化降本經(jīng)驗,人形機器人執(zhí)行層面零部件國產(chǎn)供應商迎來重要機遇。以特斯拉 Model 3 標準續(xù)航版為例,從 2019 年底到 2021 年中,其零部件國產(chǎn)化率從 30%飛漲到 90%,由此帶來大幅度的降本,使得售價從 2019 年底的 35 萬下降至 2021 年中的 25 萬,零部件國產(chǎn)化帶來的降本效益十分明顯,對特斯拉汽車的發(fā)展有著很大的推動。目前,在整個人形機器人產(chǎn)業(yè)鏈中,上游機器人零部件制造商國產(chǎn)化程度低,且這些核心零部件在機器人產(chǎn)品中占比高,較高的成本阻礙了人形機器人產(chǎn)業(yè)的發(fā)展。迫切的降本需求將為相關國產(chǎn)供應商帶來重大機遇。
蘋果與特斯拉的軟件和算法均是自主研發(fā)。就特斯拉 Optimus 而言,由于機器人和自動駕駛領域的差異,需要對 FSD 算法進行適應和改進,以滿足機器人特定的需求和任務。
這一切都依靠特斯拉強大的自主研發(fā)能力。相比全球其他依靠第三方團隊進行軟件外包的廠商,特斯拉擁有卓越的軟件團隊,這是特斯拉非常重要的隱性價值,也塑造了其真正領先于同業(yè)的核心競爭力。
--- 報告摘錄結束 更多內(nèi)容請閱讀報告原文 ---
報告合集專題一覽 X 由【報告派】定期整理更新
(特別說明:本文來源于公開資料,摘錄內(nèi)容僅供參考,不構成任何投資建議,如需使用請參閱報告原文。)
精選報告來源:報告派
科技 / 電子 / 半導體 /
人工智能 | Ai產(chǎn)業(yè) | Ai芯片 | 智能家居 | 智能音箱 | 智能語音 | 智能家電 | 智能照明 | 智能馬桶 | 智能終端 | 智能門鎖 | 智能手機 | 可穿戴設備 |半導體 | 芯片產(chǎn)業(yè) | 第三代半導體 | 藍牙 | 晶圓 | 功率半導體 | 5G | GA射頻 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圓 | 封裝封測 | 顯示器 | LED | OLED | LED封裝 | LED芯片 | LED照明 | 柔性折疊屏 | 電子元器件 | 光電子 | 消費電子 | 電子FPC | 電路板 | 集成電路 | 元宇宙 | 區(qū)塊鏈 | NFT數(shù)字藏品 | 虛擬貨幣 | 比特幣 | 數(shù)字貨幣 | 資產(chǎn)管理 | 保險行業(yè) | 保險科技 | 財產(chǎn)保險 |