行業(yè)報(bào)告 | 具身智能推動(dòng)AI新浪潮
原創(chuàng) | 文 BFT機(jī)器人

01
核心觀點(diǎn)
具身智能有望成為人工智能的重要解決方案
具身智能是指有身體并支持物理交互的智能體,如機(jī)器人、自動(dòng)駕駛汽車(chē)等。非具身智能指沒(méi)有物理身體,只能被動(dòng)接受數(shù)據(jù)的人工智能,例如 ChatGPT,盡管大語(yǔ)言模型可以讓其做到體驗(yàn)友好的語(yǔ)義交互,但其多模態(tài)感知和行為交互能力有限,所以還不是人類(lèi)理想的智能體。
具身智能+機(jī)器人將有望成為 Al 的重要解決方案。
2023年5月,在特斯拉股東大會(huì)上,CEO 馬斯克展示了Tesla Bot 流暢行走,抓取物體與識(shí)別環(huán)境等最新研究成果,具身智能的關(guān)鍵在于機(jī)器人能夠通過(guò)視覺(jué)識(shí)別身邊物理環(huán)境并做出決策和行動(dòng),而 Tesla Bot 已經(jīng)在逐步實(shí)現(xiàn)這些功能,此外,馬斯克推測(cè)未來(lái)人形機(jī)器人 Optimus 需求將達(dá) 100 億臺(tái),遠(yuǎn)超汽車(chē)需求量,并稱(chēng)人形機(jī)器人會(huì)是今后特斯拉主要的長(zhǎng)期價(jià)值來(lái)源。
具身智能有望帶動(dòng)核心零部件受益
傳感器、執(zhí)行器與計(jì)劃控制是具身智能的三大基本要素,機(jī)器視覺(jué)則是具身智能與外界的互動(dòng)感知的重要一環(huán)。
具身智能核心技術(shù)壁壘和價(jià)值環(huán)節(jié)主要聚焦核心零部件:減速器、伺服系統(tǒng)和控制器,其中減速器在機(jī)器人中成本占比最高達(dá) 30%,其次是伺服系統(tǒng) (20%)和控制器(10%),機(jī)器視覺(jué)是在機(jī)器人和自動(dòng)化設(shè)備中代替人眼實(shí)現(xiàn)高精度檢測(cè),識(shí)別,測(cè)量和定位引導(dǎo)等功能,隨著機(jī)器人,工業(yè)自動(dòng)化技術(shù)等領(lǐng)域的發(fā)展,GGII 預(yù)計(jì)至2025年機(jī)器視覺(jué)全球市場(chǎng)規(guī)模將超過(guò)1200億元。
算力: Al下一個(gè)浪潮將是“具身智能”,Al 芯片需求有望率先擴(kuò)張
AI 芯片是用于加速人工智能訓(xùn)練和推理任務(wù)的專(zhuān)用硬件,主要包括 GPU、FPGA、ASIC等。
隨著 AI 應(yīng)用的普及和算力需求的不斷擴(kuò)大,Al 芯片需求有望率先擴(kuò)張,根據(jù)IDC預(yù)測(cè),中國(guó)AI算力規(guī)模將保持高速增長(zhǎng),預(yù)計(jì)到2026年將達(dá) 1271.4EFLOPS,CAGRA (2022-2026年)達(dá)52.3%,預(yù)計(jì)2025年人工智能芯片市場(chǎng)規(guī)模將達(dá) 726 億美元。
02
具身智能——人工智能的最終解決方案
1950年,圖靈在《Computing Machinery and Intelligence》中首次提出了具身智能的概念。在之后的幾十年里,受到當(dāng)時(shí)技術(shù)的限制,具身智能并沒(méi)有取得很大的進(jìn)展,然而隨著 AI、芯片等科技產(chǎn)業(yè)的蓬勃發(fā)展具身智能已經(jīng)成為一個(gè)有望實(shí)現(xiàn)的,人工智能的最終解決方案。
具身智能——Embodied Al= 具象AI= 具身智能,是指有身體并支持物理交互的智能體,如機(jī)器人、自動(dòng)駕駛汽車(chē)等。一個(gè)具身智能(EmbodiedAI)機(jī)器人需要: 首先聽(tīng)懂人類(lèi)語(yǔ)言,之后分解任務(wù)、規(guī)劃子任務(wù),移動(dòng)中識(shí)別物體,與環(huán)境交互,最終完成相應(yīng)任務(wù)。相對(duì)的,非具身智能指沒(méi)有物理身體,只能被動(dòng)接受數(shù)據(jù)的人工智能,例如ChatGPT,盡管大語(yǔ)言模型可以讓其做到體驗(yàn)友好的語(yǔ)義交互,但其多模態(tài)感知和行為交互能力有限,所以還不是人類(lèi)理想的智能體。
具身智能能夠像人一樣主動(dòng)地與環(huán)境交互感知。引用上海交通大學(xué)教授盧策主題演講《具身智能》中提到的兩個(gè)例子:
1、下圖中兩只貓,一直貓被綁起來(lái),只能看這個(gè)世界,另一只貓可以主動(dòng)去走,被動(dòng)的貓是一種旁觀的智能,而主動(dòng)的貓是具身的智能,到最后,這只旁觀的貓失去了行走能力;2、第三人稱(chēng)智能需要人類(lèi)喂數(shù)據(jù)告知它這些圖案是盒子,但第一人稱(chēng)智能是通過(guò)自己的親身體驗(yàn)認(rèn)識(shí)到什么是盒子(可以打開(kāi),可以裝東西 )。

圖1:旁觀智能VS具身智能(來(lái)源:上海交通大學(xué)教授盧策主題演講——《具身智能》)

圖2:第三人稱(chēng)只能VS第一人稱(chēng)智能(來(lái)源:上海交通大學(xué)教授盧策主題演講——《具身智能》)

圖3:PIE方案:具身智能的解決方案之一(來(lái)源:上海交通大學(xué)教授盧策主題演講——《具身智能》)
具象感知 (Perception): 交互感知,自動(dòng)挖掘、定義具象概念。可以通過(guò)兩種方式實(shí)現(xiàn):
1、全感知: 構(gòu)建一個(gè)大規(guī)模的數(shù)據(jù)庫(kù),包含我們所操作的這個(gè)世界模型(world model)的各種各樣的知識(shí),跟操作相關(guān)的知識(shí),包括外形、結(jié)構(gòu)、語(yǔ)義,以及 48 個(gè)真實(shí)世界關(guān)節(jié)體類(lèi)別等;
2、具身交互感知:各種內(nèi)容交互的感覺(jué)帶來(lái)的全新感知,通過(guò)牛頓定律和數(shù)據(jù)驅(qū)動(dòng)的結(jié)合,不斷修正誤差從而得到正確的模型。
具象想象 (lmagination):自動(dòng)具身任務(wù)模擬,仿真引擎構(gòu)建。通過(guò)名為 RFUniverse 的仿真引攀,這個(gè)仿真引擎支持 7種物體(比如關(guān)節(jié)可移動(dòng)的、柔性的、透明的、流動(dòng)的……)、87種原子操作的仿真。當(dāng)研究人員把物體輸入,模型會(huì)在仿真引擎中進(jìn)行想象操作。
具身執(zhí)行(Execution):誤差。多傳感器合作,自意識(shí)執(zhí)行誤差。研究人員通過(guò)構(gòu)建一個(gè)元操作庫(kù),調(diào)用各種元來(lái)解決執(zhí)行的問(wèn)題。通過(guò)半自動(dòng)的data collection and labeling,能夠非??焖俚禺a(chǎn)生20億個(gè)抓取點(diǎn)位,再進(jìn)行訓(xùn)練,把「grasp」這個(gè)問(wèn)題分解為where(去哪里抓)和how(怎么去抓)的貝葉斯問(wèn)題,分別估測(cè)網(wǎng)絡(luò)。

圖4:全感知:物理屬性檢測(cè)(來(lái)源:上海交通大學(xué)教授盧策主題演講——《具身智能》)
具身智能+機(jī)器人有望成為AI的重要解決方案,傳感器、執(zhí)行器與計(jì)劃控制是三大基本要素。傳感器包括本體感受傳感器、觸覺(jué)+視覺(jué)+聲音傳感器、機(jī)器視覺(jué)等;執(zhí)行器包括減速器、伺服系統(tǒng)、微電機(jī)等;計(jì)劃控制部分包括控制器、工控系統(tǒng)、AI 系統(tǒng)等,傳感器與執(zhí)行器數(shù)量較多,具身智能核心技術(shù)壁壘和價(jià)值環(huán)節(jié)主要聚焦核心零部件: 減速器,伺服系統(tǒng)和控制器其中減速器在機(jī)器人中成本占比最高達(dá) 30%,其次是伺服系統(tǒng) (20%)和控制器(10%)
2023年5月17 日,特斯拉召開(kāi)2023 年股東大會(huì),展示了--直備受關(guān)注的人形機(jī)器人 Optimus 進(jìn)化情況,在機(jī)械關(guān)節(jié)控制方面,特斯拉機(jī)器人電機(jī)扭矩控制,力度控制更加精確靈敏: 在感知方面,該機(jī)器人環(huán)境感知和記憶能力提升不僅可以看路,亦會(huì)記路; 在學(xué)習(xí)方面,Optimus可根據(jù)人類(lèi)動(dòng)作范例,進(jìn)行端到端動(dòng)作操控。特斯拉創(chuàng)始人兼首席執(zhí)行官馬斯克表示:未來(lái)Optimus 的數(shù)量可能將達(dá)到 100 億以上。

圖5:特斯拉Optimus(來(lái)源:特斯拉)
03
算力硬件層——具身智能的底層土壤
2023年5月,全球 AI 芯片龍頭英偉達(dá)的創(chuàng)始人兼首席執(zhí)行官黃仁勛在ITFWorld2023 半導(dǎo)體大會(huì)表示,AI下一個(gè)浪潮將是“具身智能”。
同時(shí),他也介紹了英偉達(dá)的多模態(tài)具身智能系統(tǒng) Nvidia VIMA,其能在視覺(jué)文本提示的指導(dǎo)下,執(zhí)行復(fù)雜任務(wù)、獲取概念、理解邊界、甚至模擬物理學(xué),這也標(biāo)志著 AI 能力的一大顯著進(jìn)步。
算力硬件層是構(gòu)成AI產(chǎn)業(yè)的核心底座,主要包括AI芯片、AI服務(wù)器等。AI芯片需求有望率先擴(kuò)張。Al 芯片是用于加速人工智能訓(xùn)練和推理任務(wù)的專(zhuān)用硬件,主要包括 GPU、FPGA、ASIC 等,具有高度并行性和能夠?qū)崿F(xiàn)低功耗高效計(jì)算的特點(diǎn)。
隨著AI應(yīng)用的普及和算力需求的不斷擴(kuò)大,AI芯片需求有望率先擴(kuò)張。根據(jù)IDC預(yù)測(cè),中國(guó)AI 算力規(guī)模將保持高速增長(zhǎng),預(yù)計(jì)到 2026 年將達(dá)1271.4EFLOPS,CAGRA(2022-2026年)達(dá)52.3%。在此背景下,IDC預(yù)測(cè)異構(gòu)計(jì)算將成為主流趨勢(shì),夫來(lái) 18 個(gè)月全球人工智能服務(wù)器 GPUASIC和FPGA的搭載率均會(huì)上升,2025年人工智能芯片市場(chǎng)規(guī)模將達(dá)726億美元。

圖6:中國(guó)AI算力規(guī)模及預(yù)測(cè)(來(lái)源:IDC)

圖7:全球AI芯片市場(chǎng)規(guī)模及預(yù)測(cè)(來(lái)源:IDC)

圖8:AI芯片競(jìng)爭(zhēng)格局(來(lái)源:中泰證券研究所整理)
04
機(jī)器視覺(jué)——具身智能的“眼睛”
若要實(shí)現(xiàn)具身智能與外界的互動(dòng)感知,機(jī)器視覺(jué)也是必不可少的一環(huán)。
機(jī)器視覺(jué)是在機(jī)器人和自動(dòng)化設(shè)備中代替人眼實(shí)現(xiàn)高精度檢測(cè)、識(shí)別、測(cè)量和定位引導(dǎo)等功能,助力企業(yè)構(gòu)建數(shù)字化車(chē)間、打造智能工廠。
從機(jī)器視覺(jué)產(chǎn)業(yè)鏈角度來(lái)看,機(jī)器視覺(jué)行業(yè)產(chǎn)業(yè)鏈環(huán)節(jié)較長(zhǎng),上游由機(jī)器視覺(jué)系統(tǒng)硬件和軟件算法構(gòu)成,中游為設(shè)備商和系統(tǒng)集成商主要負(fù)責(zé)軟件的二次開(kāi)發(fā)和設(shè)備制造,下游應(yīng)用場(chǎng)景和行業(yè)廣泛,工業(yè)是目前中國(guó)機(jī)器視覺(jué)行業(yè)最大的下游應(yīng)用領(lǐng)域,工業(yè)領(lǐng)域的銷(xiāo)售額占比為 81.2%。具身智能有望成為下一個(gè)快速發(fā)展的下游應(yīng)用。
機(jī)器視覺(jué)行業(yè)隨工業(yè)自動(dòng)化技術(shù)的演進(jìn)逐步升級(jí)規(guī)模化應(yīng)用,全球市場(chǎng)來(lái)看,GGII預(yù)計(jì)至2025年市場(chǎng)規(guī)模超1200億元。

圖9:機(jī)器視覺(jué)產(chǎn)業(yè)鏈(來(lái)源:前瞻產(chǎn)業(yè)研究院)
國(guó)內(nèi)視覺(jué)龍頭有望充分受益于具身智能發(fā)展。國(guó)內(nèi)兩大機(jī)器視覺(jué)龍頭均深度布局。
根據(jù)中國(guó)機(jī)器視覺(jué)產(chǎn)業(yè)聯(lián)盟(CMVU)調(diào)查統(tǒng)計(jì),現(xiàn)在已進(jìn)入中國(guó)的國(guó)際機(jī)器視覺(jué)品牌已近 200 多家(如康耐視為代表的核心部件制造商,以基恩士為代表的則同時(shí)涉足機(jī)器視覺(jué)核心部件和系統(tǒng)集成),中國(guó)自有的機(jī)器視覺(jué)品牌也已有 100 多家(如??档?,機(jī)器視覺(jué)各類(lèi)產(chǎn)品代理商超過(guò) 300 家(如凌云光等)。

圖10:??低暀C(jī)器視覺(jué)布局(來(lái)源:??低?/span>)
從視覺(jué)業(yè)務(wù)規(guī)模的角度看,2021 年,各大廠商均有較為亮眼的業(yè)務(wù)增速,尤其國(guó)產(chǎn)廠商,??禉C(jī)器人機(jī)器視覺(jué)業(yè)務(wù)2021 年實(shí)現(xiàn)超過(guò) 100%的增長(zhǎng),國(guó)內(nèi)業(yè)務(wù)規(guī)模超過(guò)基恩士、康耐視,位居第一,其他國(guó)產(chǎn)廠商如奧普特亦有較高的增速。

圖11:2021年中國(guó)機(jī)器視覺(jué)整體市場(chǎng)內(nèi)外資企業(yè)競(jìng)爭(zhēng)格局(來(lái)源:GGII,前瞻產(chǎn)業(yè)研究院)報(bào)告參考:中泰證券報(bào)告編輯:BFT機(jī)器人
??更多精彩內(nèi)容請(qǐng)關(guān)注公眾號(hào):BFT機(jī)器人
本文為原創(chuàng)文章,版權(quán)歸BFT機(jī)器人所有,如需轉(zhuǎn)載請(qǐng)與我們聯(lián)系。若您對(duì)該文章內(nèi)容有任何疑問(wèn),請(qǐng)與我們聯(lián)系,將及時(shí)回應(yīng)。