電子行業(yè)深度報(bào)告:邊緣域AI的“寒武大爆發(fā)”
報(bào)告出品方:民生證券
以下為報(bào)告原文節(jié)選
------
序:邊緣域 AI 的“寒武大爆發(fā)”
“寒武紀(jì)”是距今約 5.3 億年的地質(zhì)時(shí)代,深遠(yuǎn)的海洋中誕生了一大批生物,地球物種空前繁榮昌盛,這也是顯生宙的開始。
為何會(huì)有生命大爆發(fā)?古生物學(xué)眾說紛紜,有地球變暖說、氧氣水平升高說等等。但無論哪種觀點(diǎn)都認(rèn)為,在寒武紀(jì),地球的生態(tài)變化跨過了奇點(diǎn),進(jìn)而改變了一切。
自 ChatGPT 問世以來,從 GPT-1 到 GPT-3.5,GPT 模型的智能化程度不斷提升,GPT-4 多模態(tài)模型的發(fā)布進(jìn)一步加速產(chǎn)業(yè)革命。ChatGPT 對(duì)智能終端的賦能,同樣將開啟新一輪“寒武紀(jì)大爆發(fā)”時(shí)代。
AIGC 內(nèi)容快速發(fā)展下,未來智能終端 (平板、手機(jī)、音響、電視、IOT 等) 的人機(jī)交互都有望重構(gòu)。當(dāng)下,各大廠商爭先發(fā)布大模型,如 ChatGPT、百度文心一言、三六零大模型、華為盤古大模型、阿里大模型等,國內(nèi)外大模型加速應(yīng)用落地,多模態(tài)大模型賦能下通用與垂直應(yīng)用場景的應(yīng)用端革新漸漸開啟。
AI 大模型的進(jìn)展帶來邊緣域 AI 三大產(chǎn)業(yè)鏈環(huán)節(jié)的變革。邊緣域 AI 產(chǎn)業(yè)鏈包括智能硬件、模組、芯片三大環(huán)節(jié)。AI 大模型的迭代推動(dòng)了邊緣域 AI 的應(yīng)用發(fā)展,將對(duì)應(yīng)用于 AI 領(lǐng)域的模組以及算力芯片提出更高的要求,同時(shí)帶動(dòng)應(yīng)用端智能硬件的革新。
1 AI 發(fā)展復(fù)盤,輕量級(jí)模型重構(gòu)邊緣域
1.1 ChatGPT 引領(lǐng)大模型浪潮,AI“iPhone“時(shí)刻已至
ChatGPT 為 AI 的“iPhone“時(shí)刻。3 月 21 日,英偉達(dá) CEO 黃仁勛在 GTC2023 大會(huì)上將 ChatGPT 比作 AI 的“iPhone“時(shí)刻,AI 時(shí)代加速來臨。
自 ChatGPT 問世以來,從 GPT-1 到 GPT-3.5,GPT 模型的智能化程度不斷提升,ChatGPT 在擁有 3000 億單詞的語料基礎(chǔ)上預(yù)訓(xùn)練出擁有 1750 億個(gè)參數(shù)的模型(GPT-2 僅有 15 億參數(shù)),預(yù)訓(xùn)練數(shù)據(jù)量從 5GB 增加到 45TB,模型從預(yù)訓(xùn)練+微調(diào)轉(zhuǎn)變?yōu)槿斯?biāo)注數(shù)據(jù)+強(qiáng)化學(xué)習(xí),人工智能取得技術(shù)突破。而隨后 GPT3.5 turbo 帶來 10 倍成本的降低及 GPT-4 多模態(tài)模型的發(fā)布,進(jìn)一步加速生產(chǎn)力的全新躍遷。
多模態(tài)模型成重要趨勢,AI 應(yīng)用空間有望進(jìn)一步拓展。多模態(tài)模型結(jié)合來自不同模態(tài)(例如文本、圖像、語音等)的數(shù)據(jù)進(jìn)行聯(lián)合建模,應(yīng)用于自然語言處理、計(jì)算機(jī)視覺、語音識(shí)別等領(lǐng)域,有效提高模型的準(zhǔn)確度和穩(wěn)定性。
從 Open AI 產(chǎn)品矩陣可以看出其已經(jīng)布局文本、圖片、語音等多模態(tài)產(chǎn)品,未來將逐步探索多模態(tài)的融合,實(shí)現(xiàn)圖像、視頻、文本間跨模態(tài)生成,顯著提升智能終端產(chǎn)品體驗(yàn),帶來各行各業(yè)生產(chǎn)力水平的質(zhì)變。
國際科技巨頭加緊布局多模態(tài)模型領(lǐng)域。微軟和谷歌兩大巨頭相繼推出大模型,2023 年 3 月,OpenAI 推出 GPT-4 模型,可以接受圖像和文本輸入,并輸出文本。3 月谷歌推出 PaLM-E 模型,通過輸入多模態(tài)語句,包括視覺、連續(xù)狀態(tài)估計(jì)和文本輸入編碼,來執(zhí)行機(jī)器人操作規(guī)劃、視覺問題解答等具體操作;5 月谷歌推出 PaLM2 模型,支持 100 多種人類語言與 20 多種編程語言,同時(shí)支持讀取與生成音視頻內(nèi)容。
AI 領(lǐng)域群體效應(yīng)下,國內(nèi)大廠紛紛入局。國內(nèi) AI 大廠以百度文心一言發(fā)布為拐點(diǎn),未來有望憑借更優(yōu)質(zhì)的中文數(shù)據(jù)和多場景的應(yīng)用實(shí)現(xiàn)彎道超車。百度文心一言是國內(nèi)首個(gè)全棧大模型產(chǎn)品,模型發(fā)布后申請(qǐng)合作廠商超 9 萬家,騰訊、阿里、華為、商湯等大廠在 AI 大模型領(lǐng)域已有成熟布局,相關(guān)應(yīng)用有望快速發(fā)布。
伴隨著多模態(tài)大模型的不斷涌現(xiàn),更多場景的 AI 應(yīng)用將加速落地。
1.2 API Plugin 引入,海量應(yīng)用邁入 AI 新時(shí)代
Plugin 開啟 AI 的“APP Store“時(shí)代,生態(tài)版圖進(jìn)一步擴(kuò)展。2023 年 3 月2 日,Open Al 推出了自然語言對(duì)話模型 GPT-3.5-Turbo 和語音轉(zhuǎn)文本模型Whisper models 的開發(fā)者 API,使得多種應(yīng)用程序可通過 API 的方式接入ChatGPT。3 月 24 日,ChatGPT plugins 的發(fā)布,進(jìn)一步擴(kuò)大了 ChatGPT 的應(yīng)用能力并催化至多場景的業(yè)務(wù)處理能力,AI 的“APP Store“時(shí)代到來。
插件商城接入 10 余家應(yīng)用,具備檢索實(shí)時(shí)信息、檢索知識(shí)庫信息和代替用戶操作應(yīng)用功能。Open AI 官網(wǎng)顯示,目前 Plugin 已接入 Expedia、FiscalNote、Instacart、Kayak、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram以及 Zapier 等應(yīng)用,涉及旅行、購物、航班、推薦餐廳、語言導(dǎo)師等各個(gè)方面。
未來,隨著各類應(yīng)用與 ChatGPT 的結(jié)合,GPT 生態(tài)系統(tǒng)有望迎來“蘋果+App Store”的繁榮時(shí)刻。
1.3 龍頭廠商加注輕量級(jí)模型,邊緣 AI 迎“安卓時(shí)刻”
除大模型外,龍頭廠商也紛紛布局輕量級(jí)模型,當(dāng)前 Meta、谷歌、高通等公司已開始發(fā)力邊緣 AI。谷歌和 Meta 分別于今年 5 月 11 日和 7 月 19 日發(fā)布了各自最新的大語言模型版本 PaLM 2 和 Llama 2,較以往版本實(shí)現(xiàn)測試數(shù)據(jù)、性能等全面優(yōu)化,輕量化版本均能應(yīng)用于邊緣端,其中最新發(fā)布的 Meta 大模型Llama 2 更是開放開源免費(fèi)使用,有望推動(dòng)邊緣 AI 迎來“安卓時(shí)刻”。此前,芯片龍頭廠商高通也首次成功實(shí)現(xiàn) Stable Diffusion 模型在手機(jī)端應(yīng)用生成 AI 圖像,并于 5 月 30 日宣布高通正在轉(zhuǎn)型為邊緣計(jì)算公司,全面下注邊緣 AI。
1.3.1 Meta 發(fā)布最新 AI 大語言模型 Llama 2
繼今年 2 月發(fā)布 Llama 1 大模型后,Meta AI 在 7 月 19 日凌晨發(fā)布了最新一代的開源大模型 Llama 2。該模型在測試中表現(xiàn)優(yōu)異,Meta 計(jì)劃將該模型開放開源免費(fèi)使用,且支持高通芯片運(yùn)行,有望助力邊緣 AI 加速落地。
Llama2 模型的訓(xùn)練數(shù)據(jù)量、參數(shù)均有增加。Llama 2 的參數(shù)、訓(xùn)練數(shù)據(jù)和上下文長度相比上一代模型增加。新模型 Llama 2 系列包含 70 億、130 億和 700億三種參數(shù)類型,相比原來 Llama 1 最多 650 億參數(shù)有所增加。并且,相比于Llama 1 預(yù)訓(xùn)練模型 1.4 萬億的訓(xùn)練 token 數(shù),Llama 2 預(yù)訓(xùn)練模型的訓(xùn)練數(shù)據(jù)提升了 40%至 2 萬億,且針對(duì)聊天用例進(jìn)行的 Chat 模型精調(diào)訓(xùn)練數(shù)據(jù)超過 100萬人類標(biāo)記數(shù)據(jù),使用人類反饋進(jìn)行強(qiáng)化學(xué)習(xí)(RLHF)從而提高模型安全性。此外,對(duì)于大模型非常重要的上下文長度限制,Llama 2 比 Llama 1 翻了一倍至 4096字符,能處理更多信息。Llama 2 模型在大多數(shù)基準(zhǔn)測試中表現(xiàn)優(yōu)于其他開源模型,包括編碼、推理、知識(shí)、精通性測試等。不僅如此,Meta 從有用性和安全性進(jìn)行評(píng)估,認(rèn)為 Llama 2 有希望成為閉源模型的替代品。
Llama 2 開放開源免費(fèi)使用,加速生態(tài)構(gòu)建。Llama 一直以來是 AI 社區(qū)內(nèi)性能最強(qiáng)的開源大模型之一,但此前存在開源協(xié)議問題,此次 Meta 發(fā)布 Llama 2模型將免費(fèi)供給研究和商業(yè)用途,有望吸引更多開發(fā)者,加速 AI 應(yīng)用落地節(jié)奏。
此外,Meta 宣布與微軟云服務(wù) Azure 合作開發(fā)基于 Llama 2 模型的云服務(wù),微軟作為全球領(lǐng)先的大模型和云服務(wù)廠商,二者合作有望加快生態(tài)構(gòu)建速度。
Llama 2 可用于高通芯片,有望加速邊緣 AI 落地。Meta 與高通宣布 Llama2 將于 2024 年應(yīng)用于高通驍龍芯片,成為谷歌 PaLM 2 大模型之后又一個(gè)將運(yùn)行于高通芯片的大模型。目前已有開發(fā)者將 Llama 2 模型部署至手機(jī)終端,實(shí)現(xiàn)離線運(yùn)行,將來 Llama 2 模型有望進(jìn)一步運(yùn)用在汽車、PC、AR/VR 等終端設(shè)備上,無需擔(dān)憂網(wǎng)絡(luò)連接和云端擁擠問題,可提高服務(wù)的可靠性,并且減少云端運(yùn)行成本;個(gè)人數(shù)據(jù)和信息僅保存在設(shè)備邊緣端而非云端,可滿足用戶數(shù)據(jù)保密需求,并且不犧牲隱私即可提供更個(gè)性化的產(chǎn)品和服務(wù),推動(dòng)邊緣 AI 加速落地,也將推動(dòng)邊緣硬件加速迭代。
1.3.2 谷歌發(fā)布通用大語言模型 PaLM 2
在 Meta 之前,谷歌率先于 5 月 11 日發(fā)布通用大語言模型 PaLM 2,并且包含輕量化版本,可運(yùn)行于移動(dòng)終端。PaLM 2 性能全面優(yōu)于前代模型,部分領(lǐng)域能與 GPT-4 競爭。多語言能力方面,作為驅(qū)動(dòng) AI 機(jī)器人 Bard 的模型的升級(jí)版,PaLM 2 可使用 Fortran 等 20 多種編程語言,100 多種口頭語言進(jìn)行數(shù)學(xué)、軟件開發(fā)、語言翻譯推理和自然語言生成,多語言能力全面超過前代 PaLM 模型,同時(shí)部分語言能力基準(zhǔn)測試結(jié)果超過 GPT-4。編程能力方面,PaLM 2 改進(jìn)了編程能力,谷歌通過調(diào)整預(yù)訓(xùn)練數(shù)據(jù)集構(gòu)建了 PaLM 2-S*模型。該模型擅長 Python、Javascript 等流行編程語言,也可以生成 Prolog、Fortran 等語言的專用代碼。
PaLM 2 輕量化版本能夠運(yùn)行于移動(dòng)端,將帶動(dòng)邊緣 AI 計(jì)算成長。PaLM 2包括 Gecko、Otter、Bison 和 Unicorn 四種不同參數(shù)規(guī)模版本。其中,最輕量版本 Gecko 可在移動(dòng)設(shè)備端運(yùn)行,提供每秒處理 20 個(gè) token 的能力。此前大模型在邊端的應(yīng)用主要通過 API 接口調(diào)用,模型本身的訓(xùn)練和推理仍在云端進(jìn)行,對(duì)邊緣側(cè)終端以及芯片更新沒有太大需求。輕量化模型可以降低邊緣側(cè)模型部署成本,使 AI 模型離線應(yīng)用成為可能,從而提供定制化、低時(shí)延、高安全性與隱私性的下游應(yīng)用,開拓 AI 模型在邊緣側(cè)推理的場景。這將帶動(dòng)邊緣 AI 計(jì)算成長,加速邊緣硬件市場更新迭代,提升智能硬件用戶使用體驗(yàn),使智能硬件成為新的 AI 流量入口。
PaLM 2 已被應(yīng)用于多個(gè)谷歌應(yīng)用,并支持特定領(lǐng)域應(yīng)用。PaLM 2 已經(jīng)被用于支持超過 20 種谷歌應(yīng)用,包括辦公軟件系列、谷歌搜索以及 AI 機(jī)器人 Bard。
以 PaLM 2 驅(qū)動(dòng)的 Bard 將具備更強(qiáng)的多模態(tài)理解能力,使其能夠理解用戶的圖片提示并在回復(fù)中包含圖片。PaLM 2 能提供醫(yī)療、網(wǎng)絡(luò)安全等特定領(lǐng)域內(nèi)的服務(wù),基于健康數(shù)據(jù)訓(xùn)練的 Med-PaLM 2 能夠在美國醫(yī)學(xué)執(zhí)照考試式的 MedQA 數(shù)據(jù)集上達(dá)到“專家”級(jí)別表現(xiàn),基于網(wǎng)絡(luò)安全數(shù)據(jù)訓(xùn)練的 Sec-PaLM 2 可以用于解釋潛在惡意腳本行為,這兩種模型將通過谷歌云向特定用戶提供服務(wù)。
1.3.3 高通實(shí)現(xiàn) Stable Diffusion 手機(jī)端運(yùn)行,宣布轉(zhuǎn)型邊緣計(jì)算
除大模型廠商外,芯片廠商也正積極布局邊緣 AI。高通在今年 5 月 30 日宣布正在從通信公司轉(zhuǎn)型成為邊緣計(jì)算公司。公司高級(jí)副總裁 Alex Katouzian 表示,數(shù)據(jù)中心在連接設(shè)備和數(shù)據(jù)流量大幅增長的情況下疊加的成本節(jié)節(jié)攀升,將內(nèi)容均發(fā)送云端的傳統(tǒng)做法不再經(jīng)濟(jì),也無法滿足未來 AI 所需的比云端計(jì)算更強(qiáng)大的算力,同時(shí)考慮到日益增長的用戶隱私需求,由云端算力轉(zhuǎn)向布局邊緣算力正當(dāng)其時(shí)。Alex Katouzian 強(qiáng)調(diào)高通截至今年 5 月底已向全球出貨 20 億件搭載 AI 功能的智能產(chǎn)品。
此前,在 2 月 24 日,高通宣布首次實(shí)現(xiàn)在手機(jī)端運(yùn)行 Stable Diffusion 模型。Stable Diffusion 模型作為現(xiàn)下最先進(jìn)的生成式 AI 模型通常只在云端運(yùn)行。
而高通 AI Research 通過高通 AI 軟件棧實(shí)現(xiàn)全棧 AI 優(yōu)化后成功在安卓智能手機(jī)端運(yùn)行 Stable Diffusion 模型,這一全棧 AI 優(yōu)化方案能顯著降低運(yùn)算時(shí)延和能耗,可以在 15 秒內(nèi)進(jìn)行 20 步推理,生成分辨率為 512x512 的高清 AI 圖像,且文本輸入不受限制。在智能手機(jī)終端成功運(yùn)行 Stable Diffusion 模型后,高通更長遠(yuǎn)的目標(biāo)是可以適用 PC 等其他終端和其他模型。
2 從音頻到視頻,探討硬件終端的重估值潛力
GPT 變革內(nèi)容生成與交互方式,AI 智能終端百花齊放。自 GPT-4、百度文心一言、Microsoft 365 服務(wù)全面接入 AI 驅(qū)動(dòng)工具 Copilot 以來,國內(nèi)外各大廠商爭相開啟 AI 賦能,通用+垂直場景協(xié)同發(fā)展,B 端和 C 端天花板有望進(jìn)一步打開,AI 應(yīng)用在多種場景的擴(kuò)散正全面演繹。
海外大廠積極布局物聯(lián)網(wǎng)和人工智能領(lǐng)域,AI 應(yīng)用發(fā)展迅速。1)微軟在物聯(lián)網(wǎng)+AI 領(lǐng)域的布局非常全面,覆蓋了物聯(lián)網(wǎng)平臺(tái)、機(jī)器學(xué)習(xí)、邊緣計(jì)算、解決方案加速器和開發(fā)工具包等方面,為企業(yè)提供了豐富的技術(shù)和解決方案,其中Microsoft 365 服務(wù)全面接入基于大型語言模型的 AI 產(chǎn)品 Copilot 打通了 AI 應(yīng)用的第一站;2)谷歌通過收購 Nest 和開發(fā)新的技術(shù),在智能家居、可穿戴設(shè)備和其他物聯(lián)網(wǎng)設(shè)備的市場上擁有廣泛的影響力;3)亞馬遜的 AWS IoT 服務(wù)也為企業(yè)提供了構(gòu)建物聯(lián)網(wǎng)解決方案所需的基礎(chǔ)設(shè)施和工具,包括設(shè)備管理、數(shù)據(jù)采集和處理、安全和認(rèn)證等。
國內(nèi)大廠在人工智能和物聯(lián)網(wǎng)領(lǐng)域也有著廣泛的布局,涵蓋自動(dòng)駕駛、智能家居、云服務(wù)等多個(gè)方向。百度成立智能駕駛事業(yè)部,并先后在智能家居市場推出智能音箱產(chǎn)品 DuerOS、小度智能屏等;騰訊成立“Tencent IoT”,專注于物聯(lián)網(wǎng)領(lǐng)域的技術(shù)研發(fā)和應(yīng)用,該部門主要提供包括智能硬件開發(fā)平臺(tái)、物聯(lián)網(wǎng)云服務(wù)等多種服務(wù),幫助企業(yè)快速接入物聯(lián)網(wǎng);阿里巴巴推出物聯(lián)網(wǎng)平臺(tái) Link IoT,以幫助企業(yè)構(gòu)建物聯(lián)網(wǎng)解決方案,提供從設(shè)備管理到數(shù)據(jù)分析等一系列功能,同時(shí)發(fā)布物聯(lián)網(wǎng)操作系統(tǒng) AliOS Things,可幫助設(shè)備廠商快速構(gòu)建物聯(lián)網(wǎng)設(shè)備。
2.1 AI 開發(fā)平臺(tái)賦能行業(yè)應(yīng)用
AI 開發(fā)平臺(tái)流程包括數(shù)據(jù)處理、模型搭建、模型訓(xùn)練、模型評(píng)估及模型部署五個(gè)步驟。數(shù)據(jù)處理包括數(shù)據(jù)采集、數(shù)據(jù)篩選、數(shù)據(jù)標(biāo)注、數(shù)據(jù)分組等環(huán)節(jié),以此實(shí)現(xiàn)高質(zhì)量的數(shù)據(jù)準(zhǔn)備和輸出,保證模型質(zhì)量。模型搭建環(huán)節(jié)包括模型篩選和參數(shù)調(diào)配,在此基礎(chǔ)上進(jìn)行模型訓(xùn)練與優(yōu)化。多輪訓(xùn)練迭代之后,開發(fā)者可以通過預(yù)設(shè)指標(biāo)對(duì)模型的性能、質(zhì)量進(jìn)行評(píng)估,評(píng)估通過后可以進(jìn)行模型部署,將模型轉(zhuǎn)化為AI 應(yīng)用。憑借較高的部署效率、豐富的計(jì)算資源、強(qiáng)大的存儲(chǔ)能力、專業(yè)的運(yùn)維團(tuán)隊(duì)等優(yōu)勢,很多企業(yè)已將 AI 開發(fā)平臺(tái)作為 AI 開發(fā)方式的首要選擇。
大模型的突破和云計(jì)算技術(shù)的成熟將推動(dòng)中國 AI 開發(fā)平臺(tái)市場規(guī)模保持高速增長。據(jù)頭豹研究院測算,2022 年中國 AI 開發(fā)平臺(tái)市場規(guī)模達(dá) 257.3 億元,2017-2022 年 CAGR 高達(dá) 62.9%。雖然目前市場競爭加劇,但考慮到大模型的持續(xù)突破和下游應(yīng)用的不斷革新,預(yù)計(jì) 2022-2027 年中國 AI 開發(fā)平臺(tái)市場規(guī)模 CAGR約為 24.9%,2027 年市場規(guī)模達(dá)到 785.2 億元。
大模型的突破將拓寬 AI 開發(fā)平臺(tái)的行業(yè)應(yīng)用。據(jù)頭豹研究院統(tǒng)計(jì),目前 AI 開發(fā)平臺(tái)的應(yīng)用主要集中于金融、泛娛樂及教育領(lǐng)域,由于技術(shù)落地的局限和數(shù)據(jù)安全等問題,醫(yī)療等重要應(yīng)用場景的滲透率有待進(jìn)一步提高。隨著大模型的突破和技術(shù)的不斷成熟,AI 開發(fā)平臺(tái)有望對(duì)重要應(yīng)用場景進(jìn)一步滲透,持續(xù)賦能行業(yè)應(yīng)用。
2.2 音頻入局,率先發(fā)力
音頻入局,率先發(fā)力。音頻作為輕交互的方式,更適用于碎片化場景,以ChatGPT、文心一言為代表的生成式 AI 模型提高了智能音頻設(shè)備的交互體驗(yàn),生成內(nèi)容質(zhì)量提升進(jìn)一步滿足用戶在真實(shí)場景中服務(wù)客戶的需求,未來會(huì)逐步實(shí)現(xiàn)個(gè)性化和情感交互,2023 年,各大廠商爭相發(fā)力音頻領(lǐng)域:
1)2 月 9 日,百度宣布將融合文心一言,打造針對(duì)智能設(shè)備場景的人工智能模型「小度靈機(jī)」,并將其應(yīng)用到小度全系產(chǎn)品中;
2)4 月 11 日,天貓精靈宣布將正式接入阿里巴巴“通義千問”大模型;
3)4 月 11 日,Innovative Eyewear 官宣推出一款名為“Lucyd”的手機(jī)應(yīng)用,該應(yīng)用可以為智能眼鏡用戶提供 ChatGPT 的語音服務(wù),用戶既可以使用智能眼鏡內(nèi)置的麥克風(fēng)進(jìn)行語音交互,也可以使用 AirPods 等硬件設(shè)備語音喚醒;
4)5 月 11 日,谷歌推出 PaLM 2 Gecko 輕量級(jí) AI 模型,可在手機(jī)及 IOT 設(shè)備本地或離線運(yùn)行,加速 AI 賦能智能終端。
AIGC 落地的第一站——智能音箱(智能家居)&耳機(jī)(可穿戴設(shè)備)。為什么說智能音箱&耳機(jī)可能成為 AIGC 落地的第一站,我們主要從三個(gè)方面論證:
1、 技術(shù)層面:以 ChatGPT 為代表的生成式 AI 系統(tǒng)將不斷優(yōu)化提升智能語音交互反饋的豐富度和準(zhǔn)確性,大大改善消費(fèi)者體驗(yàn),為智能音箱&耳機(jī)等可穿戴設(shè)備的進(jìn)一步滲透打開成長空間。
2、 商業(yè)模式:智能音箱和耳機(jī)具備商業(yè)模式顛覆式創(chuàng)新的可能性,未來接入ChatGPT plugins API 后,智能音箱和耳機(jī)既可以直接調(diào)用 APP,完成生態(tài)系統(tǒng)的創(chuàng)建,實(shí)現(xiàn)To B收費(fèi);也可以對(duì)接更為豐富的內(nèi)容/教育資源,實(shí)現(xiàn) To C 收費(fèi)。
3、 發(fā)展階段:1)智能音箱:經(jīng)過近 10 年發(fā)展,已具備一定用戶基礎(chǔ)和發(fā)展土壤。目前各大廠正向發(fā)力 AI+智能音箱領(lǐng)域,如百度融合文心一言打造“小度靈機(jī)“、天貓精靈接入通義千問大模型等。2)耳機(jī):從 2021 年開始 TWS 耳機(jī)市場的增長態(tài)勢放緩,AIGC 有望賦能開啟新成長空間。
科大訊飛發(fā)布 iFLYBUDS Nano+,集成了生成式 AI 技術(shù),可實(shí)現(xiàn)全場景錄音轉(zhuǎn)寫、VIAIM AI 會(huì)議助理等功能。
前文我們強(qiáng)調(diào)了音箱+耳機(jī)的音頻屬性。展望邊緣 AI 的未來,二者在各自領(lǐng)域扮演的角色是不一樣的。
1)智能家居:1+N 模式為未來趨勢。
“1”代表信息處理核心,用于接收用戶指令及處理計(jì)算,目前智能家居方案商更多采用智能音箱作為控制核心,而機(jī)頂盒/投影儀等同樣有潛力成為智能家居的算力中心。而目前邊緣設(shè)備算力有限,后續(xù)如若有本地化大模型的需求,則需提升終端算力?!癗”代表 N 個(gè)智能家居設(shè)備,由計(jì)算中心進(jìn)行統(tǒng)一控制,核心搭配WiFi/藍(lán)牙等連接芯片。智能家居設(shè)備種類多樣,包括智能照明、智能窗簾、智能安防、智能影音娛樂、智能用水、智能網(wǎng)絡(luò)等。通過在邊緣側(cè)進(jìn)行大模型的推理,省略云端計(jì)算的步驟,可以使得信息指令輸入輸出時(shí)延更短等,能使人機(jī)交互更順暢,提升用戶體驗(yàn)。
2)可穿戴設(shè)備:耳機(jī)入口+邊緣算力
相較音箱對(duì)于智能家居的重要地位,耳機(jī)在可穿戴設(shè)備中扮演的是入口的角色。耳機(jī)可以更便捷地接受用戶指令,并向下連接負(fù)責(zé)處理信息的邊緣設(shè)備——如 PC、手機(jī)、手表等,由其中的 SoC 進(jìn)行推理。華為智能手表新品 WATCH Buds于 2022 年底正式發(fā)布,實(shí)現(xiàn)了手表+耳機(jī)二合一,即在智能手表內(nèi)部隱藏 TWS無線耳機(jī),通過彈蓋可取出耳機(jī),WATCH Buds 搭載 HarmonyOS 3 系統(tǒng),通過耳機(jī)和手表的強(qiáng)互聯(lián),實(shí)現(xiàn) AIGC 在可穿戴設(shè)備領(lǐng)域的應(yīng)用。
2.3 視頻決勝,全面感知
在經(jīng)歷文本、圖像、語音等生成式 AI 系統(tǒng)陸續(xù)落地之后,我們認(rèn)為視頻將是后續(xù) AIGC 落地的重要應(yīng)用場景之一,主要應(yīng)用在行業(yè)端的智慧城市、智慧交通以及消費(fèi)端的家庭安防、智能門鎖等。
在 AI 賦能下,攝像機(jī)從傳統(tǒng)的視頻監(jiān)控終端演變?yōu)槿f物互聯(lián)中最主要的智能物聯(lián)終端,視頻數(shù)據(jù)作為重要的數(shù)據(jù)底座,為行業(yè)或城市提供多維數(shù)據(jù)匯聚、處理、治理、挖掘、服務(wù)等支持。圍繞智能識(shí)別、智能調(diào)度、智能研判等核心 AI 能力,利用認(rèn)知模型、知識(shí)圖譜等技術(shù),可實(shí)現(xiàn)視頻數(shù)據(jù)價(jià)值挖掘,進(jìn)而賦能公共安全、交通管理、城市治理、生態(tài)環(huán)保、智慧辦公、智能家居等應(yīng)用領(lǐng)域:
1)智慧安防方面,智能監(jiān)控?cái)z像頭是最常見的安防應(yīng)用之一。計(jì)算機(jī)視覺技術(shù)可以用于自動(dòng)檢測異常行為、識(shí)別人臉和車牌等等,從而提高監(jiān)控的準(zhǔn)確性和效率。此外,計(jì)算機(jī)視覺還可以識(shí)別其他異常事件,例如火災(zāi)、煙霧、盜竊等,從而增強(qiáng)監(jiān)控系統(tǒng)的安全性和可靠性。
2)工業(yè)機(jī)器視覺:視覺感知技術(shù)也可賦能工業(yè)物聯(lián)網(wǎng)、智慧物流和智能制造領(lǐng)域,推動(dòng)生產(chǎn)、物流的數(shù)字化和智能化。例如工業(yè)機(jī)器人在汽車行業(yè)、新能源行業(yè)的應(yīng)用。
3)除此之外,在衛(wèi)星遙感、智慧家居、智慧金融、智慧政府等方面,AI 同樣可以賦能視頻數(shù)據(jù)價(jià)值挖掘。
--- 報(bào)告摘錄結(jié)束 更多內(nèi)容請(qǐng)閱讀報(bào)告原文 ---
報(bào)告合集專題一覽 X 由【報(bào)告派】定期整理更新
(特別說明:本文來源于公開資料,摘錄內(nèi)容僅供參考,不構(gòu)成任何投資建議,如需使用請(qǐng)參閱報(bào)告原文。)
精選報(bào)告來源:報(bào)告派
科技 / 電子 / 半導(dǎo)體 /
人工智能 | Ai產(chǎn)業(yè) | Ai芯片 | 智能家居 | 智能音箱 | 智能語音 | 智能家電 | 智能照明 | 智能馬桶 | 智能終端 | 智能門鎖 | 智能手機(jī) | 可穿戴設(shè)備 |半導(dǎo)體 | 芯片產(chǎn)業(yè) | 第三代半導(dǎo)體 | 藍(lán)牙 | 晶圓 | 功率半導(dǎo)體 | 5G | GA射頻 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圓 | 封裝封測 | 顯示器 | LED | OLED | LED封裝 | LED芯片 | LED照明 | 柔性折疊屏 | 電子元器件 | 光電子 | 消費(fèi)電子 | 電子FPC | 電路板 | 集成電路 | 元宇宙 | 區(qū)塊鏈 | NFT數(shù)字藏品 | 虛擬貨幣 | 比特幣 | 數(shù)字貨幣 | 資產(chǎn)管理 | 保險(xiǎn)行業(yè) | 保險(xiǎn)科技 | 財(cái)產(chǎn)保險(xiǎn) |