軟件與服務(wù)行業(yè)報(bào)告:算力AI大潮,昇騰破浪
報(bào)告出品方:長江證券
以下為報(bào)告原文節(jié)選
------
引言:大模型時(shí)代來臨,技術(shù)革命帶來產(chǎn)業(yè)重構(gòu)
ChatGPT 驚艷問世,引發(fā)全球關(guān)注,AI 大模式時(shí)代來臨。2022 年 11 月 30 日,OpenAI發(fā)布聊天機(jī)器人程序 ChatGPT(Chat Generative Pre-trained Transformer)。該程序一經(jīng)上線,用戶數(shù)量 5 天突破 100 萬人,月活數(shù)量 2 個(gè)月內(nèi)突破 1 億,成為史上用戶增長速度最快的消費(fèi)級應(yīng)用程序,引發(fā)市場對人工智能的強(qiáng)烈關(guān)注。不同于此前的任何 AI聊天機(jī)器人,ChatGPT 令人震驚的理解能力和上下文聯(lián)系能力使得人們相信人工智能正在成為現(xiàn)實(shí)。同時(shí),ChatGPT 所具備的理解能力、推理能力、學(xué)習(xí)能力更使得人工智能幫助人類提高生產(chǎn)力。
以 ChatGPT 為代表的大語言模型需要的巨大的參數(shù)量級是其有別于之前人工智能模型的關(guān)鍵點(diǎn)。大語言模型的“涌現(xiàn)”(Emergent)現(xiàn)象是指在模型訓(xùn)練參數(shù)和數(shù)據(jù)量超過一定數(shù)值之后,模型突然出現(xiàn)了意想不到的能力,令 AI 突然變得非常智能。谷歌、DeepMind、斯坦福的 16 位專家合作的論文《Emergent Abilities of Large Language Models》(大語言模型的涌現(xiàn)能力)闡述了大模型所展現(xiàn)的神奇能力正來自于其模型參數(shù)規(guī)模。大語音模型隨著規(guī)模的增長,實(shí)現(xiàn)了性能的大幅提升。
隨著大模型的參數(shù)量級的巨大提升,算力需求也將一同被引爆。除了大語言模型的參數(shù)量級之外,數(shù)據(jù)集規(guī)模和模型訓(xùn)練時(shí)長也一同影響模型效果。OpenAI 團(tuán)隊(duì)在其發(fā)布的論文《Scaling Laws for Neural Language Models》(自然語言模型的伸縮法則)中提出了大模型遵循“伸縮法則”(scaling laws),并證明當(dāng)參數(shù)規(guī)模增加、數(shù)據(jù)集規(guī)模增加并延長模型訓(xùn)練時(shí)間,大模型的性能就會提升,并且如不受其他兩個(gè)因素制約時(shí),大模型與每個(gè)單獨(dú)的因素都呈現(xiàn)冪律關(guān)系。因而為了提升模型性能,單單增加參數(shù)規(guī)模是不夠的,也需要延長模型訓(xùn)練時(shí)間,而這便對算力提出了需求??梢灶A(yù)見的是,在業(yè)界紛紛加碼大模型產(chǎn)業(yè),不斷提升參數(shù)規(guī)模的同時(shí),大模型訓(xùn)練所需要的算力也將大大提升,進(jìn)而帶來整個(gè)產(chǎn)業(yè)的重大變革。
海量算力需求催生行業(yè)巨頭,AI 芯片行業(yè)將迎來重大發(fā)展。每一輪新應(yīng)用爆發(fā)周期都會帶動對海量底層資源的需求,海量需求帶動底層變革降低 IT 成本反哺新應(yīng)用創(chuàng)新形成正向循環(huán)直至到了閾值?;ヂ?lián)網(wǎng)發(fā)展至今主要經(jīng)歷了 PC 互聯(lián)網(wǎng)以及移動互聯(lián)網(wǎng)兩次互聯(lián)網(wǎng)革命,未來隨著生成式人工智能的不斷發(fā)展有望催生新的技術(shù)變革。從歷史上看過往每一輪技術(shù)變革都將帶來新一輪的 IT 技術(shù)紅利釋放,進(jìn)而帶動 IT 產(chǎn)業(yè)進(jìn)入新一輪創(chuàng)新周期誕生出新的巨頭。
過往每一輪技術(shù)革命在帶動 IT 產(chǎn)業(yè)全面擴(kuò)容的同時(shí),催生新一輪創(chuàng)新誕生出新的巨頭。PC 互聯(lián)網(wǎng)(互聯(lián)網(wǎng) 1.0):80 年代中期現(xiàn)代 Internet 的前身 NSFNET 的廣域網(wǎng)建立,正式開啟 PC 互聯(lián)網(wǎng)時(shí)代。PC 互聯(lián)網(wǎng)解決人與人,人與內(nèi)容的鏈接,催生出消費(fèi)互聯(lián)網(wǎng)創(chuàng)新周期,誕生出英特爾、微軟、亞馬遜、阿里巴巴等一批巨頭。
移動互聯(lián)網(wǎng)(互聯(lián)網(wǎng) 2.0):2007 年以第一代 iPhone 發(fā)布為標(biāo)志,移動互聯(lián)網(wǎng)革命逐漸開啟,移動互聯(lián)網(wǎng)在進(jìn)一步擴(kuò)大鏈接數(shù)量的同時(shí),增強(qiáng)了互動屬性,催生出移動應(yīng)用創(chuàng)新周期,誕生出亞馬遜、蘋果、Google 頭條、FaceBook 等巨頭。
AIGC(互聯(lián)網(wǎng) 3.0):2022 年 ChatGPT 提供新一代人工智能問答服務(wù),有望帶動新一輪創(chuàng)新周期開啟,現(xiàn)階段 AIGC 發(fā)展還處于雛形階段,未來誰是 AIGC 時(shí)代技術(shù)紅利的最大受益者還有待觀察。
擴(kuò)容與創(chuàng)新是每一輪互聯(lián)網(wǎng)革命的共性。每一輪技術(shù)革命都伴隨基礎(chǔ)設(shè)施層的變革,隨著基礎(chǔ)設(shè)施層核心要素完備創(chuàng)新周期逐漸開啟,新興需求與場景不斷發(fā)展帶動對基礎(chǔ)設(shè)施資源的需求,底層資源規(guī)模效應(yīng)帶動成本降低進(jìn)一步推動科技創(chuàng)新,逐漸形成正向循環(huán),新的場景與需求不斷涌現(xiàn),最終技術(shù)紅利消退整個(gè)行業(yè)靜待下一輪技術(shù)革命的到來。
基礎(chǔ)設(shè)施層面與應(yīng)用層往往是技術(shù)紅利的最大的受益者?;A(chǔ)設(shè)施是整個(gè)技術(shù)革命的基座享受整個(gè)行業(yè)擴(kuò)容帶來的紅利;應(yīng)用層是創(chuàng)新增量主要來源,新時(shí)代的巨頭往往由新技術(shù)應(yīng)用催生而出。
英偉達(dá)(NVIDIA)是一家專注于 GPU 芯片設(shè)計(jì)的企業(yè)。公司創(chuàng)新性的提出 CUDA 架構(gòu)使 GPU 實(shí)現(xiàn)了通用計(jì)算功能,并在 AI 行業(yè)發(fā)展初期市場不看好的情況下,前瞻性預(yù)見了 GPU 在 AI 市場的應(yīng)用并全力以赴開展相關(guān)布局,從而使得公司在 2010 年代的人工智能浪潮中實(shí)現(xiàn)迅猛發(fā)展,其數(shù)據(jù)中心業(yè)務(wù)收入占比逐漸提升,成為公司重要收入來源。參照英偉達(dá)在 AI 產(chǎn)業(yè)變革中的高速發(fā)展,本輪大模型技術(shù)周期中,AI 芯片行業(yè)也將迎來重大的機(jī)遇,國產(chǎn)算力產(chǎn)業(yè)鏈中或?qū)⒂瓉砣鏅C(jī)會。
在算力需求迅猛提升的同時(shí),GPU 的市場基本被國外廠商壟斷。據(jù)據(jù)現(xiàn)有統(tǒng)計(jì)數(shù)據(jù),2020 年全球 GPU 市場規(guī)模價(jià)值 200 億美元,預(yù)計(jì) 2021 年將增長 15%,從 2015 年到2025 年平均每年增長 13%,從 80 億美元擴(kuò)大到 350 億美元。而這市場基本被英偉達(dá)、AMD、英特爾三家國外巨頭廠商壟斷。
而與此同時(shí),中美科技摩擦加劇,國產(chǎn)算力的緊迫性和重要性得以進(jìn)一步提升。美國政府為了扼制中國高新科技產(chǎn)業(yè)發(fā)展,近年來采取多種手段對中國的芯片產(chǎn)業(yè)進(jìn)行限制。2020 年 12 月 18 日,美國商務(wù)部以保護(hù)美國國家安全和外交利益為由,將中國最大的芯片制造商及其他數(shù)十家中國企業(yè)列入“實(shí)體清單”,禁止美國出口商在未獲許可證的情況下向其出售制造 10nm 及以下先進(jìn)制程芯片的設(shè)備。2022 年 8 月 10 日,拜登政府正式簽署了《2022 年芯片與科學(xué)法案》,該法案將對美國本土芯片產(chǎn)業(yè)提供約 527 億美元的巨額補(bǔ)貼,并強(qiáng)制規(guī)定獲補(bǔ)貼企業(yè)不得在中國投資或擴(kuò)建先進(jìn)制程的半導(dǎo)體工廠。
2022 年 8 月 31 日,英偉達(dá)發(fā)布公告,美國政府要求其停止向中國出口兩種用于人工智能工作的頂級計(jì)算芯片,此次管制涉及英偉達(dá) A100 和即將出貨的 H100 兩款芯片,以及英偉達(dá)未來推出的峰值性能等同或超過 A100 的其他芯片。同時(shí)被禁的還有 AMD的 MI250 人工智能芯片。2023 年 6 月 30 日,荷蘭光刻機(jī)設(shè)備公司 ASML 宣布,將遵守荷蘭相關(guān)的出口管制規(guī)定,停止向中國企業(yè)出口 NZT:2000i 系列及之后的光刻設(shè)備。
同時(shí),據(jù) CNN 報(bào)道,美國商務(wù)部正考慮進(jìn)一步收緊對華 AI 芯片的出口管制,限制英偉達(dá)等芯片廠商向中國客戶提供 A800 及 H800 芯片。由于美國的“芯片禁令”,國產(chǎn)算力芯片替代迫在眉睫?;诠?yīng)鏈安全和算力保障考慮下,我們認(rèn)為在我國算力基數(shù)設(shè)施發(fā)展過程中,自主算力芯片有望獲得更多的政策支持,尤其是涉及到國家安全的黨政軍及關(guān)鍵基數(shù)設(shè)施領(lǐng)域。因而可重點(diǎn)關(guān)注國產(chǎn)算力芯片在本輪產(chǎn)業(yè)變革中的重大投資機(jī)會。
華為昇騰:國產(chǎn)算力領(lǐng)軍,穩(wěn)中有進(jìn)
華為作為中國科技的領(lǐng)軍企業(yè),在這輪大模型產(chǎn)業(yè)浪潮中,布局完善,并在 AI 芯片領(lǐng)域有著深厚積累。雖然面對來自美國的制裁,華為仍堅(jiān)持自主研發(fā),打通了由芯片層到設(shè)備層,到云平臺,到數(shù)據(jù)層,再到大模型,并最終落地應(yīng)用的完整 AI 產(chǎn)業(yè)鏈。公司針對人工智能領(lǐng)域應(yīng)用場景,在 2018 年的華為全鏈接 2018 大會上推出了昇騰系列(HUAWEI Ascend) 芯片,主要產(chǎn)品有昇騰 310 與昇騰 910。昇騰 310 芯片是一款高能效、靈活可編程的人工智能處理器,芯片在典型配置下可以輸出 16TOPS@INT8,8TOPS@FP16,功耗僅為 8W。昇騰 310 芯片采用自研華為達(dá)芬奇架構(gòu),集成豐富的計(jì)算單元, 提高 AI 計(jì)算完備度和效率,進(jìn)而擴(kuò)展該芯片的適用性。芯片實(shí)現(xiàn)了全 AI 業(yè)務(wù)流程加速,大幅提高 AI 全系統(tǒng)的性能,有效降低部署成本。昇騰 910 是業(yè)界算力最強(qiáng)的 AI 處理器,芯片基于自研華為達(dá)芬奇架構(gòu) 3D Cube 技術(shù),實(shí)現(xiàn)業(yè)界極佳 AI 性能與能效。芯片架構(gòu)靈活伸縮,支持云邊端全棧全場景應(yīng)用。在算力方面,昇騰 910 完全達(dá)到設(shè)計(jì)規(guī)格,半精度(FP16)算力達(dá)到 320 TFLOPS,整數(shù)精度(INT8)算力達(dá)到 640TOPS,功耗 310W。據(jù)艾瑞咨詢發(fā)布的《2021 年中國人工智能芯片市場研究報(bào)告》顯示,2020 年華為昇騰 AI 芯片市場份額達(dá)到 26.3%,已經(jīng)成為中國市場份額領(lǐng)先的人工智能芯片廠商之一。
達(dá)芬奇架構(gòu)是華為自研的面向 AI 計(jì)算特征的全新計(jì)算架構(gòu),具備高算力、高能效、靈活可裁剪的特性。達(dá)芬奇架構(gòu)包含核心的 3D Cube、Vector 向量計(jì)算單元、Scalar 標(biāo)量計(jì)算單元等等多種計(jì)算單元,各自負(fù)責(zé)不同的運(yùn)算任務(wù)實(shí)現(xiàn)并行化計(jì)算模型,以實(shí)現(xiàn) AI計(jì)算的高效處理,每個(gè) AI Core 可以在一個(gè)時(shí)鐘周期內(nèi)實(shí)現(xiàn) 4096 個(gè) MAC 操作,相比傳統(tǒng)的 CPU 和 GPU 實(shí)現(xiàn)數(shù)量級的提升。由于采用可拓展設(shè)計(jì),達(dá)芬奇架構(gòu)能夠滿足端側(cè)、邊緣側(cè)及云端的應(yīng)用場景,可用于小到幾十毫瓦,大到幾百瓦的訓(xùn)練場景,橫跨全場景提供最優(yōu)算力。
2018 年,昇騰 AI 芯片一經(jīng)問世,便廣受關(guān)注,其優(yōu)秀性能令業(yè)界對昇騰的發(fā)展充滿了期待。根據(jù)華為昇騰原來的時(shí)間表,昇騰 310 和昇騰 910 僅僅是一個(gè)開始,后續(xù)將推出更多的 AI 處理器,覆蓋訓(xùn)練、MDC/DC、邊緣計(jì)算多種場景。原計(jì)劃將在 2021 年推出用于訓(xùn)練場景的昇騰 920,邊緣計(jì)算場景的昇騰 320。然而受到 2019 年開始的制裁影響,昇騰 AI 芯片的研發(fā)進(jìn)度都向后延宕,發(fā)展進(jìn)度受到巨大影響。
除了昇騰系列 AI 芯片,華為昇騰搭建了一套自主創(chuàng)新的軟硬件全棧系統(tǒng),其中包括 Atlas系列硬件及伙伴硬件、統(tǒng)一異構(gòu)計(jì)算框架 CANN、全場景 AI 框架昇思 MindSpore、昇騰應(yīng)用使能 MindX 等,并將軟件開源、硬件開發(fā)。圍繞著這一系列軟硬件系統(tǒng),昇騰打通了一條從 AI 大模型研發(fā)到應(yīng)用落地的全產(chǎn)業(yè)鏈路徑。
Atlas 系列硬件產(chǎn)品以昇騰 310 和昇騰 910AI 芯片為基礎(chǔ),通過模塊、標(biāo)卡、小站、服務(wù)器、集群等豐富的產(chǎn)品形態(tài),面向不同應(yīng)用場景(云、邊、端)的全棧解決方案,是昇騰 AI 平臺的底層核心支撐。
CANN(Compute Architecture for Neural Networks)異構(gòu)計(jì)算架構(gòu)是華為昇騰 AI 基礎(chǔ)軟硬件平臺的核心。CANN 向上支持多種 AI 計(jì)算框架,向下服務(wù) AI 處理器與編程,發(fā)揮承上啟下的關(guān)鍵作用,是提升昇騰 AI 處理器計(jì)算效率的關(guān)鍵平臺。
MindSpore 是華為自研的開源全場景 AI 計(jì)算框架。AI 框架是算法模型設(shè)計(jì)、訓(xùn)練和驗(yàn)證的一套標(biāo)準(zhǔn)接口、特性庫和工具包。MindSpore 是支持千億參數(shù)大模型訓(xùn)練的 AI 框架,并針對大模型開發(fā)時(shí)遇到的內(nèi)存占用、通信瓶頸、調(diào)試復(fù)雜、部署難等問題,進(jìn)行了技術(shù)研究與創(chuàng)新。
--- 報(bào)告摘錄結(jié)束 更多內(nèi)容請閱讀報(bào)告原文 ---
報(bào)告合集專題一覽 X 由【報(bào)告派】定期整理更新
(特別說明:本文來源于公開資料,摘錄內(nèi)容僅供參考,不構(gòu)成任何投資建議,如需使用請參閱報(bào)告原文。)
精選報(bào)告來源:報(bào)告派
科技 / 電子 / 半導(dǎo)體 /
人工智能 | Ai產(chǎn)業(yè) | Ai芯片 | 智能家居 | 智能音箱 | 智能語音 | 智能家電 | 智能照明 | 智能馬桶 | 智能終端 | 智能門鎖 | 智能手機(jī) | 可穿戴設(shè)備 |半導(dǎo)體 | 芯片產(chǎn)業(yè) | 第三代半導(dǎo)體 | 藍(lán)牙 | 晶圓 | 功率半導(dǎo)體 | 5G | GA射頻 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圓 | 封裝封測 | 顯示器 | LED | OLED | LED封裝 | LED芯片 | LED照明 | 柔性折疊屏 | 電子元器件 | 光電子 | 消費(fèi)電子 | 電子FPC | 電路板 | 集成電路 | 元宇宙 | 區(qū)塊鏈 | NFT數(shù)字藏品 | 虛擬貨幣 | 比特幣 | 數(shù)字貨幣 | 資產(chǎn)管理 | 保險(xiǎn)行業(yè) | 保險(xiǎn)科技 | 財(cái)產(chǎn)保險(xiǎn) |