散文網(wǎng) » 筆記 »全部筆記 » 軟件與服務(wù)行業(yè)報(bào)告：算力AI大潮，昇騰破浪

軟件與服務(wù)行業(yè)報(bào)告：算力AI大潮，昇騰破浪

2023-08-07 13:56 作者:報(bào)告派 0人讀過 | 我要投稿

報(bào)告出品方：長江證券

以下為報(bào)告原文節(jié)選

------

引言：大模型時(shí)代來臨，技術(shù)革命帶來產(chǎn)業(yè)重構(gòu)

ChatGPT 驚艷問世，引發(fā)全球關(guān)注，AI 大模式時(shí)代來臨。2022 年 11 月 30 日，OpenAI發(fā)布聊天機(jī)器人程序 ChatGPT（Chat Generative Pre-trained Transformer）。該程序一經(jīng)上線，用戶數(shù)量 5 天突破 100 萬人，月活數(shù)量 2 個(gè)月內(nèi)突破 1 億，成為史上用戶增長速度最快的消費(fèi)級應(yīng)用程序，引發(fā)市場對人工智能的強(qiáng)烈關(guān)注。不同于此前的任何 AI聊天機(jī)器人，ChatGPT 令人震驚的理解能力和上下文聯(lián)系能力使得人們相信人工智能正在成為現(xiàn)實(shí)。同時(shí)，ChatGPT 所具備的理解能力、推理能力、學(xué)習(xí)能力更使得人工智能幫助人類提高生產(chǎn)力。

以 ChatGPT 為代表的大語言模型需要的巨大的參數(shù)量級是其有別于之前人工智能模型的關(guān)鍵點(diǎn)。大語言模型的“涌現(xiàn)”（Emergent）現(xiàn)象是指在模型訓(xùn)練參數(shù)和數(shù)據(jù)量超過一定數(shù)值之后，模型突然出現(xiàn)了意想不到的能力，令 AI 突然變得非常智能。谷歌、DeepMind、斯坦福的 16 位專家合作的論文《Emergent Abilities of Large Language Models》（大語言模型的涌現(xiàn)能力）闡述了大模型所展現(xiàn)的神奇能力正來自于其模型參數(shù)規(guī)模。大語音模型隨著規(guī)模的增長，實(shí)現(xiàn)了性能的大幅提升。

隨著大模型的參數(shù)量級的巨大提升，算力需求也將一同被引爆。除了大語言模型的參數(shù)量級之外，數(shù)據(jù)集規(guī)模和模型訓(xùn)練時(shí)長也一同影響模型效果。OpenAI 團(tuán)隊(duì)在其發(fā)布的論文《Scaling Laws for Neural Language Models》（自然語言模型的伸縮法則）中提出了大模型遵循“伸縮法則”（scaling laws），并證明當(dāng)參數(shù)規(guī)模增加、數(shù)據(jù)集規(guī)模增加并延長模型訓(xùn)練時(shí)間，大模型的性能就會提升，并且如不受其他兩個(gè)因素制約時(shí)，大模型與每個(gè)單獨(dú)的因素都呈現(xiàn)冪律關(guān)系。因而為了提升模型性能，單單增加參數(shù)規(guī)模是不夠的，也需要延長模型訓(xùn)練時(shí)間，而這便對算力提出了需求?？梢灶A(yù)見的是，在業(yè)界紛紛加碼大模型產(chǎn)業(yè)，不斷提升參數(shù)規(guī)模的同時(shí)，大模型訓(xùn)練所需要的算力也將大大提升，進(jìn)而帶來整個(gè)產(chǎn)業(yè)的重大變革。

海量算力需求催生行業(yè)巨頭，AI 芯片行業(yè)將迎來重大發(fā)展。每一輪新應(yīng)用爆發(fā)周期都會帶動對海量底層資源的需求，海量需求帶動底層變革降低 IT 成本反哺新應(yīng)用創(chuàng)新形成正向循環(huán)直至到了閾值?；ヂ?lián)網(wǎng)發(fā)展至今主要經(jīng)歷了 PC 互聯(lián)網(wǎng)以及移動互聯(lián)網(wǎng)兩次互聯(lián)網(wǎng)革命，未來隨著生成式人工智能的不斷發(fā)展有望催生新的技術(shù)變革。從歷史上看過往每一輪技術(shù)變革都將帶來新一輪的 IT 技術(shù)紅利釋放，進(jìn)而帶動 IT 產(chǎn)業(yè)進(jìn)入新一輪創(chuàng)新周期誕生出新的巨頭。
過往每一輪技術(shù)革命在帶動 IT 產(chǎn)業(yè)全面擴(kuò)容的同時(shí)，催生新一輪創(chuàng)新誕生出新的巨頭。PC 互聯(lián)網(wǎng)（互聯(lián)網(wǎng) 1.0）：80 年代中期現(xiàn)代 Internet 的前身 NSFNET 的廣域網(wǎng)建立，正式開啟 PC 互聯(lián)網(wǎng)時(shí)代。PC 互聯(lián)網(wǎng)解決人與人，人與內(nèi)容的鏈接，催生出消費(fèi)互聯(lián)網(wǎng)創(chuàng)新周期，誕生出英特爾、微軟、亞馬遜、阿里巴巴等一批巨頭。
移動互聯(lián)網(wǎng)（互聯(lián)網(wǎng) 2.0）：2007 年以第一代 iPhone 發(fā)布為標(biāo)志，移動互聯(lián)網(wǎng)革命逐漸開啟，移動互聯(lián)網(wǎng)在進(jìn)一步擴(kuò)大鏈接數(shù)量的同時(shí)，增強(qiáng)了互動屬性，催生出移動應(yīng)用創(chuàng)新周期，誕生出亞馬遜、蘋果、Google 頭條、FaceBook 等巨頭。
AIGC（互聯(lián)網(wǎng) 3.0）：2022 年 ChatGPT 提供新一代人工智能問答服務(wù)，有望帶動新一輪創(chuàng)新周期開啟，現(xiàn)階段 AIGC 發(fā)展還處于雛形階段，未來誰是 AIGC 時(shí)代技術(shù)紅利的最大受益者還有待觀察。

擴(kuò)容與創(chuàng)新是每一輪互聯(lián)網(wǎng)革命的共性。每一輪技術(shù)革命都伴隨基礎(chǔ)設(shè)施層的變革，隨著基礎(chǔ)設(shè)施層核心要素完備創(chuàng)新周期逐漸開啟，新興需求與場景不斷發(fā)展帶動對基礎(chǔ)設(shè)施資源的需求，底層資源規(guī)模效應(yīng)帶動成本降低進(jìn)一步推動科技創(chuàng)新，逐漸形成正向循環(huán)，新的場景與需求不斷涌現(xiàn)，最終技術(shù)紅利消退整個(gè)行業(yè)靜待下一輪技術(shù)革命的到來。
基礎(chǔ)設(shè)施層面與應(yīng)用層往往是技術(shù)紅利的最大的受益者?；A(chǔ)設(shè)施是整個(gè)技術(shù)革命的基座享受整個(gè)行業(yè)擴(kuò)容帶來的紅利；應(yīng)用層是創(chuàng)新增量主要來源，新時(shí)代的巨頭往往由新技術(shù)應(yīng)用催生而出。

英偉達(dá)（NVIDIA）是一家專注于 GPU 芯片設(shè)計(jì)的企業(yè)。公司創(chuàng)新性的提出 CUDA 架構(gòu)使 GPU 實(shí)現(xiàn)了通用計(jì)算功能，并在 AI 行業(yè)發(fā)展初期市場不看好的情況下，前瞻性預(yù)見了 GPU 在 AI 市場的應(yīng)用并全力以赴開展相關(guān)布局，從而使得公司在 2010 年代的人工智能浪潮中實(shí)現(xiàn)迅猛發(fā)展，其數(shù)據(jù)中心業(yè)務(wù)收入占比逐漸提升，成為公司重要收入來源。參照英偉達(dá)在 AI 產(chǎn)業(yè)變革中的高速發(fā)展，本輪大模型技術(shù)周期中，AI 芯片行業(yè)也將迎來重大的機(jī)遇，國產(chǎn)算力產(chǎn)業(yè)鏈中或?qū)⒂瓉砣鏅C(jī)會。

在算力需求迅猛提升的同時(shí)，GPU 的市場基本被國外廠商壟斷。據(jù)據(jù)現(xiàn)有統(tǒng)計(jì)數(shù)據(jù)，2020 年全球 GPU 市場規(guī)模價(jià)值 200 億美元，預(yù)計(jì) 2021 年將增長 15%，從 2015 年到2025 年平均每年增長 13%，從 80 億美元擴(kuò)大到 350 億美元。而這市場基本被英偉達(dá)、AMD、英特爾三家國外巨頭廠商壟斷。

而與此同時(shí)，中美科技摩擦加劇，國產(chǎn)算力的緊迫性和重要性得以進(jìn)一步提升。美國政府為了扼制中國高新科技產(chǎn)業(yè)發(fā)展，近年來采取多種手段對中國的芯片產(chǎn)業(yè)進(jìn)行限制。2020 年 12 月 18 日，美國商務(wù)部以保護(hù)美國國家安全和外交利益為由，將中國最大的芯片制造商及其他數(shù)十家中國企業(yè)列入“實(shí)體清單”，禁止美國出口商在未獲許可證的情況下向其出售制造 10nm 及以下先進(jìn)制程芯片的設(shè)備。2022 年 8 月 10 日，拜登政府正式簽署了《2022 年芯片與科學(xué)法案》，該法案將對美國本土芯片產(chǎn)業(yè)提供約 527 億美元的巨額補(bǔ)貼，并強(qiáng)制規(guī)定獲補(bǔ)貼企業(yè)不得在中國投資或擴(kuò)建先進(jìn)制程的半導(dǎo)體工廠。
2022 年 8 月 31 日，英偉達(dá)發(fā)布公告，美國政府要求其停止向中國出口兩種用于人工智能工作的頂級計(jì)算芯片，此次管制涉及英偉達(dá) A100 和即將出貨的 H100 兩款芯片，以及英偉達(dá)未來推出的峰值性能等同或超過 A100 的其他芯片。同時(shí)被禁的還有 AMD的 MI250 人工智能芯片。2023 年 6 月 30 日，荷蘭光刻機(jī)設(shè)備公司 ASML 宣布，將遵守荷蘭相關(guān)的出口管制規(guī)定，停止向中國企業(yè)出口 NZT：2000i 系列及之后的光刻設(shè)備。
同時(shí)，據(jù) CNN 報(bào)道，美國商務(wù)部正考慮進(jìn)一步收緊對華 AI 芯片的出口管制，限制英偉達(dá)等芯片廠商向中國客戶提供 A800 及 H800 芯片。由于美國的“芯片禁令”，國產(chǎn)算力芯片替代迫在眉睫?；诠?yīng)鏈安全和算力保障考慮下，我們認(rèn)為在我國算力基數(shù)設(shè)施發(fā)展過程中，自主算力芯片有望獲得更多的政策支持，尤其是涉及到國家安全的黨政軍及關(guān)鍵基數(shù)設(shè)施領(lǐng)域。因而可重點(diǎn)關(guān)注國產(chǎn)算力芯片在本輪產(chǎn)業(yè)變革中的重大投資機(jī)會。
華為昇騰：國產(chǎn)算力領(lǐng)軍，穩(wěn)中有進(jìn)

華為作為中國科技的領(lǐng)軍企業(yè)，在這輪大模型產(chǎn)業(yè)浪潮中，布局完善，并在 AI 芯片領(lǐng)域有著深厚積累。雖然面對來自美國的制裁，華為仍堅(jiān)持自主研發(fā)，打通了由芯片層到設(shè)備層，到云平臺，到數(shù)據(jù)層，再到大模型，并最終落地應(yīng)用的完整 AI 產(chǎn)業(yè)鏈。公司針對人工智能領(lǐng)域應(yīng)用場景，在 2018 年的華為全鏈接 2018 大會上推出了昇騰系列（HUAWEI Ascend) 芯片，主要產(chǎn)品有昇騰 310 與昇騰 910。昇騰 310 芯片是一款高能效、靈活可編程的人工智能處理器，芯片在典型配置下可以輸出 16TOPS@INT8,8TOPS@FP16，功耗僅為 8W。昇騰 310 芯片采用自研華為達(dá)芬奇架構(gòu)，集成豐富的計(jì)算單元, 提高 AI 計(jì)算完備度和效率，進(jìn)而擴(kuò)展該芯片的適用性。芯片實(shí)現(xiàn)了全 AI 業(yè)務(wù)流程加速,大幅提高 AI 全系統(tǒng)的性能，有效降低部署成本。昇騰 910 是業(yè)界算力最強(qiáng)的 AI 處理器，芯片基于自研華為達(dá)芬奇架構(gòu) 3D Cube 技術(shù)，實(shí)現(xiàn)業(yè)界極佳 AI 性能與能效。芯片架構(gòu)靈活伸縮，支持云邊端全棧全場景應(yīng)用。在算力方面，昇騰 910 完全達(dá)到設(shè)計(jì)規(guī)格，半精度（FP16）算力達(dá)到 320 TFLOPS，整數(shù)精度（INT8）算力達(dá)到 640TOPS，功耗 310W。據(jù)艾瑞咨詢發(fā)布的《2021 年中國人工智能芯片市場研究報(bào)告》顯示，2020 年華為昇騰 AI 芯片市場份額達(dá)到 26.3%，已經(jīng)成為中國市場份額領(lǐng)先的人工智能芯片廠商之一。

達(dá)芬奇架構(gòu)是華為自研的面向 AI 計(jì)算特征的全新計(jì)算架構(gòu)，具備高算力、高能效、靈活可裁剪的特性。達(dá)芬奇架構(gòu)包含核心的 3D Cube、Vector 向量計(jì)算單元、Scalar 標(biāo)量計(jì)算單元等等多種計(jì)算單元，各自負(fù)責(zé)不同的運(yùn)算任務(wù)實(shí)現(xiàn)并行化計(jì)算模型，以實(shí)現(xiàn) AI計(jì)算的高效處理，每個(gè) AI Core 可以在一個(gè)時(shí)鐘周期內(nèi)實(shí)現(xiàn) 4096 個(gè) MAC 操作，相比傳統(tǒng)的 CPU 和 GPU 實(shí)現(xiàn)數(shù)量級的提升。由于采用可拓展設(shè)計(jì)，達(dá)芬奇架構(gòu)能夠滿足端側(cè)、邊緣側(cè)及云端的應(yīng)用場景，可用于小到幾十毫瓦，大到幾百瓦的訓(xùn)練場景，橫跨全場景提供最優(yōu)算力。

2018 年，昇騰 AI 芯片一經(jīng)問世，便廣受關(guān)注，其優(yōu)秀性能令業(yè)界對昇騰的發(fā)展充滿了期待。根據(jù)華為昇騰原來的時(shí)間表，昇騰 310 和昇騰 910 僅僅是一個(gè)開始，后續(xù)將推出更多的 AI 處理器，覆蓋訓(xùn)練、MDC/DC、邊緣計(jì)算多種場景。原計(jì)劃將在 2021 年推出用于訓(xùn)練場景的昇騰 920，邊緣計(jì)算場景的昇騰 320。然而受到 2019 年開始的制裁影響，昇騰 AI 芯片的研發(fā)進(jìn)度都向后延宕，發(fā)展進(jìn)度受到巨大影響。

除了昇騰系列 AI 芯片，華為昇騰搭建了一套自主創(chuàng)新的軟硬件全棧系統(tǒng)，其中包括 Atlas系列硬件及伙伴硬件、統(tǒng)一異構(gòu)計(jì)算框架 CANN、全場景 AI 框架昇思 MindSpore、昇騰應(yīng)用使能 MindX 等，并將軟件開源、硬件開發(fā)。圍繞著這一系列軟硬件系統(tǒng)，昇騰打通了一條從 AI 大模型研發(fā)到應(yīng)用落地的全產(chǎn)業(yè)鏈路徑。

Atlas 系列硬件產(chǎn)品以昇騰 310 和昇騰 910AI 芯片為基礎(chǔ)，通過模塊、標(biāo)卡、小站、服務(wù)器、集群等豐富的產(chǎn)品形態(tài)，面向不同應(yīng)用場景（云、邊、端）的全棧解決方案，是昇騰 AI 平臺的底層核心支撐。

CANN（Compute Architecture for Neural Networks）異構(gòu)計(jì)算架構(gòu)是華為昇騰 AI 基礎(chǔ)軟硬件平臺的核心。CANN 向上支持多種 AI 計(jì)算框架，向下服務(wù) AI 處理器與編程，發(fā)揮承上啟下的關(guān)鍵作用，是提升昇騰 AI 處理器計(jì)算效率的關(guān)鍵平臺。
MindSpore 是華為自研的開源全場景 AI 計(jì)算框架。AI 框架是算法模型設(shè)計(jì)、訓(xùn)練和驗(yàn)證的一套標(biāo)準(zhǔn)接口、特性庫和工具包。MindSpore 是支持千億參數(shù)大模型訓(xùn)練的 AI 框架，并針對大模型開發(fā)時(shí)遇到的內(nèi)存占用、通信瓶頸、調(diào)試復(fù)雜、部署難等問題，進(jìn)行了技術(shù)研究與創(chuàng)新。

--- 報(bào)告摘錄結(jié)束更多內(nèi)容請閱讀報(bào)告原文 ---

報(bào)告合集專題一覽 X 由【報(bào)告派】定期整理更新

（特別說明：本文來源于公開資料，摘錄內(nèi)容僅供參考，不構(gòu)成任何投資建議，如需使用請參閱報(bào)告原文。）

精選報(bào)告來源：報(bào)告派

科技 / 電子 / 半導(dǎo)體 /

標(biāo)簽：行業(yè)報(bào)告行研報(bào)告