思騰云計算
算力是實現(xiàn)AI產(chǎn)業(yè)化的核心力量,它的發(fā)展將對人工智能技術(shù)的進步和行業(yè)應(yīng)用起到?jīng)Q定性的作用。隨著人工智能向多場景化、規(guī)?;?、融合化等高應(yīng)用階段方向發(fā)展,數(shù)據(jù)體量呈現(xiàn)出急劇增長態(tài)勢,算法模型的參數(shù)量呈指數(shù)級增加,以加速計算為核心的算力中心規(guī)模將不斷擴大。
大模型的發(fā)展同樣給算力帶來巨大的挑戰(zhàn)。大模型訓(xùn)練的計算和存儲資源開銷之大,對加速計算系統(tǒng)和人工智能軟件棧都有很高的要求,訓(xùn)練千億、萬億模型動輒需要上千塊加速卡,對大模型的推廣和普惠帶來了很大的挑戰(zhàn)。參數(shù)量與算力需求呈正比,據(jù)ARK Invest預(yù)測,GPT-4參數(shù)量最高達15000億個,則GPT-4算力需求最高可達31271 PFlop/s-day。
同時,受限于邊際遞減效應(yīng),模型復(fù)雜度與精度的進一步提升將會需要更大比例的計算資源開銷,對計算效率問題的顧慮會限制大模型參數(shù)規(guī)模的持續(xù)擴張。將GPT-4的推算結(jié)果作為訓(xùn)練需求,進一步推算2023/2025年推理需求最高達44081/48502 PFlop/s-day,每年頭部訓(xùn)練模型所需算力增長幅度高達10倍,遠超摩爾定律的增長速度。
國內(nèi)外廠商加速布局大模型,其參數(shù)量均達到千億級別,同步帶動算力需求爆發(fā)式增長,有望進一步推動AI服務(wù)器市場的增長。AI服務(wù)器專為人工智能訓(xùn)練和推理應(yīng)用而設(shè)計,采用異構(gòu)形式,通過加入GPU采用并行計算模式,解決CPU提供算力時核心數(shù)已接近極限的問題,可應(yīng)用處理密集型運算。AI大算力的高需求將提升服務(wù)器性能,AI服務(wù)器需搭載多個CPU和GPU處理器,同時服務(wù)器CPU性能不斷升級,要求內(nèi)存技術(shù)同步升級。
伴隨技術(shù)進步對于人工智能在企業(yè)市場中的應(yīng)用與落地帶來促進作用,用于支撐應(yīng)用的智算力已成為未來創(chuàng)新的核心保障。算力是數(shù)字經(jīng)濟時代的核心生產(chǎn)力,以人工智能為首的新興技術(shù)應(yīng)用在數(shù)字經(jīng)濟發(fā)展中起到了重要的作用,用于支撐人工智能應(yīng)用的智算力決定了創(chuàng)新力的實現(xiàn)。不管是新型場景還是成熟場景,對算力都提出了極大的挑戰(zhàn),率先布局智算力的企業(yè)將在未來競爭中獲得優(yōu)勢。
參考文獻:《大模型算力需求驅(qū)動AI服務(wù)器行業(yè)高景氣—— AI服務(wù)器行業(yè)報告》《2022-2023 中國人工智能計算力發(fā)展評估報告》《2022中國大模型發(fā)展白皮書?元能力引擎筑基智能底座》《深度研報:揭秘ChatGPT身后的AIGC技術(shù)和它的中國同行們》
