英偉達(dá)GPU架構(gòu)與AMD GPU架構(gòu)的迭代升級(jí)
架構(gòu)迭代與制程升級(jí)是GPU性能的生命線
不同的微架構(gòu)設(shè)計(jì)會(huì)對(duì) GPU 的性能產(chǎn)生決定性的影響,因此保持架構(gòu)升級(jí)節(jié)奏
以及制程升級(jí)速率是保證產(chǎn)品競(jìng)爭(zhēng)力的關(guān)鍵。
英偉達(dá)GPU架構(gòu)演進(jìn)從最初Fermi架構(gòu)到最新的Ampere架構(gòu)和Hopper架
構(gòu)。每一階段都在性能和能效比方面得到提升,引入了新技術(shù),如 CUDA、GPU
Boost、RT 核心和 Tensor 核心等,在圖形渲染、科學(xué)計(jì)算和深度學(xué)習(xí)等領(lǐng)域發(fā)揮
重要作用。最新一代 Hopper 架構(gòu)在 2022 年 3 月推出,旨在加速 AI 模型訓(xùn)練,
使用 Hopper Tensor Core 進(jìn)行 FP8 和 FP16 的混合精度計(jì)算,以大幅加速
Transformer 模型的 AI 計(jì)算。與上一代相比,Hopper 還將 TF32、FP64、FP16 和
INT8 精度的每秒浮點(diǎn)運(yùn)算(FLOPS)提高了 3 倍。
圖1:NVIDIA GPU 架構(gòu)演進(jìn)歷史
AMD作為全球第二大GPU廠商,亦通過(guò)持續(xù)的架構(gòu)演進(jìn)保持其市場(chǎng)領(lǐng)先地
位。從 2010 年以來(lái),AMD 相繼推出:GCN 架構(gòu)、RDNA 架構(gòu)、RDNA 2 架
構(gòu)、RDNA 3 架構(gòu)、CDNA 架構(gòu)和 CDNA 2 架構(gòu)。最新一代面向高性能計(jì)算和人
工智能 CDNA 2 架構(gòu)于架構(gòu)采用增強(qiáng)型 Matrix Core 技術(shù),支持更廣泛的數(shù)據(jù)類
型和應(yīng)用,針對(duì)高性能計(jì)算工作負(fù)載帶來(lái)全速率雙精度和全新 FP64 矩陣運(yùn)
算?;?CDNA2 架構(gòu)的 AMD Instinct MI250X GPU FP64 雙精度運(yùn)算算力最高
可達(dá) 95.7 TFLOPs。
圖2.AMD GPU 架構(gòu)演進(jìn)歷史