GPU分類(lèi)
一、按接入方式劃分
GPU根據(jù)接入方式可以分為獨(dú)立GPU和集成GPU。獨(dú)立GPU一般是封裝在獨(dú)立的顯卡電路上,擁有獨(dú)立顯存,而集成GPU和CPU共用一個(gè)Die,共享系統(tǒng)內(nèi)存。

服務(wù)器GPU可做專(zhuān)業(yè)圖形處理、計(jì)算加速、深度學(xué)習(xí)等應(yīng)用,根據(jù)云計(jì)算、人工智能等一系列技術(shù)的發(fā)展,服務(wù)器GPU將以獨(dú)立GPU為主。

?獨(dú)立GPU
大部分封裝于獨(dú)立顯卡電路上,使用Pcie接口和特定顯存,性能相對(duì)更好,渲染畫(huà)質(zhì)更佳,主要用于游戲、高性能計(jì)算等中高端領(lǐng)域。主要的廠商包括AMD(Radeon系列)、NVIDIA(Geforce系列)。
集成GPU
集成GPU集成在主板上,通常未擁有獨(dú)立顯存,它于CPU共同使用Die和系統(tǒng)內(nèi)存,能夠節(jié)省空間占位和制作難度,價(jià)格比較低,兼容性更好,并且供電量少,主要用于辦公室等終端領(lǐng)域。主要的廠商包括intel(HD系列)、AMD(APU系列)。

?二、應(yīng)用端劃分
GPU按照應(yīng)用端可以劃分為PC GPU、服務(wù)器GPU、移動(dòng)GPU。
PC端
集成GPU主要運(yùn)用于提高輕辦公效率,對(duì)性能要求低;獨(dú)立GU主要運(yùn)用于圖形設(shè)計(jì)、提高圖片制作清晰度以及3A游戲繪圖渲染能力,對(duì)性能要求比較高。在輕度辦公場(chǎng)景下會(huì)優(yōu)先考慮集成GPU,提高效能;在重度辦公場(chǎng)景下會(huì)優(yōu)先考慮獨(dú)立GPU,保證性能輸出。

?服務(wù)器端
服務(wù)器GPU主要進(jìn)行可視化處理、AI訓(xùn)練、AI推斷的深度學(xué)習(xí)等應(yīng)用,根據(jù)云計(jì)算、人工智能等一系列技術(shù)的發(fā)展,服務(wù)器GPU以獨(dú)立GPU為主
移動(dòng)端
移動(dòng)GPU由于專(zhuān)注輕薄,內(nèi)部空間緊湊,所以一般采用集成GPU.提高游戲體驗(yàn)、提升游戲體驗(yàn)、提升游戲處理性能,應(yīng)用場(chǎng)景包括AR、桌面、云計(jì)算、數(shù)據(jù)中心等。
?

三、影響GPU性能的因素
性能是衡量GPU運(yùn)行、執(zhí)行命令高效的指標(biāo)。在評(píng)估GPU性能的指標(biāo)中,微架構(gòu)、制程、流處理器數(shù)量和核心頻率對(duì)GPU性能影響較大。GPU的微架構(gòu)、制程、顯存容量/位寬/帶寬/頻率、核心頻率等各類(lèi)性能參數(shù)及重要性程度,可以通過(guò)“核心數(shù)核心頻率2”公式進(jìn)行量化,并可利用3DMark、MLPerf等軟件進(jìn)行相關(guān)性能測(cè)試評(píng)估。

圖5:來(lái)源于CSDN,中信證券研究所
微架構(gòu)、制程、核心頻率
微架構(gòu):又稱(chēng)為微處理器體系結(jié)構(gòu),是硬件電路結(jié)構(gòu),用以實(shí)現(xiàn)指令執(zhí)行。
制程:指GPU集成電路的密集度。在晶體管硬件數(shù)量一定的情況下,更精細(xì)的制程能夠減少功耗和發(fā)熱。
核心頻率:代表了GPU顯示核心處理圖形頻率的大小,能夠反應(yīng)顯示核心的性能。

圖形處理單元數(shù)量、CUDA核心數(shù)、Tensor核心
圖形處理器單元數(shù)量
指GPU內(nèi)部圖形處理單元,涵蓋光柵單元(ROP)和紋理單元(TMU)等數(shù)量。?

CUDA核心數(shù)
GPU內(nèi)部的流處理器,是主要的計(jì)算單元,CUDA的核心數(shù)量越大越好。4090的核心數(shù)為16384,而4080的核心數(shù)才是9728。
?

Tensor核心
Tensor Core(張量計(jì)算核心)是由NVIDIA研發(fā)的新型處理核心,Tensor Core(張量計(jì)算核心)可實(shí)現(xiàn)混合精度計(jì)算,并能根據(jù)精度的降低動(dòng)態(tài)調(diào)整算力,在保持準(zhǔn)確性的同時(shí)提高吞吐量。
?

圖8:來(lái)源于NVIDIA官網(wǎng)
顯存容量、顯存位寬、顯存頻率、顯存帶寬
顯存容量:顯存容量是顯卡上顯存的容量數(shù),顯存容量決定著顯存臨時(shí)存儲(chǔ)數(shù)據(jù)的多少顯存容量的大小決定著顯存臨時(shí)存儲(chǔ)數(shù)據(jù)的能力
顯存位寬:是指GPU在單位時(shí)鐘周期內(nèi)傳送數(shù)據(jù)的最大位數(shù),市場(chǎng)上的常見(jiàn)顯存位寬有128位、192位、256位、384位、512位和1024位六種,人們習(xí)慣上叫的128位、256位顯卡、384位顯卡、512位顯卡和1024位顯卡就是指其相應(yīng)的顯存位寬。顯存位寬越高,性能越好價(jià)格也就越高。
顯存頻率:顯存在顯卡上工作時(shí)的頻率。存頻率一定程度上反應(yīng)著該顯存的速度。
顯存帶寬:是指顯示芯片與顯存之間的數(shù)據(jù)傳輸速率,它以字節(jié)/秒為單位。顯存帶寬是決定顯卡性能。

看完別忘記一鍵三連!?