Ampere架構(gòu)Geforce顯示核心詳細(xì)預(yù)測(cè),看完你就可以假裝英偉達(dá)內(nèi)部人員了

????????從2019年中開(kāi)始,有關(guān)Nvdia下一代Ampere架構(gòu)顯示核心的消息就越來(lái)越多了。隨著三月底GTC大會(huì)的臨近,相關(guān)的消息在增加,關(guān)于Ampere各顯示核心的細(xì)節(jié)也漸漸明確。
????????之前爆出的消息最主要的還是關(guān)于Tesla或Quadro計(jì)算卡的,而黃仁勛在GTC2020大會(huì)上發(fā)布的新卡似乎也不會(huì)是玩家們關(guān)心的Geforce系列。不過(guò)最近外媒發(fā)布了一些關(guān)于Geforce端新核心的信息(見(jiàn)下圖),雖然只是關(guān)于沒(méi)有被刀法動(dòng)過(guò)的完整核心的而不是顯卡,但仍令人興奮。

?????????外媒的報(bào)道中的CUDA數(shù)字,我個(gè)人認(rèn)為最為可信的是GA102的CUDA數(shù)量為5376這一點(diǎn)。符合Nvidia最近幾代Geforce系列完整核心的發(fā)展規(guī)律。而關(guān)于GA103的3840這一數(shù)字并不正常,更像是直接照搬一月份一外國(guó)博主發(fā)布的很可能不真實(shí)的“小道消息”。原因在后面我會(huì)解釋。
????????當(dāng)然,up主寫下這篇專欄的目的并不是介紹新聞,而是對(duì)于這篇爆料的分析以及我個(gè)人對(duì)下代Geforce顯示核心預(yù)測(cè)。
欲要知來(lái)者,必先解古人
????????????在對(duì)即將到來(lái)的新RTX顯卡進(jìn)行合理的預(yù)測(cè)之前,了解前幾代Geforce核心架構(gòu)的發(fā)展分析是必要的。

? ????????這三代大核心的CUDA數(shù)量看起來(lái)沒(méi)有什么規(guī)律可言是因?yàn)檫@三者都不是完整核心,實(shí)際上三代的完整核心GM200擁有3072個(gè)CUDA,GP102擁有3840個(gè),Tu102擁有4608個(gè),這三個(gè)數(shù)字形成了一個(gè)等差數(shù)列,公差為768,也就是每一代較上一代增加768個(gè)。
????????但是為什么增加每一代都增加768個(gè)呢?這就和Nvidia的模塊化GPU設(shè)計(jì)方式有關(guān)了。
????????對(duì)于每一代Fermi架構(gòu)之后的Nvdia?SP(流處理器)GPU,Nvida都采用了從CUDA(流處理器)核心-SM(多流處理器)單元-TPC(紋理處理器簇)-GPC(圖形處理器簇)到GPU核心的多級(jí)模塊化組合的方式。
????????以Turing架構(gòu)為例,具體為:一個(gè)SM單元包含64個(gè)CUDA核心,8個(gè)Tensor?Core張量核心,1個(gè)RT?Core光追核心以及對(duì)應(yīng)的緩存等。SM單元是事實(shí)上GPU的基本計(jì)算單元,每一個(gè)Turing架構(gòu)的顯示核心都是由很多個(gè)如圖的SM單元組成的。

????????? ? 一個(gè)TPC包含兩個(gè)SM單元,一個(gè)GPC包含六個(gè)TPC單元,一個(gè)TU102核心包含六個(gè)GPC。所以完整的Tu102核心包含的72個(gè)SM單元,也就是4608個(gè)CUDA,576個(gè)張量核心和72個(gè)光追核心。

????????然而老黃用精準(zhǔn)的刀法屏蔽了兩個(gè)TPC,所以市售的RTX2080Ti使用的Tu102-300核心擁有68個(gè)SM單元,也就是4352個(gè)CUDA核心,544個(gè)張量核心和68個(gè)光追核心。
??? ????如果翻出更早的Pascal架構(gòu)的GP102核心和GM200核心,就可以發(fā)現(xiàn)它們最大的不同就在于每一個(gè)GPC擁有的TPC數(shù)量上。GM200的一個(gè)GPC有4個(gè),GP102有5個(gè)再算上Tu102有6個(gè),又是一個(gè)等差數(shù)列。(下圖中的GP100核心是GP102核心的計(jì)算卡版本,供給TeslaP100使用,除每一個(gè)CUDA中增加了一個(gè)FP64核心以外設(shè)計(jì)區(qū)別不大)


????????很明顯,每一代大核心都有6個(gè)GPC,但GPC內(nèi)TPC數(shù)量遞增,也就是每代每GPC較上一代增加128個(gè)CUDA,共計(jì)增加768個(gè)。
預(yù)知未來(lái)!
????????關(guān)于Ampere架構(gòu)的新Geforce大核心,按照上面的結(jié)論,每個(gè)GPC含有的TPC應(yīng)為7個(gè),所以GA102應(yīng)有42個(gè)TPC,也就是84個(gè)SM單元,換算成各核心數(shù)量為5376的CUDA,672個(gè)張量核心,84個(gè)光追核心。當(dāng)然,為了提高良品率,Nvidia對(duì)于Geforce系列大核心向來(lái)是要?jiǎng)拥兜?,慣例是兩個(gè)TPC,到了RTX3080Ti手里就剩下5120個(gè)CUDA了(這個(gè)數(shù)字真的順眼)。
????????而對(duì)于次旗艦核心(GA103?),由于一個(gè)GPC含7個(gè)TPC,該核心的CUDA數(shù)只可能為896的倍數(shù),無(wú)論如何也湊不出3840這個(gè)數(shù)字。一般而言次旗艦核心應(yīng)是旗艦的三分之二,也就是4個(gè)GPC,所以這一代的次旗艦完整核心可能有3584個(gè),當(dāng)然如果進(jìn)行屏蔽,對(duì)于RTX3080,諸如3456,3328這樣的數(shù)字也是可能出現(xiàn)的。
??? ????高端甜品級(jí)核心(GA104?)一般是旗艦核心的一半,也就是3個(gè)GPC,完整核心CUDA數(shù)量為2688個(gè),屏蔽后可能為2560等。

???

??????? 竟然最多只能寫2000字!還有好多沒(méi)說(shuō)啊...
????????只有新人up會(huì)這么不怕死,做這種搞不好就脫靶的預(yù)測(cè),你看我預(yù)測(cè)也寫了三個(gè)核心,所以......
????????硬幣可以不投,贊點(diǎn)一下嘛,還有關(guān)注,以后會(huì)寫更多有意思的東西的。