【知乎】簡(jiǎn)評(píng)AMD的GPU膠水設(shè)計(jì)天花板RDNA4

簡(jiǎn)評(píng)AMD的GPU膠水設(shè)計(jì)天花板RDNA4

MebiuW

關(guān)注他
AMD的RDNA系列GPU架構(gòu)在經(jīng)歷了令人充滿信心的RDNA1和RDNA2時(shí)代后,從RDNA3開(kāi)始卻陷入了一個(gè)極為尷尬的境地。RDNA3的性能和價(jià)格表現(xiàn)都沒(méi)有令人矚目的亮點(diǎn),更不幸的是,據(jù)傳下一代RDNA4也一直存在問(wèn)題,導(dǎo)致AMD的高端Navi 41和Navi 42的設(shè)計(jì)被取消,僅保留了中低端的Navi 43和Navi 44。這意味著RDNA4的最高端型號(hào)只能是類似于Radeon RX 7600這樣定位的芯片,讓人不僅有些憐惜。
作為鍵盤(pán)黨,我們無(wú)法確定目前AMD的RDNA4是否真的出了問(wèn)題,以及具體出了什么問(wèn)題,只能從入魔中窺探猜測(cè)一二。從最近泄露的RDNA4激進(jìn)的膠水設(shè)計(jì)模式來(lái)看,個(gè)人猜測(cè)這可能是導(dǎo)致RDNA4“問(wèn)題不斷”的原因。值得注意的是,從RDNA3時(shí)代開(kāi)始,AMD就采用了高端Navi 31和Navi 32芯片的Chiplets化設(shè)計(jì),但中低端Navi 33芯片保持了單一芯片設(shè)計(jì)。因此Navi 43和44的可能也保留單一芯片設(shè)計(jì)沒(méi)有膠水設(shè)計(jì),所以是他們沒(méi)被取消的原因。當(dāng)然,這些僅僅是個(gè)人的猜測(cè),歡迎大家理性評(píng)論和討論。
AMD是對(duì)于芯片膠水技術(shù)(Chiplets)最為熱衷的廠商之一。在CPU部分,AMD從Zen誕生之初就實(shí)行了膠水化戰(zhàn)略,并在Zen 2時(shí)期全面采用了膠水化架構(gòu),一直沿用至最新的Zen 4。然而,盡管AMD早早就在CPU上實(shí)行了膠水化戰(zhàn)略,但在自家的顯卡部分卻沒(méi)有全面采用。這是因?yàn)镃PU和GPU在架構(gòu)上存在差異,GPU需要處理大量高度并行計(jì)算任務(wù),導(dǎo)致數(shù)據(jù)傳輸量明顯高于CPU。AMD在CPU上采用的是傳統(tǒng)的2D MCM技術(shù),傳輸密度低且功耗大,難以滿足高端GPU的需求。要滿足高端GPU的需求,則必須采用硅中介、2.5D封裝或3D封裝等技術(shù),這對(duì)成本和封裝技術(shù)都有極高的要求。
隨著封裝技術(shù)的進(jìn)步和成本的降低,AMD在CDNA2時(shí)代引入了膠水技術(shù)。MI250X MCM膠水了兩個(gè)核心,并通過(guò)Die2Die的Infinity Fabric進(jìn)行連接。雖然400GB/s的互聯(lián)速度看起來(lái)很高,但是相對(duì)于CDNA2本身的規(guī)模,帶寬仍然難以實(shí)現(xiàn)真正的膠水,因?yàn)檫@個(gè)400GB/s只是一顆HBM2E的帶寬。因此,在物理上,MI250X是兩個(gè)膠水的設(shè)計(jì),在使用上也是兩個(gè)獨(dú)立的GPU,只是比通過(guò)PCIe或其他總線連接的兩個(gè)GPU通信更快。
最新的RDNA3架構(gòu)是AMD在膠水CPU方面的另一個(gè)努力。與CDNA2不同,RDNA3的膠水設(shè)計(jì)只有一個(gè)GCD,而主要膠水部分是將顯存控制器和Infinity Cache外置膠水化。通過(guò)采用高性能的扇出設(shè)計(jì),帶寬密度比CPU膠水高10倍。因此,在AMD RDNA3中,GCD和MCD的總帶寬達(dá)到了5.3TB/s,遠(yuǎn)高于CDNA2的400GB/s。這是AMD的第一款物理上是膠水的,但在邏輯上是整體的GPU芯片。
然而,RDNA3膠水化的主要驅(qū)動(dòng)因素是先進(jìn)工藝的成本過(guò)高和SRAM/IO電路上微縮的瓶頸。AMD仍未實(shí)現(xiàn)計(jì)算核心部分的膠水。在RDNA3中,計(jì)算核心必須獨(dú)立且完整地放在一個(gè)芯片上。
Intel的Xe HPC GPU,Ponte Vecchio (PVC),是真正實(shí)現(xiàn)計(jì)算核心膠水化的GPU。PVC通過(guò)大量的3D和2.5D互聯(lián)技術(shù)將計(jì)算核心膠水在一起。因此,在過(guò)去的一段時(shí)間里,我一直將Intel的Ponte Vecchio稱為GPU膠水的天花板。
現(xiàn)在,我們談?wù)勛钚滦孤兜腞DNA4,我們可以發(fā)現(xiàn)RDNA4的膠水設(shè)計(jì)也實(shí)現(xiàn)了類似于Intel Ponte Vecchio的計(jì)算核心膠水化。具體來(lái)說(shuō),在RDNA4里有三部分膠水,第一部分是計(jì)算核心的膠水部分,叫做Shader Engine Die (SED)。第二部分是RDNA4的靈魂所在的Base Active Interposer Die (AID) Die。AID最高可以通過(guò)3D封裝技術(shù)承載3顆SED核心,并且AID和AID之間可以通過(guò)2.5D封裝技術(shù)實(shí)現(xiàn)橫向的拓展。因此,在示意圖中,這個(gè)RDNA4總共實(shí)現(xiàn)了3AID*3SED的設(shè)計(jì),也就是最高可將9顆SED核心有機(jī)地膠水在一起。最后一個(gè)核心是一個(gè)MID,主要是一些多媒體單源和PCIe控制器,避免了SED重復(fù)加載這些單元的設(shè)計(jì)。
相比于Intel的Ponte Vecchio,AMD的RDNA4有一個(gè)更為高級(jí)的地方在于這個(gè)AID核心本身還有Infinity Cache和顯存控制器。因此,這里AID到SED的3D封裝很可能是采用了目前最領(lǐng)先的3D封裝技術(shù)SoIC所實(shí)現(xiàn)的。Intel的Ponte Vecchio雖然也是采用了3D封裝技術(shù)進(jìn)行計(jì)算核心的互聯(lián),但受限于Intel 3D封裝所用的技術(shù)限制,它的Base Die除了互聯(lián)以外基本上沒(méi)有其他用處,不像AMD的AID承載了很多功能。
這里多說(shuō)一嘴,如果單單看AID和MID的設(shè)計(jì),RDNA4的模式有點(diǎn)像Intel下一代Xeon處理器Granite Rapids的膠水設(shè)計(jì)。
綜上所述,AMD的RDNA4膠水設(shè)計(jì)比我之前稱之為天花板的Intel Ponte Vecchio還要強(qiáng)。這個(gè)膠水設(shè)計(jì)非常完美,充分地利用了高級(jí)2.5D和3D封裝的潛能,算是Chiplets設(shè)計(jì)的又一個(gè)天花板。AMD只需要設(shè)計(jì)一個(gè)AID、一個(gè)SED和一個(gè)MID,就能膠水組合出非常多的高性能GPU。這個(gè)設(shè)計(jì)非常美滋滋。
最后,讓我們?cè)倩氐綖槭裁碦DNA4“問(wèn)題不斷”的話題。就像Intel的Ponte Vecchio一樣,RDNA4的激進(jìn)封裝設(shè)計(jì)必然存在許多麻煩事。
首先,如此多的Die封裝結(jié)合在一起對(duì)于良品率的要求非常高,每一個(gè)封裝都必須非常精準(zhǔn),否則一切前功盡棄。
其次,與Intel的Ponte Vecchio不同,AMD的RDNA4底層的AID本身就有顯存控制器和Infinity Cache兩個(gè)發(fā)熱源。再加上上面3D封裝覆蓋的計(jì)算核心SED,整體的散熱要求非常高。這也是為什么我說(shuō)RDNA4是又一個(gè)天花板,而不是新的天花板。在高性能領(lǐng)域,過(guò)于先進(jìn)的3D封裝技術(shù)并不一定是更好的技術(shù)。因?yàn)檫@種過(guò)于理想的3D設(shè)計(jì)非常不利于散熱。
最后,雖然RDNA4一定采用了各種高級(jí)的膠水封裝技術(shù),但是SED和SED之間的互聯(lián)一定比單一芯片要差。因此,必須對(duì)芯片架構(gòu)和軟件設(shè)計(jì)進(jìn)行大刀闊斧的修改才能避免被互聯(lián)卡住。否則,即使封裝技術(shù)已經(jīng)完美就緒,最終性能可能也難以發(fā)揮。
發(fā)布于 2023-08-19 13:31?IP 屬地云南
AMD(超威半導(dǎo)體)
GPU
chiplet

發(fā)布一條帶圖評(píng)論吧
13 條評(píng)論
默認(rèn)
最新

初如此刻
不得不說(shuō),你們坊間消息有點(diǎn)東西的

08-20?·?IP 屬地江蘇
回復(fù)11

遠(yuǎn)望深思

多芯片封裝的最大的問(wèn)題是,封裝復(fù)雜度上去以后,其成本增加的速度也是非常的快的。
08-20?·?IP 屬地美國(guó)
回復(fù)5

葉開(kāi)
不得不說(shuō),intel的大小核就是輸給了amd的膠水設(shè)計(jì)。
至于顯卡,我不是專家,持保留意見(jiàn)
08-20?·?IP 屬地重慶
回復(fù)4

葉開(kāi)
估計(jì)是大概率的事情,不然等死
08-24?·?IP 屬地重慶
回復(fù)2

lj23
所以下一代Intel也準(zhǔn)備進(jìn)軍mcm了
08-23?·?IP 屬地廣東
回復(fù)1

詩(shī)羽
核芯成本轉(zhuǎn)移到封裝工藝上了
08-21?·?IP 屬地陜西
回復(fù)2
取什么名字好呢
大概是因?yàn)閏uda只能用硬件來(lái)實(shí)現(xiàn)吧。rnda沒(méi)有類似cuda的硬件,所以網(wǎng)傳amd要搞新架構(gòu),所以8000系只有中低端。amd向來(lái)是把nvdia高價(jià)技術(shù)廉價(jià)化的思路。從垂直同步技術(shù)就開(kāi)始了。
08-21?·?IP 屬地湖北
回復(fù)2
孟德?tīng)?/p>
沒(méi)看懂
08-20?·?IP 屬地法國(guó)
回復(fù)1
Right
說(shuō)了半天啥是膠水?
08-20?·?IP 屬地上海
回復(fù)1
咸魚(yú)
Ponte Vecchio工程難度實(shí)際上要高,47個(gè)Chip合封的工程復(fù)雜度在這
08-21?·?IP 屬地江蘇
回復(fù)2
紅塵一步終
介紹非常好...但是看完腦海里就反復(fù)著"膠水"
08-21?·?IP 屬地上海
回復(fù)1
MebiuW
作者

不正好么
08-21?·?IP 屬地云南
回復(fù)1

瘦馬
不得不說(shuō),有點(diǎn)東西
08-20?·?IP 屬地江蘇