最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

真Big Fxxking GPU:英偉達(dá)H100加速卡發(fā)布,4nm工藝,超大性能提升!

2022-03-23 04:11 作者:AMP_EXTREME  | 我要投稿

更加期待下半年的GeForce新品了

英偉達(dá)不管你怎么看他不爽,他終歸是地球上的第一AI巨頭。在剛才結(jié)束的GTC2022中,英偉達(dá)CEO黃仁勛的主題演講上,帶來了新一代的,基于Hopper架構(gòu)的H100數(shù)據(jù)中心加速器。

?基于GH100 GPU?

官方白皮書數(shù)據(jù),全新英偉達(dá)GH100 GPU,并非基于之前傳聞中的臺(tái)積電N5工藝,而是使用更為先進(jìn)的N4工藝。整個(gè)芯片面積為814mm2,相比GA100甚至更小,但是卻集成了800億晶體管,并且采用了更高頻率設(shè)計(jì)。

完整版GH100 GPU架構(gòu)框圖

完整規(guī)格的GH100 GPU規(guī)格,包含了總計(jì)8個(gè)GPC圖形集群,72個(gè)TPC紋理集群,144個(gè)SM流式多處理器,共計(jì)18432個(gè)FP32 CUDA核心(這也和目前傳聞中AD102完整版完全吻合),專用于AI訓(xùn)練的第四代張量核心TensorCore為每組SM配備4個(gè),共計(jì)576個(gè)。顯存方面最大支持6個(gè)HBM3或HBM2e堆棧,6144bit顯存位寬,L2緩存提升到60MB,并且支持第四代NVLink和PCIe Gen5。

Hopper架構(gòu)的SM流式多處理器框圖

不過,GH100是面向人工智能、數(shù)據(jù)分析等負(fù)載構(gòu)建的,而不是圖形處理,SXM5版和PCIe H100所使用的GH100 GPU中,只有兩個(gè)TPC具有圖形處理能力。

?H100 SXM5 加速器?

GH100 GPU用于兩個(gè)款式的加速卡上,分別為SXM5版和PCIe5版,SXM協(xié)議更多用在密集計(jì)算的數(shù)據(jù)中心上,規(guī)格也更高一些。大概是受制于良率,即便是高規(guī)格的SXM5版也并不是滿血的GH100核心。

H100 SXM5使用的H100 GPU規(guī)格為66個(gè)TPC紋理集群,SM數(shù)量下降到132組,而CUDA數(shù)量也是下降到16896個(gè)(但相比于目前的GA100豈止于翻倍),張量核心為528個(gè)。顯存方面,H100 SXM5啟用5個(gè)HBM3堆棧,共計(jì)80GB,顯存位寬為5120Bit。L2緩存也下降到50MB,對(duì)比A100依然有25%提升。


?H100 PCIe5 加速器?

PCIe5版的H100 CNX,集成了CX7芯片,可以將網(wǎng)絡(luò)數(shù)據(jù)以50GB/s的速度直接傳輸給GH100 GPU處理

PCIe版更多用于小型企業(yè),雖然但是,PCIe版的性能也是不容小覷。PCIe版采用進(jìn)一步縮減的GH100 GPU,SM數(shù)量下降到114組,CUDA數(shù)量下降到14592個(gè),張量核心則縮減到了456個(gè)。顯存方面,啟用的是5個(gè)HBM2e堆棧,容量與SXM5版相同,為80GB 5120Bit位寬,L2緩存大小一致。


?碾壓性的性能對(duì)比?

白皮書揭露了新的H100兩款FP32算力,這也是我們這些一般用戶可以關(guān)注一下的指標(biāo)。132組SM/16896CUDA的SXM5版本,F(xiàn)P32單精度算力為60TFlops,根據(jù)CSDN一篇文章提供的公式:?jiǎn)尉壤碚摲逯?FP32 cores*GPU頻率*2,可以推出工作頻率約為1775MHz。而本世代的A100加速卡的GA100核心工作頻率為1410MHz,頻率提升近26%。GeForce產(chǎn)品使用的GPU往往會(huì)給到更高的頻率,下一代RTX 40有望2G起步?


在算力方面,H100 SXM5對(duì)比現(xiàn)在的A100在多個(gè)項(xiàng)目中都超過200%的提升,最低的FP16半精度運(yùn)算也有50%的性能提升,可謂是碾壓級(jí)。

而在演講上,老黃更是直接帶來了H100在三種負(fù)載下對(duì)比A100的效率提升,訓(xùn)練Transformer模型從5天縮短到了19小時(shí),而在結(jié)合了英偉達(dá)多項(xiàng)尖端軟硬件條件下,整個(gè)模型訓(xùn)練從7天縮短到了20小時(shí),效率足足提升9倍。

新一代DGX H100,內(nèi)置8塊H100加速器

雖然英偉達(dá)數(shù)據(jù)中心加速器系列和我們普通消費(fèi)者太過遙遠(yuǎn),但是新的GH100 GPU的規(guī)格很難不讓人揣測(cè)下半年發(fā)布的Ada Lovelace架構(gòu)。如此程度的規(guī)格、性能提升,接下來真的很可能達(dá)到如同GTX 900到GTX 10系,甚至超過那一代的提升幅度,總之做足準(zhǔn)備,敬請(qǐng)見證。

官方白皮書封面

作者深知自身水平不夠?qū)I(yè),如果文中有錯(cuò)誤敬請(qǐng)諒解,本文資料來自GTC2022主題演講和英偉達(dá)HOPPER架構(gòu)白皮書,可以前往英偉達(dá)中國(guó)官網(wǎng)數(shù)據(jù)中心頁(yè)查看官方白皮書。

真Big Fxxking GPU:英偉達(dá)H100加速卡發(fā)布,4nm工藝,超大性能提升!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
通海县| 漯河市| 乃东县| 吴忠市| 张家界市| 凌云县| 郴州市| 白水县| 体育| 商水县| 山丹县| 青岛市| 曲周县| 苍南县| 富川| 依兰县| 大埔县| 唐山市| 昌吉市| 盘锦市| 池州市| 滦平县| 石城县| 镇雄县| 揭西县| 醴陵市| 临城县| 怀集县| 夏邑县| 鄄城县| 鹤岗市| 钟山县| 于田县| 东港市| 盐源县| 东城区| 邮箱| 海兴县| 抚宁县| 依安县| 台北县|