AMD發(fā)布業(yè)界領(lǐng)先的高性能科學(xué)研究用HPC加速顯卡
? AMD Instinct MI100加速顯卡為高性能計(jì)算(HPC)和AI?帶來革命性變化???
??首款為百億億次級時代而設(shè)計(jì)、采用AMD CDNA架構(gòu)的加速顯卡???
AMD發(fā)布了全新的AMD Instinct MI100加速顯卡?——?業(yè)界領(lǐng)先的HPC顯卡,同時也是首個突破10 teraflops(FP64)性能大關(guān)的x86服務(wù)器顯卡。同時MI100有了戴爾、技嘉、HPE和Supermicro這些加速計(jì)算平臺的支持,并與AMD EPYC?處理器和ROCm? 4.0開源軟件平臺相結(jié)合,旨在推動百億億次級時代的搶先到來。
基于全新的AMD CDNA架構(gòu),AMD Instinct MI100顯卡在與第二代AMD EPYC?處理器搭配使用時可為HPC和AI提供性能更強(qiáng)的加速系統(tǒng)。MI100可為HPC提供高達(dá)11.5 TFLOPS的FP64峰值性能、為AI和機(jī)器學(xué)習(xí)工作負(fù)載提供多達(dá)46.1 TFLOPS的FP32 Matrix峰值性能。相比AMD的上一代加速顯卡,MI100借助全新AMD Matrix Core技術(shù),還可為AI訓(xùn)練工作負(fù)載帶來提升近7倍的FP16理論峰值浮點(diǎn)性能。
AMD數(shù)據(jù)中心GPU與加速處理全球副總裁Brad Mccredie說:“AMD今天所推出的AMD Instinct MI100 ——業(yè)界領(lǐng)先的高性能HPC顯卡,邁出了通往百億億次級計(jì)算道路上的重要一步,我們的新加速顯卡直指科學(xué)計(jì)算中的工作負(fù)載,通過與AMD ROCm?開源軟件平臺相結(jié)合,為科學(xué)家和研究人員提供了一個更為優(yōu)越的HPC工作基礎(chǔ)?!?/p>
為百億億次級時代而打造的開源軟件平臺
AMD ROCm?開發(fā)者軟件平臺為百億億次級計(jì)算提供了新基礎(chǔ)。作為一個由編譯器、編程API和庫組成的開源工具集,ROCm?可幫助百億億次級軟件開發(fā)者們打造高性能應(yīng)用程序。經(jīng)過優(yōu)化后的ROCm? 4.0可為基于MI100的系統(tǒng)帶來大規(guī)模性能。ROCm? 4.0已將編譯器升級為開源且統(tǒng)一標(biāo)準(zhǔn)的,可支持OpenMP 5.0以及HIP.PyTorch和Tensorflow框架,這些平臺框架在搭配MI100和ROCm? 4.0使用時,在經(jīng)過優(yōu)化后可實(shí)現(xiàn)更高性能。?ROCm? 4.0是面向HPC、ML以及AI應(yīng)用開發(fā)者的全新平臺,能夠幫助他們打造高性能便攜軟件。
橡樹嶺國家實(shí)驗(yàn)室科學(xué)總監(jiān)Bronson Messer說:“我們已經(jīng)率先用上了MI100加速顯卡,初期效果非常令人驚喜。與其他顯卡相比,我們已經(jīng)看到了高達(dá)2至3倍的性能提升。我們也認(rèn)識到性能對軟件的影響也很重要。事實(shí)上,開源的ROCm?軟件平臺以及HIP開發(fā)者工具可以在各種平臺上工作,這是我們自推出首款混合CPU/GPU系統(tǒng)以來就一直想要的東西?!?/p>
?
AMD Instinct MI100加速顯卡的關(guān)鍵功能和特點(diǎn)包括:
·?全新AMD CDNA架構(gòu)?–?AMD CDNA架構(gòu)可提供卓越的性能和能效,為AMD顯卡提供百億億次級時代的性能,同時也是MI100加速顯卡的核心。
·?為HPC工作負(fù)載提供領(lǐng)先的FP64和FP32性能?–?為行業(yè)提供領(lǐng)先的11.5 TFLOPS FP64峰值性能、23.1 TFLOPS FP32峰值性能,幫助全球各地的科學(xué)家和研究人員加速他們在生命科學(xué)、能源、金融、學(xué)術(shù)、政府、國防等領(lǐng)域的新發(fā)現(xiàn)。
·?為HPC和AI打造的全新Matrix Core技術(shù)?–?為單精度和混合精度矩陣運(yùn)算(如FP32、FP16、bFloat15、Int8和Int4)提供超強(qiáng)性能,促進(jìn)HPC和AI的融合。
·?第二代AMD Infinity Fabric技術(shù)?–?Instinct MI100在服務(wù)器中使用三個AMD Infinity Fabric鏈接時,可在PCIe 4.0上提供約2倍的點(diǎn)對點(diǎn)(P2P)峰值I/O帶寬以及每張顯卡高達(dá)340GB/s的總帶寬。MI100顯卡可配備兩個完全連接的Quad顯卡單元,其中每個單元可為快速數(shù)據(jù)分享提供多達(dá)552GB/s的P2P I/O帶寬。
·?高速HBM2內(nèi)存?–?具有32GB高帶寬HBM2內(nèi)存,1.2GHz時鐘速率,可提供超高的1.23TB/s內(nèi)存帶寬,以支持大型數(shù)據(jù)集并解決移動數(shù)據(jù)進(jìn)出內(nèi)存的瓶頸。
·?支持PCIe 4.0 –?支持全新PCIe 4.0,從CPU到GPU可提供高達(dá)64GB/s的理論峰值傳輸數(shù)據(jù)帶寬。
服務(wù)器解決方案案例
AMD Instinct MI100加速顯卡預(yù)計(jì)將于今年年底在企業(yè)級市場的主要OEM和ODM合作伙伴的系統(tǒng)上使用,其中包括:
戴爾
戴爾PowerEdge服務(wù)器高級副總裁Ravi Pendekanti表示:“戴爾EMC PowerEdge服務(wù)器將支持全新AMD Instinct MI100,它可以讓數(shù)據(jù)分析的更快,這也將幫助我們的客戶更好地實(shí)現(xiàn)更強(qiáng)大更高效的HPC以及AI負(fù)載,一直以來AMD都是支持我們數(shù)據(jù)中心創(chuàng)新的重要合作伙伴,AMD Instinct加速顯卡的高性能非常適合我們的PowerEdge服務(wù)器AI&HPC組合。”
技嘉
技嘉NCBU副總裁Alan Chen表示:“我們很高興可以與AMD再次合作,AMD Instinct MI100加速顯卡代表了數(shù)據(jù)中心高性能計(jì)算的新水平,為能源研究、分子動力學(xué)以及深度學(xué)習(xí)訓(xùn)練帶來了更大的連接性和數(shù)據(jù)帶寬。作為技嘉產(chǎn)品組合中的新加速顯卡,現(xiàn)在我們的客戶可以期待在一系列科學(xué)和工業(yè)HPC工作負(fù)載中獲得更高性能收益?!?/p>
?
HPE
HPE全球副總裁Bill Mannel表示:“客戶通過使用HPE Apollo系統(tǒng)的特定功能和性能來解決包括HPC、深度學(xué)習(xí)和分析在內(nèi)的一系列復(fù)雜數(shù)據(jù)密集性工作負(fù)載,而隨著新HPE Apollo 6500 Gen10 Plus系統(tǒng)的推出,我們將通過支持全新且能夠?qū)崿F(xiàn)更大連接和數(shù)據(jù)處理的AMD Instinct MI100加速顯卡以及第二代EPYC?處理器,進(jìn)一步提升我們的產(chǎn)品組合改善工作負(fù)載性能。我們期待繼續(xù)與AMD進(jìn)行合作,用業(yè)界領(lǐng)先的處理器和加速顯卡來擴(kuò)大我們的產(chǎn)品?!?/p>
?
Supermicro
Supermicro場景應(yīng)用引擎和業(yè)務(wù)發(fā)展高級副總裁Vik Malyala表示:“我們很高興AMD Instinct MI100加速顯卡為高性能計(jì)算領(lǐng)域帶來了巨大影響,結(jié)合全新CDNA架構(gòu)所帶來的計(jì)算能力,以及MI100帶來的高內(nèi)存和點(diǎn)對點(diǎn)帶寬,我們的客戶可獲得更卓越的解決方案,并滿足他們的加速計(jì)算需求以及關(guān)鍵的企業(yè)工作負(fù)載。AMD Instinct MI100將為我們的多顯卡服務(wù)器,以及高性能系統(tǒng)、服務(wù)器構(gòu)建模塊解決方案的廣泛組合提供一個強(qiáng)有力的補(bǔ)充?!?/p>
MI100規(guī)格參數(shù)
