最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

美光 DDR5 搭配第四代 AMD EPYC 處理器官方基準(zhǔn)測試:所有性能均提升兩倍

2022-12-19 19:24 作者:切柳斯金  | 我要投稿

IT之家(瀟公子)


IT之家 12 月 19 日消息,據(jù)美光發(fā)布,美光與 AMD 雙方在奧斯汀建立聯(lián)合服務(wù)器實驗室,以減少服務(wù)器內(nèi)存驗證時間,在產(chǎn)品驗證和發(fā)布期間共同進行工作負(fù)載測試。


目前美光適用于數(shù)據(jù)中心的 DDR5 內(nèi)存和第四代 AMD EPYCTM (霄龍)處理器均已出貨,官方對其進行了一些常見的高性能計算(HPC)工作負(fù)載基準(zhǔn)測試。


長期以來,超級計算機承擔(dān)著高性能計算工作負(fù)載。此類大規(guī)模的數(shù)據(jù)密集型工作負(fù)載需要運行 TB 級的數(shù)據(jù)量以進行數(shù)百萬個并行操作,以解決人類世界的難題,如天氣和氣候預(yù)測;地震建模;化學(xué)、物理和生物分析等。


?隨著計算機架構(gòu)的進步,此類工作負(fù)載往往托管在超大型“可橫向擴展”的高性能服務(wù)器集群中。這些服務(wù)器集群需要集合最強大的算力、架構(gòu)、內(nèi)存和存儲基礎(chǔ)設(shè)施,以滿足關(guān)鍵工作負(fù)載對可擴展性、低延遲和高性能的需求。然而隨著服務(wù)器 CPU 的性能和吞吐量不斷增長,DDR4 無法提供足夠的內(nèi)存帶寬,來滿足不斷增長的高性能內(nèi)核。


-


?為緩解這一瓶頸,美光 DDR5 內(nèi)存與采用了 Zen 4 服務(wù)器架構(gòu)的第四代 AMD EPYC 處理器聯(lián)合,使服務(wù)器 CPU 能夠更好地匹配內(nèi)存產(chǎn)品,滿足數(shù)據(jù)密集型工作負(fù)載對性能和效率的需求。IT之家獲悉,美光對最新的 AMD Zen 4 96 核 CPU 和美光 DDR5 進行了行業(yè)內(nèi)高性能計算工作負(fù)載基準(zhǔn)測試,所有結(jié)果均顯示性能提升了兩倍。


STREAM1 ?是常見的基準(zhǔn)測試工具,用于測量高性能計算機的內(nèi)存帶寬,可捕獲高性能計算系統(tǒng)的峰值內(nèi)存帶寬。


該工作負(fù)載使用的軟件堆棧


● Alma 9 Linux kernel 5.14


● STREAM.f,2021 年 11 月 29 日發(fā)布版本


-


測試設(shè)置


● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng) 2 的 RDIMM 內(nèi)存槽插滿,共 64GB


● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng) 3 的 RDIMM 內(nèi)存槽插滿,共 64GB


測試結(jié)果


● DDR5 系統(tǒng)每插槽內(nèi)存帶寬翻倍,達(dá)到 378 GB / s


● 該結(jié)果意味著客戶能運行更大規(guī)模的人工智能 / 機器學(xué)習(xí) (AI / ML) 項目,或利用 DDR5 增加的內(nèi)存帶寬進行更多高性能計算。


-


?此次測試使用的高性能計算工作負(fù)載代碼針對天氣和氣候。WRF 模型在一些支持高性能浮點處理、高內(nèi)存帶寬、低延遲網(wǎng)絡(luò)等傳統(tǒng)高性能計算架構(gòu)中表現(xiàn)良好,測試對象為橫向分辨率為 2.5 公里的美國大陸地區(qū) (CONUS)。


該工作負(fù)載使用的軟件堆棧


● Alma 9 Linux kernel 5.14


● WRF 2.3.5 & 4.3.3


Open MPI v4.1.1


測試設(shè)置


● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng) 2 的 RDIMM 內(nèi)存槽插滿,共 64GB


DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng) 3 的 RDIMM 內(nèi)存槽插滿,共 64GB


測試結(jié)果


?● 美光 DDR5 搭配第四代 AMD EPYC 處理器,可實現(xiàn) 1.3567 時間步 / 秒 VS DDR4 系統(tǒng)的 2.8533 時間步 / 秒


速度更快意味著可使用更大的數(shù)據(jù)庫或運行更多模型以進行天氣預(yù)測,進而改善預(yù)測的準(zhǔn)確度。


OpenFOAM 是一種計算流體動力學(xué) (CFD) 的開源高性能計算工作負(fù)載,廣泛應(yīng)用于多個行業(yè),有助于縮短開發(fā)時間并降低成本。從消費類產(chǎn)品設(shè)計到航空航天設(shè)計,OpenFOAM 能夠模擬不同應(yīng)用中的物理互動,包括摩托車風(fēng)擋湍流。


在該模擬中,OpenFOAM 能夠計算摩托車和騎手周圍的穩(wěn)定氣流。OpenFOAM 能夠根據(jù)用戶指定的進程數(shù)進行負(fù)載均衡計算,以此將網(wǎng)格分解成多個部分并分配給不同的進程求解。求解完成后,再將網(wǎng)格和解重新組合為單個域。


該工作負(fù)載使用的軟件堆棧


OpenFOAM CFD 軟件?(版本 8),其中摩托車網(wǎng)格尺寸為:600 x 240 x 240


● Alma 9 Linux kernel 5.14


● Open MPI v4.1.1


測試結(jié)果


測試結(jié)果表明美光 DDR5 產(chǎn)品組合將 OpenFOAM 性能提高了 2.4 倍。OpenFOAM 為五大高性能計算軟件平臺之一,擁有大型開源社區(qū)。該軟件廣泛應(yīng)用于大學(xué)和研發(fā)中心,可利用高帶寬內(nèi)存和擁有密集內(nèi)核的高性能 CPU,實現(xiàn)高度的并行操作。


CP2K 是一款開源量子化學(xué)工具,適用于許多應(yīng)用,包括固態(tài)生物系統(tǒng)模擬。CP2K 能夠為不同的建模方法提供通用的框架。此次測試對象為水 (H2O) 的密度泛函理論 (DFT),模擬盒子中共包含 6,144 個原子(2,048 個水分子)。


該工作負(fù)載使用的軟件堆棧


● H2O-DFT-LS.NREP4 及 H2O-DFT-LS


● Alma 9 Linux kernel 5.14


?測試設(shè)置


DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng) 2 的 RDIMM 內(nèi)存槽插滿,共 64GB


● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng) 3 的 RDIMM 內(nèi)存槽插滿,共 64GB


測試結(jié)果


測試結(jié)果表明美光 DDR5 產(chǎn)品組合將分子動力學(xué)性能提高了 2.1 倍。隨著內(nèi)核數(shù)和內(nèi)存帶寬增加,此類工作負(fù)載的性能也顯著提升。


總結(jié)


目前只針對少量高性能計算工作負(fù)載進行測試,因此以上只是初步成果。將高性能高帶寬內(nèi)存與最新的服務(wù)器處理器(如第四代 AMD EPYC 處理器)相結(jié)合,可為高性能計算客戶創(chuàng)造新的可能。


1 在 STREAM 基準(zhǔn)測試中配置了 25 億個向量的 STREAM Benchmark—— 運行在一臺單 AMD CPU 系統(tǒng)上


2 AMD DDR4 系統(tǒng)為一臺 64 核 AMD EPYC 7763 處理器,DDR4-3200 MHz 的 RDIMM 內(nèi)存槽插滿,共 64GB


?3 AMD DDR5 系統(tǒng)為一臺 96 核 AMD EPYC 9654 處理器,DDR5-4800 MHz 的 RDIMM 內(nèi)存槽插滿,共 64GB


4 ?橫向分辨率為 12.5 公里 CONUS 的 WRF 在 DDR4 系統(tǒng)上的運行時間為 929 秒,在 DDR5 系統(tǒng)上的運行時間為 287 秒(均包括存儲器的輸入 / 輸出時間)。該測試中 WRF 配置為 2.5 公里 CONUS,測試結(jié)果為 1.3567 時間步/ 秒,相比之下 DDR4 的運行時間為 2.8533 時間步 / 秒。


5 針對 OpenFOAM,運行了三種變體:


5a:1004040 runtimes,DDR4 系統(tǒng)運行時間為 1,144 秒,DDR5 系統(tǒng)運行時間為 478 秒


5b:1084646 runtimes,DDR4 系統(tǒng)運行時間為 1,633 秒,DDR5 系統(tǒng)運行時間為 698 秒


5c:1305252 runtimes,DDR4 系統(tǒng)運行時間為 2,522 秒,DDR5 系統(tǒng)運行時間為 1,091 秒


6 分子動力學(xué)工作負(fù)載在 DDR4 系統(tǒng)上的運行時間為 2,519 秒,在 DDR5 系統(tǒng)上的運行時間為 1,242 秒


美光 DDR5 搭配第四代 AMD EPYC 處理器官方基準(zhǔn)測試:所有性能均提升兩倍的評論 (共 條)

分享到微博請遵守國家法律
玉山县| 新晃| 文水县| 海口市| 奈曼旗| 龙南县| 永川市| 平湖市| 贵州省| 松江区| 丰城市| 湄潭县| 冕宁县| 博客| 千阳县| 佛坪县| 麻阳| 普洱| 霍林郭勒市| 万安县| 淳化县| 夏河县| 临朐县| 阿拉善右旗| 仁布县| 河南省| 洪湖市| 丰城市| 介休市| 北票市| 涡阳县| 子长县| 天长市| 高淳县| 醴陵市| 鸡泽县| 托里县| 祁连县| 筠连县| 海安县| 陵水|