智能變革:英特爾HPC高性能計(jì)算與AI(人工智能)解決方案和實(shí)例


在競爭日益激烈的環(huán)境中,數(shù)據(jù)中心作為傳統(tǒng)信息化的基礎(chǔ),伴隨著全面AI時代與5G、物聯(lián)網(wǎng)的不斷臨近,企業(yè)希望獲得出色的模擬和建模、人工智能(AI)和大數(shù)據(jù)分析功能,以便取得突破性的發(fā)現(xiàn)與創(chuàng)新,而高性能計(jì)算(HPC)基礎(chǔ)設(shè)施能夠?yàn)檫@些工作負(fù)載帶來優(yōu)勢。
企業(yè)如果想在相同的 HPC 基礎(chǔ)設(shè)施中運(yùn)行 HPC、大數(shù)據(jù)分析和 AI 工作負(fù)載,優(yōu)化的資源調(diào)度降低計(jì)算成本需要一個全面的融合HPC和AI集群的解決方案。

英特爾? 精選解決方案基于英特爾? 至強(qiáng)? 可擴(kuò)展處理器而構(gòu)建,支持 HPC 批處理調(diào)度程序在通用 HPC 基礎(chǔ)設(shè)施上運(yùn)行所有工作負(fù)載,包括模擬和建模、大數(shù)據(jù)分析和 AI。針對各種計(jì)算、存儲和網(wǎng)絡(luò)資源進(jìn)行優(yōu)化,從而滿足特定工作負(fù)載的需求,探索更多的設(shè)計(jì)參數(shù)、降低企業(yè)成本,縮短生產(chǎn)時間。
解決方案

英特爾? 精選解決方案由英特爾投入巨資將至強(qiáng)? 可擴(kuò)展處理器、英特爾? OPA 和其他技術(shù)結(jié)合在一起,經(jīng)過OEM/ODM、專業(yè)ISV軟件和英特爾認(rèn)證,有助于輕松構(gòu)建 HPC 集群,支持在相同的 HPC 基礎(chǔ)設(shè)施中部署,相同的 HPC 集群上運(yùn)行機(jī)器學(xué)習(xí)、深度學(xué)習(xí)訓(xùn)練模型和數(shù)據(jù)分析。例如,解決方案可幫助用戶在 HPC 系統(tǒng)上運(yùn)行英特爾優(yōu)化的 TensorFlow模型(一款基于Python的深度學(xué)習(xí)框架,可在現(xiàn)代深度神經(jīng)網(wǎng)絡(luò)上輕松使用與擴(kuò)展,并且針對英特爾?至強(qiáng)?處理器進(jìn)行了優(yōu)化)。
英特爾?至強(qiáng)?可擴(kuò)展處理器

第二代英特爾?至強(qiáng)?可擴(kuò)展處理器是強(qiáng)大計(jì)算集群的核心,在高性能計(jì)算 CPU 基準(zhǔn)測試中實(shí)現(xiàn)了高達(dá) 3.7倍的平均性能提升。在LINPACK* CPU 基準(zhǔn)測試中提供了高達(dá) 5.8倍的性能提升和高達(dá) 1.7倍的每內(nèi)核浮點(diǎn)性能,實(shí)現(xiàn)了高達(dá) 25倍的推理吞吐量提升,支持更高的數(shù)據(jù)和工作負(fù)載完整性及合規(guī)性,以經(jīng)濟(jì)高效、靈活的方式提供高可擴(kuò)展性。

英特爾?至強(qiáng)?可擴(kuò)展處理器中集成的以下英特爾技術(shù)進(jìn)一步提升了系統(tǒng)性能與可靠性:
英特爾?AVX-512:提升了要求最苛刻的計(jì)算工作負(fù)載的性能,相比前代英特爾處理器,可將每時鐘周期每秒浮點(diǎn)運(yùn)算數(shù)(FLOPS)提升高達(dá)兩倍。
英特爾? DL Boost:將性能加速擴(kuò)展至整數(shù)運(yùn)算,提高峰值運(yùn)算速度,可處理 CNN 和 DNN 工作負(fù)載特有的密集計(jì)算,加速人工智能深度學(xué)習(xí)(推理)工作負(fù)載。
英特爾? Cluster Checker:可在節(jié)點(diǎn)和集群級別對系統(tǒng)進(jìn)行檢查,以確保所有組件能夠協(xié)同工作并獲得最佳的性能。
英特爾? Cluster Runtimes:針對基于英特爾架構(gòu)的集群提供優(yōu)化的卓越性能,提供每個集群所需的關(guān)鍵軟件運(yùn)行時元素,以確保為每款應(yīng)用提供最佳性能路徑。
基于英特爾? 至強(qiáng)? 可擴(kuò)展處理器的融合并行編程:提供了一個基于通用編程模型的超靈活框架,支持創(chuàng)建高度集成的技術(shù)、軟件工具和庫組合,支持在各種人工智能框架內(nèi)開展代碼現(xiàn)代化項(xiàng)目。
英特爾? 至強(qiáng)? 可擴(kuò)展處理器最高擁有56個核心,支持更高的內(nèi)存速度(最高2933 MT/s)、增強(qiáng)的內(nèi)存容量(每路最高4.5 TB)和八路可擴(kuò)展性,為了應(yīng)對不同的性能需求,處理器則分為不同型號。

鉑金 9200 處理器采用全新的英特爾? 深度學(xué)習(xí)加速指令,專為高性能計(jì)算、高級人工智能和分析而設(shè)計(jì)。
鉑金 8200 處理器專為關(guān)鍵的實(shí)時分析、機(jī)器學(xué)習(xí)、人工智能和多云工作負(fù)載而構(gòu)建,提供可信的硬件增強(qiáng)型數(shù)據(jù)服務(wù)。
金牌 6200處理器優(yōu)化了主流數(shù)據(jù)中心、多云計(jì)算以及網(wǎng)絡(luò)和存儲工作負(fù)載。
金牌5200處理器經(jīng)濟(jì)實(shí)惠,具備出色的可靠性和硬件增強(qiáng)型安全性,可提供更高的性能。
銀牌 4200 處理器提供基本性能,改進(jìn)了內(nèi)存速度和電源效率,提供入門級數(shù)據(jù)中心計(jì)算、網(wǎng)絡(luò)和存儲所需的硬件增強(qiáng)型性能。
銅牌處理器具備硬件增強(qiáng)的可靠性、可用性和可維護(hù)性,提供了基本存儲服務(wù)器入門級性能,滿足這些入門企業(yè)的基本需求。
英特爾? 至強(qiáng)? 可擴(kuò)展平臺
搭載了第二代至強(qiáng)? 可擴(kuò)展處理器的英特爾? 至強(qiáng)? 可擴(kuò)展平臺是一種面向未來的平臺,能夠充分實(shí)現(xiàn)英特爾? 架構(gòu)在HPC和 AI 方面的能力,為企業(yè)創(chuàng)造更高的價值,帶來更高的性能。
可擴(kuò)展平臺設(shè)計(jì)宗旨便是通過優(yōu)異的可擴(kuò)展性將實(shí)現(xiàn)計(jì)算、內(nèi)存、存儲和網(wǎng)絡(luò)性能的最大化,同時也是為人工智能提供了一種通用平臺,內(nèi)置人工智能加速并已針對工作負(fù)載進(jìn)行優(yōu)化,無論是對于推理還是對于訓(xùn)練,該平臺都具有很高的吞吐量,也可為分布式并行計(jì)算集群提供更高的性能和擴(kuò)展性,可構(gòu)建不受互連約束的大型 HPC 解決方案。
實(shí)際案例:
深圳市寶德計(jì)算機(jī)系統(tǒng)有限公司擁有亞太地區(qū)最大的服務(wù)器研發(fā)生產(chǎn)基地之一,以研發(fā)、生產(chǎn)、銷售Power-leader品牌的服務(wù)器和解決方案為主要業(yè)務(wù),二十多年來保持穩(wěn)健發(fā)展,穩(wěn)居國產(chǎn)服務(wù)器第五位和全球第九,是中國服務(wù)器市場的精銳企業(yè)。
寶德高性能計(jì)算方案采用集群體系結(jié)構(gòu),遵循Intel開放的HPC生態(tài)體系架構(gòu)來系統(tǒng)的部署所有的軟硬件,針對大規(guī)??茖W(xué)并行計(jì)算設(shè)計(jì),兼顧事務(wù)處理和網(wǎng)絡(luò)信息服務(wù),可以有效降低能耗,是最新技術(shù)結(jié)晶和未來的主流發(fā)展方向之一。
方案中共配置1個管理節(jié)點(diǎn),10個計(jì)算節(jié)點(diǎn),千兆交換機(jī)管理網(wǎng)絡(luò)系統(tǒng),Intel? Omni-Path 100Gb網(wǎng)絡(luò)作為高速計(jì)算網(wǎng)絡(luò),共同構(gòu)成了高速計(jì)算、海量數(shù)據(jù)傳輸?shù)木W(wǎng)格計(jì)算集群系統(tǒng)。

管理節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)均選用寶德推出的一款主流2U服務(wù)器產(chǎn)品PR2710P。它采用Intel? C620系列高性能芯片組,支持第二代英特爾?至強(qiáng)?可擴(kuò)展系列處理器,最多支持內(nèi)存容2TB,默認(rèn)支持8塊熱插拔 3.5寸硬盤,可選支持12盤/24盤版本,并可選擴(kuò)展全高全長的PCI-E設(shè)備,可選采用英特爾?FPGA和傲騰數(shù)據(jù)中心級持久內(nèi)存,支持Infiniband、Omni-Path高速網(wǎng)卡。PR2710P提供先進(jìn)的管理功能和存儲技術(shù),具有可靠的可擴(kuò)充性和高可用性。該方案所有計(jì)算節(jié)點(diǎn)服務(wù)器CPU采用Intel? Xeon? Gold 6248,具有20核、40線程、27.5MB緩存、150W TDP,基準(zhǔn)頻率2.5GHz,可以超頻至3.9Ghz。
為了更大地發(fā)揮HPC集群的計(jì)算性能,提高集群計(jì)算節(jié)點(diǎn)之間的網(wǎng)絡(luò),方案采用了最新的Intel? Omni-Path網(wǎng)絡(luò)互聯(lián)解決方案。Omni-Path Architecture ( OPA)是英特爾在True Scale架構(gòu)和標(biāo)準(zhǔn)InfiniBand的經(jīng)驗(yàn)及教訓(xùn)上,針對HPC開發(fā)的一種高性能網(wǎng)絡(luò)架構(gòu),是一項(xiàng)專為優(yōu)化高性能計(jì)算的全新互聯(lián)技術(shù),也是一款端到端的互聯(lián)解決方案,可針對入門級和大規(guī)模高性能集群經(jīng)濟(jì)、高效地提升性能。
總結(jié):英特爾? 精選解決方案是根據(jù)組織具體需求定制并預(yù)先驗(yàn)證的軟硬件構(gòu)建模塊組合,提供了可預(yù)測、可靠的超凡性能,充分利用現(xiàn)有的所有資源,能夠在提高性能的同時,降低終端客戶實(shí)施數(shù)據(jù)中心現(xiàn)代化的難度,并規(guī)避相關(guān)風(fēng)險,是運(yùn)行HPC、AI 和大數(shù)據(jù)集群這些工作負(fù)載的最佳選擇。