第四代英特爾至強(qiáng)全球部署:多一核,不如多一加速器
作者:王昕 來源:IT時(shí)報(bào)
2023年1月10日,英特爾正式向全球數(shù)據(jù)中心客戶推出第四代英特爾至強(qiáng)可擴(kuò)展處理器(代號(hào)“Sapphire Rapids”)。英特爾公司副總裁兼至強(qiáng)產(chǎn)品部總經(jīng)理Lisa Spelman表示,在產(chǎn)品發(fā)布后僅八周時(shí)間,采用該款產(chǎn)品的處理器設(shè)計(jì)數(shù)量創(chuàng)造了英特爾至強(qiáng)系列的歷史紀(jì)錄,其可用平臺(tái)及出貨平臺(tái)數(shù)量也創(chuàng)下新高。
第四代英特爾至強(qiáng)可擴(kuò)展處理器的一個(gè)重要新特性是其包含豐富的內(nèi)置加速器,幫助提高能效和性能,是英特爾最具可持續(xù)性的數(shù)據(jù)中心處理器。Lisa Spelman說,現(xiàn)階段,大多數(shù)主流OEM和ODM廠商都在出貨基于第四代英特爾至強(qiáng)可擴(kuò)展處理器的系統(tǒng)設(shè)計(jì),而前十大云服務(wù)提供商也將在今年全年部署基于該款產(chǎn)品的云實(shí)例。據(jù)悉,全球已經(jīng)有超過400款針對(duì)第四代英特爾至強(qiáng)的不同設(shè)計(jì)開發(fā)完成,200余款已經(jīng)出貨。

“東數(shù)西算”引領(lǐng)數(shù)字基建增量
英特爾市場(chǎng)營(yíng)銷集團(tuán)副總裁、中國(guó)區(qū)數(shù)據(jù)中心銷售總經(jīng)理兼中國(guó)區(qū)運(yùn)營(yíng)商銷售總經(jīng)理莊秉翰對(duì)第四代英特爾至強(qiáng)在國(guó)內(nèi)的部署前景表示看好。
莊秉翰表示,伴隨著宏觀經(jīng)濟(jì)的復(fù)蘇,今年中國(guó)在IT方面的支出會(huì)比去年有所增加?!皷|數(shù)西算”是去年國(guó)家在數(shù)據(jù)中心和數(shù)字基礎(chǔ)設(shè)施建設(shè)領(lǐng)域推出的重要舉措,通過政府、運(yùn)營(yíng)商、互聯(lián)網(wǎng)公司協(xié)同合作,實(shí)現(xiàn)國(guó)家整體戰(zhàn)略布局。
莊秉翰強(qiáng)調(diào),電信運(yùn)營(yíng)商保有中國(guó)大部分的IDC的機(jī)房,并承擔(dān)網(wǎng)絡(luò)建設(shè)的責(zé)任,所以其在“東數(shù)西算”中將扮演重要角色,通過高效運(yùn)營(yíng),推動(dòng)“東數(shù)西算”的落地和發(fā)展。
在數(shù)字基建領(lǐng)域,第四代至強(qiáng)毫無疑問也將扮演重要角色,特別是在AI、大數(shù)據(jù)等新興和關(guān)鍵領(lǐng)域,提供強(qiáng)大的支撐。莊秉翰介紹,第四代至強(qiáng)可擴(kuò)展處理器是一個(gè)高度創(chuàng)新的平臺(tái),芯片采用Intel 7制程工藝制造,具有全新的芯片架構(gòu),通過集成高性能核、更多內(nèi)核數(shù)量、業(yè)內(nèi)高需求的數(shù)據(jù)中心工作負(fù)載的相關(guān)加速器,以及業(yè)界領(lǐng)先的DDR5、CXL1.1、PCIe 5.0,讓加速無所不在。
加速器,是第四代至強(qiáng)融合的新概念,能夠應(yīng)對(duì)數(shù)據(jù)中心、算力中心等常用的工作負(fù)載,如大數(shù)據(jù)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、AI等,帶來大幅性能提升并降低功耗?!耙郧叭绻幚硪粋€(gè)工作負(fù)載,可能要堆好幾個(gè)核,在新的第四代至強(qiáng)平臺(tái)上,通過加速器,有可能只用一個(gè)核,或是部分的核就可以處理這些過去認(rèn)為很復(fù)雜的業(yè)務(wù)。”莊秉翰說。

新特性直指新興應(yīng)用領(lǐng)域
第四代至強(qiáng)擁有非常多的新特性,直至當(dāng)下產(chǎn)業(yè)發(fā)展的各個(gè)新興應(yīng)用領(lǐng)域。
集成vRAN Boost的第四代英特爾至強(qiáng)可擴(kuò)展處理器,該全新通用芯片將物理層加速功能完全集成到至強(qiáng)系統(tǒng)芯片(SoC)中,無需外置加速卡。英特爾vRAN Boost使得運(yùn)營(yíng)商能夠在通用虛擬化平臺(tái)上整合所有基站層。對(duì)未來,對(duì)這種虛擬基站,以通用的處理器來實(shí)現(xiàn)基站功能,vRAN Boost可以帶來很大性價(jià)比的提升。
英特爾高級(jí)矩陣擴(kuò)展(AMX)是第四代英特爾至強(qiáng)在AI領(lǐng)域的重要“神器”,該引擎對(duì)AI、大數(shù)據(jù)等數(shù)據(jù)密集型業(yè)務(wù)帶來豐富優(yōu)化效果。例如,有的用戶已經(jīng)發(fā)現(xiàn),只要在電商和快遞應(yīng)用上拷貝一段非標(biāo)準(zhǔn)化的地址、手機(jī)、姓名等收發(fā)貨信息,平臺(tái)就可以通過語義分析精準(zhǔn)地捕捉到其中的關(guān)鍵信息,自動(dòng)一鍵完成信息錄入。在這方面,英特爾與阿里展開合作,基于第四代英特爾至強(qiáng)可擴(kuò)展處理器的AMX單元,通過軟件運(yùn)算時(shí)層級(jí)融合技術(shù)和英特爾開發(fā)的高性能運(yùn)算優(yōu)化庫(kù),最終相比基于第三代Ice Lake整機(jī),提升2.48倍效率。另外,在手機(jī)淘寶App的首頁(yè),當(dāng)每位用戶看到自己的個(gè)性化定制首頁(yè)時(shí),背后也有AMX的身影,通過軟件優(yōu)化和操作融合,該項(xiàng)每天數(shù)億次的服務(wù)數(shù)量最終實(shí)現(xiàn)了3倍的性能提升。
伴隨著ChatGPT的大火,AIGC(利用人工智能技術(shù)來生成內(nèi)容)受到空前關(guān)注,百度、網(wǎng)易等國(guó)內(nèi)互聯(lián)網(wǎng)公司都在此領(lǐng)域紛紛推出熱門應(yīng)用。據(jù)介紹,無論AIGC,更火的大語言模型,從技術(shù)角度來說,其中都大量使用了注意力機(jī)制,這個(gè)注意力機(jī)制在Stable Diffusion里面的占比是比較高的,一般可以從50%~80%。英特爾技術(shù)專家介紹,上述注意力機(jī)制中主要包括了大量矩陣相乘和指數(shù)運(yùn)算,“第四代至強(qiáng)的AMX BF16可以用來加速矩陣計(jì)算,AVX-512指令可以用來加速指數(shù)計(jì)算,使用了英特爾PyTorch擴(kuò)展插件的情況下,可以在512×512圖像生成上,獲得3.82倍的吞吐提升,在720P上可以獲得5.26倍的吞吐提升?!?/p>
此前,CPU的發(fā)展一直是核心越變?cè)蕉?,主頻越變?cè)礁摺I鲜鲇⑻貭柤夹g(shù)專家介紹,通過與互聯(lián)網(wǎng)公司超過10年以上的深度合作,英特爾發(fā)現(xiàn),應(yīng)用需求正在不斷變化,比如壓縮/解壓縮、加/解密、內(nèi)存搬移等,“對(duì)于這些工作負(fù)載來說,其實(shí)增加CPU核心并不一定是高效的,但是如果能夠?yàn)槠涮峁┮粋€(gè)專有的加速器的話,反而會(huì)很高效?!?/p>
英特爾技術(shù)專家強(qiáng)調(diào),英特爾的加速器并不是改變算法,而是加速算法的計(jì)算,“但是算法和計(jì)算能力是相輔相成的,當(dāng)英特爾CPU算得更快,客戶就有動(dòng)力去設(shè)計(jì)新的算法,除此之外,在功耗方面,通過增加加速器,實(shí)際上提升了每瓦性能和能效比,實(shí)現(xiàn)了更綠色環(huán)保的目標(biāo)?!?/p>