ARM服務(wù)器生態(tài)已成熟,80核CPU將沖擊X86大本營(yíng)
半導(dǎo)體投資聯(lián)盟
集微網(wǎng)報(bào)道 Ampere公司(安晟培)是一家專(zhuān)注于ARM架構(gòu)服務(wù)器芯片的新生公司。在2019年,甲骨文公司向Ampere公司投資4000萬(wàn)美元。此前,Ampere也獲得了ARM公司的注資。能接連得到科技巨頭的青睞,因?yàn)檫@家處理器新貴肩負(fù)一個(gè)重大使命,將代表ARM陣營(yíng)繼續(xù)挑戰(zhàn)X86架構(gòu)在服務(wù)器芯片領(lǐng)域的霸權(quán)。
?
Ampere的前身是Applied Micro公司旗下的ARM處理器部門(mén),在2017年由私募股權(quán)投資公司Carlyle Group從Macom中收購(gòu)而得。而Ampere的CEO Renee James在2016年2月離開(kāi)英特爾后便加入Carlyle Group,最后促成Carlyle Group投資及創(chuàng)立Ampere公司。
?
成立后的Ampere很快就推出了產(chǎn)品:基于ARM v8.0架構(gòu)的32核芯片eMAG 芯片,采用TSMC 臺(tái)積電16FF +工藝構(gòu)建,運(yùn)行頻率為3.3 GHz。該芯片已經(jīng)交付了聯(lián)想等一批客戶。在一年半之后,2020年3月,Ampere的最新產(chǎn)品Altra誕生了,這款芯片被定義為世界上首款“云原生處理器”。
?
為云而生
?
在介紹Altra的特性之前,要先談到大背景:云計(jì)算。
?
這個(gè)已經(jīng)為人熟知的概念,是由企業(yè)級(jí)計(jì)算演進(jìn)而來(lái)的。但是,云計(jì)算對(duì)處理器的需求已經(jīng)相比原來(lái)發(fā)生了翻天覆地的變化。用Ampere 產(chǎn)品高級(jí)副總裁Jeff Wittich的話來(lái)說(shuō),光是從軟件角度,現(xiàn)在的需求更多的是朝向云原生如容器、微服務(wù)這類(lèi)的計(jì)算模型快速轉(zhuǎn)變,而不是面向以前那種企業(yè)級(jí)內(nèi)部的計(jì)算模型。
?
加之越來(lái)越多的邊緣數(shù)據(jù)中心加入,帶來(lái)了與以往不同的延時(shí)、散熱、功耗等需求。“超大規(guī)模的云,包括邊緣的云計(jì)算的需求的增長(zhǎng),使得我們對(duì)于像CPU的部署密度和能耗的要求越來(lái)越高?!盝eff Wittich表示。
?
還有兩個(gè)重要的變化:機(jī)器學(xué)習(xí)和AI功能增強(qiáng)以及基礎(chǔ)設(shè)施的定制化。前者使得算力的需求在各個(gè)地方都與日俱增,后者要求各種為客戶定制的異構(gòu)型基礎(chǔ)設(shè)施也有云計(jì)算的能力。
?
“所以我們需要一種新型的計(jì)算能力,專(zhuān)門(mén)針對(duì)云的?!盝eff Wittich總結(jié)道:“我們需要很多非常高效的CPU的內(nèi)核,需要整個(gè)基礎(chǔ)設(shè)施都非常低的功耗,而且需要非常好的擴(kuò)展性?!?/p>
Altra就是這種新型計(jì)算能力的代表。這款芯片是從一開(kāi)始設(shè)計(jì)、制造就面向云,為滿足云計(jì)算需求而生的CPU。
?
強(qiáng)者如斯
?
Jeff Wittich將當(dāng)代云計(jì)算的要求歸結(jié)為三種:可預(yù)測(cè)性、跨平臺(tái)的可擴(kuò)展性和高能效及部署密度。
?
Altra擁有80個(gè)64位ARM核,采用了Monolithic die(即單芯片設(shè)計(jì))工藝,所有的核都在Mesh網(wǎng)絡(luò)下連接在一起,具備了非常高的內(nèi)存帶寬和內(nèi)存密度,能提供很高的可預(yù)測(cè)性。

基于行業(yè)中最領(lǐng)先的每核功耗,Altra可以提供極大的可擴(kuò)展性,在從邊緣到超大規(guī)模云的不同部署環(huán)境下可提供多種處理器配置。同時(shí),Altra還提供多路的支持,非常靈活的I/O連接及高帶寬。
?
Jeff Wittich強(qiáng)調(diào):“我們這個(gè)處理器最大一個(gè)優(yōu)點(diǎn)是功耗非常低,同時(shí)單核功耗更低或者說(shuō)每瓦性能是業(yè)內(nèi)最高的?!?/p>
?
“我們這款CPU,特別適用于現(xiàn)在云計(jì)算所需要的計(jì)算模型,包括像容器、微服務(wù),函數(shù)即服務(wù)等這些計(jì)算模型當(dāng)中?!盝eff Wittich表示。
?
Altra的一大特色是采用了單核單線程的設(shè)計(jì),通過(guò)消除單物理核多線程設(shè)計(jì)中,多用戶共享資源的爭(zhēng)奪引起的“相鄰干擾”問(wèn)題,可以實(shí)現(xiàn)提供100%的可預(yù)測(cè)性能核心。Jeff Wittich認(rèn)為,單核單線程的設(shè)計(jì),能夠保證在運(yùn)算或者執(zhí)行的時(shí)候有一個(gè)具備一致性的、可預(yù)測(cè)的性能?!皬膱?zhí)行角度來(lái)說(shuō),設(shè)計(jì)單核單線程,第一能夠降低延遲,第二能夠保持可預(yù)測(cè)的性能一致性?!?/p>
?
Altra還具有兩個(gè)128BT的SIMD單元用于浮點(diǎn)計(jì)算?,F(xiàn)在推理越來(lái)越重要,并且在所有基礎(chǔ)設(shè)施上都運(yùn)行,所以Altra提供int8和FP16的支持,提高AI推理加速性能。
?
緩存方面,Altra也“出手闊綽”。其具有單核64KB L1 I/D-cache,單核1MB L2 cache 和 32MB 系統(tǒng)級(jí)緩存。
?
內(nèi)存子系統(tǒng)也經(jīng)過(guò)精心設(shè)計(jì)。Altra擁有8個(gè)DDR4通道,頻率3200Hz,每一個(gè)通道能插兩個(gè)DIMM,運(yùn)行的時(shí)候能夠提供單路200GB/s的傳輸速度?!按送?,我們還有非常好的I/O子系統(tǒng),單路128條PCIe Gen4通道,兩路是192條PCIe Gen4,這個(gè)是行業(yè)里最高的。X16的控制器可分為x8或者x4或者x2不同的設(shè)計(jì)選擇。Altra可以連接高帶寬GPU,還可以連接高fan-out及NVME存儲(chǔ)設(shè)備?!癑eff Wittich補(bǔ)充道。
?
“我們的處理器除了擁有最多的80核以外,性能也是行業(yè)內(nèi)最好的。我們要比AMD的64核EPYC處理器,28核的Intel 至強(qiáng)(Xeon)處理器的性能好。”Jeff Wittich指出,對(duì)于一些基于云特別多的這些應(yīng)用,比如說(shuō)像搜索、AI推理、解碼、數(shù)據(jù)庫(kù)等等,Altra不僅僅性能更高,功耗也更低,每瓦特的性能比AMD的EPYC和Intel至強(qiáng)要高。
?
生態(tài)已變
?
從Calxeda到Applied Micro再到高通,ARM體系沖擊服務(wù)器CPU的嘗試都折戟了,反而是Intel逐漸占據(jù)了90%的市場(chǎng)份額。
背后的原因是多方面的,主要一個(gè)就是過(guò)往的服務(wù)器生態(tài)對(duì)ARM不太友好。但是這個(gè)局面已經(jīng)發(fā)生改變了。
?
Jeff Wittich指出,ARM架構(gòu)目前已經(jīng)具有領(lǐng)先的數(shù)據(jù)中心的性能和能效。此外,ARM軟件的生態(tài)現(xiàn)在基本上已經(jīng)成熟了,所有運(yùn)行數(shù)據(jù)中心的這些軟件都是可以基于在ARM上進(jìn)行運(yùn)行的。更重要的一點(diǎn),臺(tái)積電現(xiàn)在已經(jīng)有7納米的先進(jìn)工藝制程技術(shù)。
?
據(jù)Jeff Wittich介紹,所有大型的操作系統(tǒng),如Linux、BSD、windows都可以得到ARM架構(gòu)的支持。容器化,包括虛擬化工具如docker、VMware、KVM和Kubernetes都可以在ARM架構(gòu)運(yùn)行。編程語(yǔ)言,包如CUDA和Java也都可以得到ARM的支持。
?
重要的一點(diǎn),現(xiàn)在有大概有1200億左右ARM的設(shè)備在部署,主要分布在移動(dòng)端、物聯(lián)網(wǎng)以及消費(fèi)電子領(lǐng)域中。這樣的一個(gè)大規(guī)模的設(shè)備部署,使得ARM體系已經(jīng)成為最大的處理器生態(tài)系統(tǒng)。
?
從TCO考量來(lái)說(shuō),同樣的總體應(yīng)用成本下所帶來(lái)的性能,Altra比AMD的EPYC高41%?!叭绻虸ntel至強(qiáng)相比,包括與2月24號(hào)公布最新的版本相比較,我們單位的總體應(yīng)用成本要比其高63%。”Jeff Wittich表示。
?
Ampere的團(tuán)隊(duì)經(jīng)驗(yàn)非常豐富,做服務(wù)器這塊已經(jīng)平均干了二十多年了。Jeff Wittich認(rèn)為這也是Altra的優(yōu)勢(shì)所在。“我們這個(gè)團(tuán)隊(duì)曾設(shè)計(jì)過(guò)很多代的服務(wù)器處理器,出貨量在市場(chǎng)上都是非常大的。我們這個(gè)團(tuán)隊(duì)在整個(gè)行業(yè)當(dāng)中有非常廣泛的合作伙伴生態(tài)環(huán)境,包括IP供應(yīng)商的,也包括軟件供應(yīng)商的?!?/p>
?
Jeff Wittich告訴記者,去年NVIDIA宣布完全支持ARM生態(tài),這是一個(gè)大進(jìn)展?!拔覀円苍谧约航ㄔO(shè)軟件生態(tài),和所有的開(kāi)源社區(qū)包括軟件開(kāi)發(fā)商一起,進(jìn)一步地完善我們的生態(tài)?!?/p>
?
據(jù)Jeff Wittich透露,Ampere在過(guò)去一年和最主要的云服務(wù)商一直在合作,像微軟、甲骨文(Oracle)等等,包括其他一些廠商,都在測(cè)試這款A(yù)ltra處理器。他預(yù)計(jì)2020年下半年會(huì)有廠商進(jìn)行部署,規(guī)模量產(chǎn)則將在年中進(jìn)行。

對(duì)于未來(lái)的規(guī)劃,Ampere已經(jīng)制定完畢?!拔覀冇?jì)劃2021年推Mystique這個(gè)新的產(chǎn)品。Mystique核數(shù)更多,性能更好,和現(xiàn)在的Altra平臺(tái)能夠兼容。我們?cè)?022年將推出叫做Siryn的新產(chǎn)品。Siryn要比之前的兩款產(chǎn)品核數(shù)更多,性能更好,功耗更低,而且還有更多基于云的設(shè)計(jì)的特點(diǎn)?!盝eff Wittich最后表示。