最新的ArmV9架構(gòu) 規(guī)格與性能
Arm在今年三月發(fā)布了最新的Armv9架構(gòu),其中包括最新的“超大核”Cortex-X2,“大核”Cortex-A-710和“小核”A-510,今天我們就來了解一下最新的Armv9架構(gòu)吧。

1,Cortex-X2超大核

Cortex-X2 是 Arm 第二世代的 Cortex-X系列,專用處理高負(fù)載的指令。據(jù)Arm說,Cortex-X2的單核性能相較上一代的Cortex-X1增加了30%,而相較于2020年搭載Arm架構(gòu)的Windows 10和Chromebook的單核性能提高了40%。Arm表示最新的Cortex-X2可以達(dá)到16MB的L3級別緩存。但是功耗Arm并沒有表示,應(yīng)該很難說有可能功耗并沒有下降。
2,Cortex-A710大核

Cortex-A710著重在能效比和持續(xù)性能
既然當(dāng)前高效能核心的定位已經(jīng)被 Cortex-X2 取代, Cortex-A710 就不再象徵追求最高性能的定位,但仍舊是 Arm CPU 微架構(gòu)中的要角,在全新的產(chǎn)品定位做為負(fù)責(zé)主要主流級運(yùn)算的性能核心,並強(qiáng)調(diào)針對持續(xù)高度工作負(fù)載具備最佳化的效率。
Cortex-A710相較Cortex-X2更注重能耗和持續(xù)性能,相較A78提升了10%的性能,還提升了30%的能效比。意味著在在日常使用中,續(xù)航會更持久。而且在深度學(xué)習(xí)中,提升了2倍。
3,Cortex-A510小核

Cortex-A510 相較 Cortex-A55 進(jìn)步幅度相當(dāng)顯著
相較於上一世代"大核" Cortex-A7x 系列微架構(gòu)幾乎每年一度的改版,"小核" Cortex-A55 已經(jīng)是 2017 年在 Computex 所公布的微架構(gòu),而此次大改版到 Cortex-A510 也有顯著的整體提升,在性能方面對比 Cortex-A55 提高 35% ,而在能源效率也提升 20% ,同時增加達(dá) 3 倍的機(jī)器學(xué)習(xí)性能。
同時?Cortex-A510 還具備一全新的創(chuàng)新技術(shù),稱為合併核心微架構(gòu)( merged core microarchitecture ),合併核心微架構(gòu)能夠?qū)?2 個 Cortex-A510 構(gòu)成一個群組,單一個 CPU 可由多個群組構(gòu)成,利用此彈性化的的結(jié)構(gòu)設(shè)計能進(jìn)一步提升單位面積效率與擴(kuò)充彈性,簡單來說就是類似當(dāng)前 AMD 的 CPU 是透過多個 CPU CCX 模組構(gòu)成一顆大型 CPU 一樣。
雖然 Cortex-A510 定位在處理背景與輕度負(fù)載內(nèi)容,但性能大幅提升之下,也等同具備 Cortex-A510 的處理器能夠在更多的應(yīng)用僅需使用省電的 Cortex-A510 ,減少動用到 Cortex-A710 與 Cortex-X2 的時間,進(jìn)一步提升整體效能;同時對於主要以 Cortex-A510 構(gòu)成的中低階處理器也能具備更出色的性能但兼顧能源效率。


Armv9 的微架構(gòu)將分為 Cortex-X 、 Cortex-A700 與 Cortex-A500 三大系列
在 Cortex 系列邁入 Armv9 架構(gòu), Arm 也將旗下的 CPU 微架構(gòu)產(chǎn)品定位進(jìn)行再調(diào)整,未來 Cortex-X 除了半客製化架構(gòu)的身分,也兼具追求最高效能的超高效能核心;至於大核心 Cortex-A700 則重新定位於適合多核工作負(fù)載與能耗效率平衡,具備最佳持續(xù)性能的性能核心;小核 Cortex-A500 則繼續(xù)最佳能源效率應(yīng)用,作為輔助大核 Cortex-A700 系列、性能核 Cortex-X 構(gòu)成大小核設(shè)計,為處理瑣碎的背景與輕度負(fù)載作業(yè)而生。

在當(dāng)前 Armv8 指令集時代所宣布的 DynamIQ 中,單一個 Cluster 可容納最多 8 核心、包括 4 個大核與 4 個小核;而 Armv9 所搭配的 DSU-110 雖在單一 Cluster 仍為 8 核心,不過卻可容納最多 8 個 Cortex-X2 高性能核心,這也意味著除了原本的行動運(yùn)算級與入門筆電外, Armv9 為 Arm 架構(gòu)進(jìn)一步帶來跨足高效能 PC 領(lǐng)域的可能性。
從能源效率的角度,基於 DSU-110 的 DynamIQ 設(shè)計可自 4 個 Cortex-A510 、 2+6 大小核、 4+4 大小核到目前高階手機(jī)處理器的 1 + 3 + 4 組合外,針對更進(jìn)階的主流效能筆電能提供 4 個 Cortex-X2 搭配 Cortex-A710 的組合,若將情境轉(zhuǎn)換到桌上型 PC 設(shè)備,甚至可藉由 8 核 Cortex-X2 搭配主動散熱帶來更驚人的性能。
DSU-110 使核心之間的頻寬提升達(dá) 5 倍,同時也進(jìn)一步改善能耗與降低多核協(xié)作的延遲,並提供高效能運(yùn)算配置最高 16MB 的 L3 ;另外在能源管理部分, DSU-110 減少 CPU Cluster 的能源耗損,同時在部分核心停止供電時仍可進(jìn)行低強(qiáng)度的工作負(fù)載,此外搭配全新的 PPC 整合電源策略單元與多種省電模式提供更好的能源管理。

機(jī)器學(xué)習(xí)已是目前自行動裝置到 PC 都相當(dāng)主流的技術(shù),藉由導(dǎo)入?Armv9 指令集,此次宣布的 Cortex-X2 、Cortex-A710 與 Cortex-A510 可支援?BFloat 16 格式,矩陣運(yùn)算能夠支援 Int8 、 BF16 與 SVE2 ,使得新世代的架構(gòu)皆較前一代在機(jī)器學(xué)習(xí)有明顯的提升,尤以 Cortex-A510 更比起 Cortex-A55 在機(jī)器學(xué)習(xí)提高 3 倍性能。
總結(jié):Arm終于把用爛的“萬年A55”換掉了,也把大核換了,有可能在2022年的Arm處理器有著大幅度的提升,讓我們盡情期待吧!??!