揭秘龍芯圈如何攻擊國產芯片03:以IPC代表提升
額……老鐵們,我圖吧佬撿垃圾的了。最近咱看見龍芯吧小吧主關于龍芯和其他國產芯片的視頻之后,出于好奇,入手了不少國產芯片的平臺,包括且不限于兆芯飛騰麒麟710A之類的產品,對于咱們過去的測試視頻中,經(jīng)常有一種類型的評論說什么:
兆芯IPC提升慢,CPU擠牙膏
IPC沒提升就是零提升


這也是龍芯吧小吧主的視頻的底層邏輯
然而經(jīng)過咱實測發(fā)現(xiàn)結果來看實際上根本不是這么回事。
href="https://www.bilibili.com/video/BV1SL411o7ha/";>戳穿兆芯十年無提升謊言:U6780A+GTX750大戰(zhàn)原神幀數(shù)高于C4701+GTX960(附AIDA64 cache memory benchmark)

畢竟咱搞到了初代兆芯A的產品結果發(fā)現(xiàn)配上750大戰(zhàn)原神最低畫質居然加載讀條都得用15分鐘,而且進游戲CPU就滿載,750動都不動。
所以今天見到接著說說CPU核心提升的歷史規(guī)律吧,部分內容整理節(jié)選自圖吧群日常聊天記錄
原標題:龍芯圈以IPC為標準攻擊其他國產芯片沒什么用,談CPU核心提升的歷史規(guī)律
省流:
隨便一個圖吧的小白稍微懂點硬件都知道IPC只能代表不同架構不同核心同頻性能的基準,而不能代表芯片的整體性能或者芯片科技水平。實際上單核同頻性能也就是所謂的IPC實際上只能代表架構的大小,大核心同頻性能高,自然功耗也高,小核心單核同頻性能低但是功耗低通常易于堆核提升整體性能,所以不能說大核心的設計水平就比小核心高。而CPU最高運行頻率也和架構本身有關并不完全看工藝和物理設計,最簡單的奔騰4為了強行提升頻率就拉長了流水線長度更容易拉高頻但是長流水線卻降低了運行效率得到了高頻低能的廢物,因此二十年前圖拉丁吧發(fā)現(xiàn)短流水線高能效的圖拉丁奔騰3才是永遠的神。這是用戶第一次生動的理解并接觸能效比的概念,在此之前大部分人都只知道頻率和性能的關系需要用同頻性能來參照而不是直接就可以用頻率代表性能(奔騰4的宣傳策略就是高頻=高性能,實際上不是的)。
聊天記錄的前面提到了即使到了今天X58作為圖吧經(jīng)典垃圾配置依然繼承了AMD AM3開核平臺的衣缽(AM3缺SSE4指令集)成為了圖吧垃圾佬入門配置的情況,然后與后來降價的Haswell 4代平臺或者更老的家用級平臺進行了一下對比:
總而言之超頻不如堆核,2500K總不能日常4.0G吧。L5640可是同樣性能日常60W功耗,誰沒事為了全核3.0G上95W的功耗現(xiàn)在,又不是AM3開核日常TDP 144W 150W+的時代。

大人,時代變了,沒人在乎性能夠用的情況下還能凹多高頻率了,更重要的其實是功耗


畢竟機器是自己的電是掐表的,該不該省電其實不用咱說。
X58工作站這種自帶550W電源的東西咱都尚且不敢拉滿使用要換X58低功耗U默頻使用都不會超頻。這個機器咱才發(fā)現(xiàn)電源居然連個效率認證都沒80白牌好歹還是80%效率的東西,T5500的850W電源上面是有80銀牌認證的

所以說這東西如果常年開機家里面電費還是能反映出來的,之前咱試過常年開機如果不卡BUG死機內存報錯的前提下電費的差距還是有直觀感受的。
所以現(xiàn)在咱連這個都不用直接日常6WN4100主機:

這款基于ATOM核心的N4100小主機黑盒咱其實之前是21年年底500包郵買的,當時賣家據(jù)說也是張大媽用戶,然后咱還想過給他出開箱引流讓他給咱優(yōu)惠或者提供個贈品,當時咱記得咱好像是要SATA轉接線來著這黑盒原生支持一路外接SATA帶供電結果沒給,最后自然就不了了之了。但是機器卻意外的好用


這款ATOM核心的GEMINILAKE 賽揚銀牌N4100低功耗U核心頻率全核在800M到2.3G之間動態(tài)范圍可變,TDP僅6W,可解鎖至10-15W功耗,之前咱實測過這個U的性能相比J1900有一定的提升,但是放在小盒子里依然需要風冷散熱才能壓住,被動散熱的版本需要改散熱。無論是Apollolake的N3450還是GEMINILAKE的N4100f本質上其實都是ATOM Z8500的后代,加了原生SATA支持升級集成顯卡解鎖了功耗的凌動核心。這個核心電壓咱不知道它是不是認真的,如果是真的那英特爾可真的NB壞了

日常使用方面CPU整個SOC功耗約3W,其中CPU部分0.5W GPU2.5W,解鎖10W以上功耗的時候CPU和GPU兩者其一可以滿血運行,如果需要全滿血需要解鎖15W功耗。這樣這個U本身就具有J1900一樣單U戰(zhàn)原神的能力:

考慮到當時咱們沒有拿到國產MS2130采集卡所以錄屏占用了相當?shù)腉PU與CPU資源,如今其實咱應該有時間再測一次。

總之這么個SDP 4W TDP6W的U在咱這用著還算不錯,要不是它鎖WIN10高低得讓它上WIN7,記得之前垃圾佬的I5 8400的UHD630就有人改出了WIN7驅動,然后配B365直接就能上WIN7了。這也是咱這個WIN10 PTSD的垃圾佬能接受的最高的配置了。

所以這個機器現(xiàn)在咱是掛了NVME(沒錯,它魔改了PCIe支持2.0×2 NVME)然后現(xiàn)在裝了WIN10 LTSC用著還挺好,因為自帶解鎖功耗BIOS所以性能不算太次。
這個U解鎖了10W功耗之后的性能本質上和I5 560M差不太多 卻可以掛QQ上網(wǎng) 開IDM BT做下載機,開MSTSC當私有云節(jié)點,或者用TYPEC從手機倒視頻做無損剪輯+上傳之類的。甚至UHD600支持WAIFU2X AI圖片拉伸

除了需要N卡的AI或者需要A卡的視頻補幀以外,垃圾佬需要的功能它都有。而且如果愿意折騰的話用NVME甩顯卡也不是不能操作。
總之ATOM產品線發(fā)展到今天對于Z8300入坑的垃圾佬來說看了還是比較欣慰的,想當年用Z8300咱可是網(wǎng)頁開多了都卡用它上傳視頻Chrome標簽頁多了都能直接給上傳進度卡掉來著。而現(xiàn)在已經(jīng)能取代垃圾佬的X200(CORE 2 Mobile)甚至X201了(一代I5集顯)。英特爾的ATOM相當于把筆記本一代I5的雙核四線的性能做到了6-10W的水平,對于咱這種碼字傳視頻下資源輕度影音娛樂的使用需求來說已經(jīng)足夠(得益于GEN9集顯的提升,ATOM GPU的3D性能和視頻硬件編解碼的性能都有相當?shù)奶嵘?,甚至支持硬解H265 10bit和硬編H265,這個水平過去可是只有GTX960以后的顯卡才能支持)。

所以英特爾把原先D525 D2550 Z3735 Z8300那種老ATOM的性能水平從不夠用的水平提升到現(xiàn)在一般輕度使用需求夠用的水平還是下了功夫花了時間的


觀察英特爾的產品線就能發(fā)現(xiàn),ATOM后代改名換姓的低功耗奔騰賽揚依然使用了自J1900的Bay Trail以來就沒什么變化的CPU核心搭配更新的工藝更高的頻率更大的緩存更好的調度逐漸完成了性能的提升以及功耗的下降。



到了GEMINILAKE和GEMINILAKE REFRESH這一代英特爾更是直接凹上了頻率,同樣的功耗頻率又在提升

所以現(xiàn)在對于英特爾的低功耗小核心來說只要不是物理核心<4或者世代低于Bay Trail,其實截止14nm時代結束CPU性能的進步并不算大,而是一直專注于提升CPU的能效比。ATOM末代產品也是初代14nm的ATOM Cherry Trail就相比前代提升了最高4倍規(guī)格的核顯,ATOM的名字取消后英特爾更是直接下發(fā)了CORE同架構集顯,對于低功耗平臺這種高度集成的小核心產品來說集顯性能的提升卻能顯著提升使用體驗。
之前有國產寨本的廠家曾經(jīng)給N4100提供了MX150這種NVIDIA的3D加速卡,結果就是讓N4100的性能水平甚至可以大戰(zhàn)原神30幀沒問題。對于簡單娛樂的需求來說咱其實不敢說目前對CPU性能的要求門檻很高,實際上更多已經(jīng)取決于顯卡。如果可以掛獨顯使用即使CORE2時代的P8800的性能水平也是能戰(zhàn)一下的,這個咱最近會測。
所以回到之前咱標題說的問題,為什么龍芯圈一直要用IPC的提升衡量芯片水平的提升?這個圖拉丁奔騰時代的思維是怎么活到今天的?垃圾佬在接觸CORE2時代的筆記本的時候就意識到了同頻性能甚至理論性能再高芯片的能效比不行結果在實際應用中就被吊打的事實,也理解提升能效比堆核才是提升芯片性能的正確思路,奔騰4單核就算超冒煙了也打不過對面AMD雙核,核戰(zhàn)才是提升芯片性能的硬道理。
這就是我們?yōu)楹卧谥暗囊曨l和文章中就直接提到了IPC沒能效比重要這么一個簡單的概念。
為何評判現(xiàn)代CPU的水平不能只看IPC?論能效比在多核時代的重要性
【閑話兆芯05】為什么兆芯的IPC不高?同頻性能有能耗比影響使用體驗嗎?
IPC代表不了芯片設計水平,甚至代表不了芯片本身性能,這點老外的架構分析網(wǎng)站在測評的時候看得很明白。

The terms “architectural efficiency” or “performance at the same clock” are sometimes taken as metrics of goodness in and of themselves. Perhaps this is one way of apologizing for low clock rates or a way to imply higher performance when the microrachitecture “someday” reaches a clock rate that is in fact unobtainable for that design…
David B. Papworth, Tuning the Pentium Pro Microarchitecture, IEEE Micro

隨便一個圖吧的小白稍微懂點硬件都知道IPC只能代表不同架構不同核心同頻性能的基準,而不能代表芯片的整體性能或者芯片科技水平。畢竟ATOM就算凹了這么多年同頻性能依然打不過65nm的CORE2,而且進入10nm之后為了迎合大小核設計英特爾也在強行拉長ATOM核心流水線加大架構設計提高IPC和最高頻率的同時讓ATOM失去了高能效的優(yōu)勢。
隔壁龍芯群的用戶有人指出3A5000全核性能依然在J4125或者N5095的水平,整體性能其實并不能趕上兆芯19年發(fā)布的KX6000的八核產品和陸家嘴四核產品性能水平相當。咱不知道這個話對不對,但是咱從之前龍芯吧小吧主的視頻能看出來龍芯圈一直在試圖證明3A5000和兆芯或者飛騰的八核產品具有相同甚至更好的使用體驗,但是如果龍芯群的這個信息為真,那么從實際性能水平來看龍芯和其他國產的性能水平并不能拉開差距,甚至劣于X86小核心。唯一能拿得出手的參數(shù)恐怕就是大核心架構占優(yōu)的IPC了。

不過就算IPC可以打贏英特爾也沒什么用,小眾指令集主打一個中看不中用,隔壁A17就算成精了打得過I7了也開不了SolidWorks,這么多年申威深耕ALPHA國產超算也出過類似的國產個人電腦產品但是終究沒能普及也是一樣的道理,沒有用戶就沒有軟件,沒有生態(tài)就沒有用戶,鴻蒙這么多年過去軟件生態(tài)也不過好于當年的WP,由此來看要想打破生態(tài)困局沒有什么全國Windows安卓IOS設備都被強制遠程鎖機之類的事件發(fā)生應該是很難了。安卓被禁用鴻蒙也依然兼容AOSP,MIPS撤銷授權LoongArch也依然能100%兼容MIPS,如此看來未來如果X86之類的架構授權面臨同樣的情況難說有設計能力的企業(yè)不會有樣學樣進行一波操作。
本質上兆芯的陸家嘴是和英特爾ATOM GEMINILAKE N4100定位相似的產品,靠的都是提升能效比降低架構面積提升核心數(shù)量快速提升性能。隔壁ARM的飛騰D2000據(jù)信只有類似ARM A72的架構水平。卻很快靠堆出64核產品喜提制裁認證,這個認證甚至早于長江寒武紀,這可不是因為飛騰有吊錘英特爾的IPC。手中擁有AMD ZEN1 IP核的海光更是和華為一批被制裁認證,ZEN的IOD CCD設計可以實現(xiàn)快速提升核心數(shù)量提升整體性能水平。而ZEN1的IPC今天看來并不是很高。

以今天的眼光來看,龍芯的3AX000應該是把類似兆芯KH40000的產品提前發(fā)布了。帶L3的大核心架構以及當代來看較新有國產化替代的14/16nm工藝,還有就是可以快速堆核的設計,這些都是RYZEN以來現(xiàn)代CPU的比較常見的特性,所以如果各位看到龍芯吧小吧主的視頻不用懷疑,應該知道龍芯圈是在用自己的最新產品對比其他國產芯片(兆芯飛騰)的前代產品,因此無論優(yōu)劣這個對比過程的本質都是這樣的。至于飛騰的FTC663咱已經(jīng)搞到了,不過不是現(xiàn)存最新20年發(fā)布的騰銳D2000而是和KX6000同為19年的FT2000/4,架構基本一樣的,不影響測試,有空看下情況吧。
就這樣,謝謝朋友們!