論兆芯的提升:從兆芯C到兆芯D(國產(chǎn)X86能自主設(shè)計架構(gòu)嗎?)
前作:論兆芯的提升:從兆芯A到兆芯C(國產(chǎn)X86技術(shù)源自何方)
本作主要論證從兆芯C到兆芯D(KX5000)的提升以及國產(chǎn)X86是否能自主設(shè)計架構(gòu)
官網(wǎng)參數(shù):



簡單來說,兆芯KX5000系列處理器產(chǎn)品是兆芯在幾步走方案里面的第三步

兆芯官方的定義是主要實現(xiàn)了內(nèi)核性能優(yōu)化(更換架構(gòu))提高多核芯片的整體性能(堆核,原生八核)解決訪存帶寬瓶頸(取消南北橋與FSB總線)以及支持了DDR4內(nèi)存,相比前代的提升是明顯可見的,主要完成的是向全集成化解決方案邁進,性能的提升反倒是次要的。
當然實際上這個問題還是存在的。KX5000在完成前主工程師離職,因此很多部分還沒有完成不得不以半成品的形式發(fā)布,實際上19年發(fā)布的KX6000才應(yīng)該是五道口架構(gòu)的完全版,原計劃KX6000應(yīng)該只是KX5000的換工藝版但是實際上由于半成品的原因所以KX6000也做了很多原本應(yīng)該在28nm節(jié)點就完成的修改

從圖片可以看到KX5000的核心面積相當大,基本趕上了AMD的早期四核了(AM3 FM1之類的),至于IPC提升25%咱只希望是咱不能簡單理解為同頻性能的IPC,因為實際跑分(象棋)來看同頻性能相比兆芯C只提升了10%,并沒有那么多,包括KX5000的內(nèi)存訪問帶寬也沒有提升那么高,這些都是跑分中能實際看出來的問題


無論是使用集顯獨顯單通道雙通道內(nèi)存,讀寫跑分都只有10G左右的水平,實際相比兆芯C+的提升也就25%-40%那樣吧
PPT上宣傳的這個提升實際上要到KX6000才能實現(xiàn),所以咱看來可能還是因為是有半成品的原因存在吧。沒準按照KX6000的水平制造28nm版本就能達到宣傳了也說不定

至于CPU架構(gòu)和互聯(lián)結(jié)構(gòu)雀食換了,流水線從20級縮短到了15級,少了5級,這對于超頻比較不利但是有利于提升同頻性能,實際上三發(fā)射改為雙發(fā)射精簡了核心這里沒提,但是精簡核心會降低核心面積的同時降低同頻性能,因此需要靠提升能效堆核來解決整體性能問題消除劣勢。至于改進分支預(yù)測與亂序執(zhí)行這些都暫且不提,都是提升同頻性能比較常見的操作。

可以看到相比兆芯C+的膠水雙四核的八核明顯是更加科學(xué)合理的設(shè)計,四核為簇內(nèi)部點對點外部使用IF總線簇間連接,四核一簇這對于小核心來說是很常見的結(jié)構(gòu),英特爾現(xiàn)在的大小核或者純小核就存在這個結(jié)構(gòu),而華為的鯤鵬920也使用了四核為簇然后多簇之間之間用環(huán)形總線連接的結(jié)構(gòu),它們都能有效的實現(xiàn)多核互連因此多核效率是不存在問題的。


話雖這么說膠水核心也不是不能用,就是對北橋的負載會高些核間延遲也會高些,但是全核整體性能的提升還是有的,英特爾當年在775時代就用膠水四核打贏了AMD的真四核,所以凡是不能絕對,如果膠水沒用也就不會出了。




兆芯在C+時代膠水八核之后發(fā)布了ZX-100S芯片組,其中包括集成集顯C320和不含集顯的兩種型號


從圖片上來看,我們明顯可以發(fā)現(xiàn)ZX100S相比原S3大陸團隊(后來的兆芯初始團隊)設(shè)計的VX11H芯片組的面積更大、功耗更高,內(nèi)存支持更高擴展接口更多。后者可以認為是常規(guī)升級,前者的提高明顯不像正向升級,考慮到兆芯C+ FC1080膠水核心的存在可能就好理解了,膠水核心由于數(shù)據(jù)交換經(jīng)過北橋會顯著提升北橋功耗也就是發(fā)熱,原來5.8W的芯片組很可能抗不住,雖然從威盛時代就已經(jīng)實現(xiàn)了集成南北橋。


不過現(xiàn)在的MCM膠水封裝其實理論上已經(jīng)不算膠水核心了,DIE間互連用的都是高速總線類似AMD用IF總線,相比數(shù)據(jù)交換經(jīng)過北橋的老膠水現(xiàn)在的CCD IOD結(jié)構(gòu)和全單DIE基本在使用中看不出來區(qū)別。兆芯下代KX7000可能會使用這種CCD IOD分立結(jié)構(gòu),也算是降低成本提升良率的一種不錯的辦法了。

兆芯到了KX5000其實已經(jīng)可以認為是取消了北橋的,原先由南北橋芯片組實現(xiàn)的功能已經(jīng)大量集成進核心了。留下的ZX-200與其說是南橋其實更像個PCIe功能擴展芯片。

從這里也可以看到五道口并不是完整版的成品,C860核顯并不支持HDMI2.0,支持4K60只能靠DP,然而打不輔助板沒有DP,而且KX5000雖然把南北橋集顯集成聲卡內(nèi)存控制器PCIE控制器SUPERIO SPI都搬進了核心里但是還沒有實現(xiàn)完全的SOC化,像是SATA控制器(正常由南橋集成)USB3.0控制器 專門連接有線網(wǎng)卡的吉比特介質(zhì)獨立接口Reduced Gigabit Media Independent Interface (RGMII)都仍然需要ZX200擴展芯片連接


ZX200,TDP=6W,40nm,基于PCIe3.0×4的擴展芯片
當然今天回頭來看如果不用ZX200擴展芯片用其他的PCIe轉(zhuǎn)接方案也是一樣可以用,SATA不要了還可以直接走PCIe的NVME啟動,網(wǎng)卡也可以直接連PCIe USB擴展卡也自然可以,威盛或者其他方案的也非常便宜,問題是到筆記本就不太好玩了,這些如果都沒法通過單芯片解決就會顯得比較復(fù)雜。

倒不是說筆記本加南橋就一定不行,就是顯得非常的累贅增加成本和故障率之類的,能全集成肯定比不能強

無論怎么說,KX5000是兆芯成立以后完全自主設(shè)計的架構(gòu),用來證明兆芯擁有CPU IP的設(shè)計能力是沒問題的。無論水平如何至少可以獨立完成設(shè)計,這就夠用了。


KX5000 DIE SHOT(核心照片)
整體來說KX5000的核心面積還是相當不小的,除了原生四核變成原生八核以外相當一部分面積是原來的南北橋的功能,比如內(nèi)存控制器集顯IO之類的,所以相比之前看起來很迷你的CPU就顯得很大了。

原來的核心面積是真的小,畢竟CPU只負責(zé)運算,其余的數(shù)據(jù)交換全部通過南北橋芯片組實現(xiàn),而現(xiàn)在幾乎全部都要交給CPU了,這就是所謂的SOC化,system on chip片上系統(tǒng)。

但是由于是半成品結(jié)果SOC化并不完全,所以到了KX5000這代就顯得CPU又不是特別強面積大良率也不見得高而且還得掛像是南橋?qū)嶋H上只能算是個PCIe擴展芯片的玩意,集成但是又沒完全集成,CPU提升又沒完全提升(最高主頻依然2.0G,同頻性能提升是有但是并不算特別大,只能說全系八核真正起到了作用,相比很難買到的服務(wù)器定位產(chǎn)品真正的普及了八核),八核只有I3 6100的性能水平但是好歹能用


最后是PPT的路線圖,可以看到當時說后續(xù)未來發(fā)布的陸家嘴代號KX6000的原定時間在2018年,而實際上卻是Q2'19,而直到22年Q4兆芯依然還在發(fā)布陸家嘴架構(gòu)的KX6000G,提升集顯性能和改進CPU物理設(shè)計的小改產(chǎn)品,KX7000至今仍未發(fā)布。
所以最后引用隔壁UP的視頻原話作為結(jié)尾吧:
兆芯沒有那么厲害只是一個工資低職員經(jīng)常被挖成立剛到10年初始團隊是2000年后原via在大陸的研發(fā)芯片組的分部畢業(yè)碩士博士組成的cpu專職研發(fā)人員曾經(jīng)一度不到100人的國臺合資中小公司,但確實有自主研發(fā)能力。能研發(fā)芯片組cpu微架構(gòu)gpu圖形芯片, 只能說盡可能尊重真正為國家發(fā)展高新產(chǎn)業(yè)的人,好人不多別讓人寒心了。能給你日常使用的x86 cpu和顯卡即使是雞肋也比沒有要強。
咱只想說引進吸收的磁懸浮列車再好再自主再先進那不是我們坐得起的,真正能帶你日常安全高效的出行的永遠是輪軌高鐵動車組。隔壁性能再強不支持X86上不了高鐵線路啊,有車沒地方跑有什么用,而且實際性能怎么樣還不好說,安全穩(wěn)定之類的不提成本就受不了。哪怕兆芯目前的水平?jīng)]有CR400AF CR400BF的水平但是至少也有CR300AF的水平了,速度不是很快那也比CR200J 25T的速度強啊,同樣賣D字頭的票價有這個體驗還想怎么辦,總比隔壁都上不了路還敢賣那么貴有用啊。就算其他高鐵動車組全下馬了或者買不到技術(shù)拉地鐵電車上來用也不會全國開磁懸浮線路的。在這行生態(tài)就是一切,蘋果iMac過去用摩托羅拉IBM的powerPC不行,現(xiàn)在用ARM一樣半死不活。
能力有限,研發(fā)投入不高,體量不大,這些都是現(xiàn)實。但是這些不是一個或者兩個小體量初創(chuàng)公司的問題,而是戰(zhàn)略投入的問題,沒有足夠高的研發(fā)投入做什么都是困難很大的了,只有從基礎(chǔ)教育抓起提高人才數(shù)量未來可能還是會有希望的。所以一些人與其作為某一種國產(chǎn)芯片的粉絲去攻擊質(zhì)疑其他國產(chǎn)芯片不如做好自己,哪怕多做些科普工作提高大眾的知識水平都比說某某擠牙膏某某沒有自主技術(shù)然后吹自家芯片多好有用,就像任正非說的,多為國家生產(chǎn)一個土豆都是做出貢獻,多說一句話浪費別人的耳朵是吧。