最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【知乎】高性能CPU設(shè)計(jì)為什么很難?

2023-11-13 16:38 作者:Bili_394329148  | 我要投稿

高性能CPU設(shè)計(jì)為什么很難?


Qianlong


你贊同過 處理器 相關(guān)內(nèi)容

我曾經(jīng)在幾家研發(fā)高性能CPU的公司做過研發(fā)工作,例如中晟宏芯(現(xiàn)在合芯科技)、華芯通等,其發(fā)展不算順利,對(duì)于高性能CPU為何很難這件事淺談一點(diǎn)自己的看法, 拋磚引玉。

暫定高性能CPU的分?jǐn)?shù)以SPEC CPU 2006 speed 單線程測(cè)試15分/GHz劃線,該參數(shù)可以直接衡量CPU設(shè)計(jì)團(tuán)隊(duì)的微結(jié)構(gòu)設(shè)計(jì)能力,高于此的歸類為高性能服務(wù)器CPU。本文所說的高性能CPU,指的是單核單線程每GHz性能,因?yàn)橹挥羞@個(gè)才能體現(xiàn)真正的微結(jié)構(gòu)設(shè)計(jì)能力, 而且CPU運(yùn)行時(shí)主頻不是固定的, 睿頻也沒法持續(xù), 睿頻后跑的總分也沒法用來公平比較, 用該參數(shù)衡量是各家CPU vendor的公認(rèn)標(biāo)準(zhǔn)。多核分?jǐn)?shù)像是打群架,只要核夠多就把多核分?jǐn)?shù)堆上去。SPEC官網(wǎng)上的多核分?jǐn)?shù)測(cè)試常年被日本霸榜,就是因?yàn)樽儜B(tài)的小日子組了成千上萬個(gè)CPU板卡連起來跑了個(gè)分,nonsense。

先說結(jié)論:高性能CPU作為“皇冠上的明珠”,沒有后發(fā)優(yōu)勢(shì),不可能彎道超車,更不可能一步到位。唯一能做好的辦法就是埋頭苦干,實(shí)踐出真知。

  1. 完全從頭重寫高性能CPU需要的周期很長,舉幾個(gè)例子感受下:

(1)高通之前的1000人QDT研發(fā)團(tuán)隊(duì),在第二代core還不一定能夠到15分,然而第一代就經(jīng)過了兩年多的研發(fā)(約10分/GHz),第二代研發(fā)(內(nèi)測(cè)性能提升30%+)進(jìn)入尾聲又過去了兩年,后來因?yàn)槎聲?huì)不同意繼續(xù)撒錢,項(xiàng)目徹底砍掉不了了之。

(2)Apple M1中的Firetail core(大約22分/GHz),是從2010年的Apple A4(基于ARM Cortex A8)一直迭代到現(xiàn)在的產(chǎn)物,相關(guān)研發(fā)人員具體我不清楚,但幾百人肯定是有的。

(3)龍芯上一代3A5000是10.x分/GHz,這一代3A6000是15分/GHz,最新一代微結(jié)構(gòu)性能提升了50%,這個(gè)性能已經(jīng)達(dá)到了全球范圍內(nèi)的第一梯隊(duì),至少墊墊腳能看到前面的AMD、Intel、Apple了。走到這一步龍芯堅(jiān)持了21年,值得讓人尊敬。很多人看不起龍芯,全國范圍內(nèi)所有CPU設(shè)計(jì)公司,注意是所有,有哪家設(shè)計(jì)的CPU單線程性能超過了龍芯?

(4)鯤鵬920,大概10分/GHz,其中的圖靈核是從2010年開始組建團(tuán)隊(duì)研發(fā)。圖靈核團(tuán)隊(duì)還在繼續(xù)自研core,我相信性能肯定會(huì)進(jìn)一步提升,但是由于制裁導(dǎo)致產(chǎn)品不能流片,這里不做推測(cè)和介紹。

曾經(jīng)跟IBM和Qualcomm的架構(gòu)師交流,如果把他們架構(gòu)師核心團(tuán)隊(duì)原班人馬拉出來,重新組織團(tuán)隊(duì)設(shè)計(jì)新的高性能CPU,沒有兩代(4-5年)也不可能達(dá)到目前AMD和Intel的最高水平。

有人說,買了最新IP消化吸收再創(chuàng)新行不行?依然很難,中晟宏芯、華芯通、海光、還有幾家買ARM N2,這幾家都是這種思路,哪家已經(jīng)做到了修改代碼隨心所欲不逾矩?RTL與應(yīng)用軟件的區(qū)別就在此。

2. 國內(nèi)在高性能CPU微結(jié)構(gòu)設(shè)計(jì)方面的積累和人才不夠。

這里的人才不是說我們不夠聰明,而是我們?cè)谶@個(gè)方向上踩過的坑不夠多。我們的工程師,勤奮聰明肯吃苦,但是在高性能CPU微結(jié)構(gòu)方面的積累,全球只有美國、以色列兩個(gè)地方算是最深入,ARM的高性能核設(shè)計(jì)甚至也要仰仗于美國的研發(fā)團(tuán)隊(duì)。

CPU微結(jié)構(gòu)(可以認(rèn)為是狹義的計(jì)算機(jī)體系結(jié)構(gòu))的基礎(chǔ)知識(shí)不算很難,體系結(jié)構(gòu)方向的碩士普遍就能入門甚至有較好的掌握,難得是如何把微結(jié)構(gòu)設(shè)計(jì)的巧妙、均衡,我們?cè)诖朔矫娴姆e累距離蘋果、AMD、Intel還有些差距。我國從2010年左右才開始涉足高性能CPU的設(shè)計(jì),之前自研的CPU都偏中低端,因此差距就是我們?cè)诟咝阅蹸PU涉及領(lǐng)域踩得坑不夠多。這就像一個(gè)槍手,剛開始只練習(xí)手槍(中低端)射擊,直接給他巴雷特很可能打不好,何況子彈(踩得坑)不管飽。

高性能CPU的研發(fā),需要不停的迭代,打磨。CPU就是藝術(shù)品,需要長時(shí)間對(duì)所有細(xì)節(jié)進(jìn)行詳細(xì)打磨,需要客戶不停的反饋問題,推動(dòng)設(shè)計(jì)修改,如果沒有客戶使用,問題無法暴露出來,那么提升也就非常慢。

3. 高性能CPU設(shè)計(jì)沒法彎道超車,沒有后發(fā)優(yōu)勢(shì)

有些人張口就來,我們有后發(fā)優(yōu)勢(shì),我們要彎道超車。但這是有條件的。后發(fā)優(yōu)勢(shì)體現(xiàn)在,前面有人幫你踩了坑、淌了路,并且你看到了記住了學(xué)會(huì)了,這時(shí)候再去干就知道哪些能干哪些不能干。能完成高性能CPU設(shè)計(jì)的公司,CPU微結(jié)構(gòu)的探索過程、PPA的優(yōu)化過程絕對(duì)是內(nèi)部極度保密的資源,不會(huì)輕易讓你看到、學(xué)到。IBM為了開發(fā)性能探索用的模擬器,甚至先開發(fā)一門“T語言”,這不可能公開。當(dāng)年中晟宏芯買來的IBM的M1模擬器就是T語言編寫,但是只給你加密后的二進(jìn)制,付費(fèi)也不給源碼,不僅如此,core的微結(jié)構(gòu)文檔大幅刪減,想讀懂他們VHDL寫的源碼需要花費(fèi)大量時(shí)間;華芯通買到的高通代碼不僅沒有微結(jié)構(gòu)文檔,甚至連斷言都給你刪掉;更不用說美國政府限制的高性能浮點(diǎn)模塊不允許出口,這些花多少錢也買不到。為什么這些不給?教會(huì)徒弟餓死師傅。看不到他們的經(jīng)驗(yàn),何來后發(fā)優(yōu)勢(shì)?

再說彎道超車。彎道超車的關(guān)鍵在于換賽道啊同學(xué),你看我國汽車產(chǎn)業(yè)彎道超車,是不是換了老外們積累不夠深入的新能源賽道上?這些高性能CPU能行么?答案是不行。高性能CPU設(shè)計(jì)就這一條道,沒有新賽道,從1980年代往后,體系結(jié)構(gòu)領(lǐng)域開始進(jìn)入蓬勃發(fā)展期,現(xiàn)在使用的很多微結(jié)構(gòu)改動(dòng)的idea都是參考那些年代的論文,這個(gè)賽道沒有新鮮事,沒有另辟蹊徑,只能想盡各種辦法把微結(jié)構(gòu)做的精致,提升單線程性能。沒有其他道路可走,怎么彎道超車?如果沒有新能源電動(dòng)車,國產(chǎn)車還是很難超過合資汽油車。

對(duì)于高性能CPU設(shè)計(jì)而言,如果你聽到有人說出彎道超車、后發(fā)優(yōu)勢(shì),默默心里罵一句sx就行了。

4. 設(shè)計(jì)高性能CPU know-how很難

有人說體系結(jié)構(gòu)不有四大頂會(huì)ISCA、MICRO、HPCA、ASPLOS,為啥不從里面學(xué)習(xí)?首先這些論文的質(zhì)量參差不齊。很多中了頂會(huì)的論文也是在灌水,不信你可以看看當(dāng)年那件轟動(dòng)體系結(jié)構(gòu)圈的新聞(學(xué)生由于論文數(shù)據(jù)問題想撤稿,但是導(dǎo)師不允許,學(xué)生自殺),據(jù)我的讀論文經(jīng)驗(yàn),頂會(huì)中的論文,可信度雖然比其他會(huì)高,但是數(shù)據(jù)要打折,實(shí)驗(yàn)環(huán)境要打折,結(jié)論要打折,具體打多少折扣得自己花時(shí)間驗(yàn)證。其次,復(fù)現(xiàn)這些論文并驗(yàn)證結(jié)論是一件非常耗時(shí)的事情,要不然體系結(jié)構(gòu)領(lǐng)域的博士生畢業(yè)都很困難呢,我在之前的一篇博文中提到過(大齡讀博)。再次,有些好的idea由于學(xué)生畢業(yè)時(shí)間倉促等原因反而沒有投到頂會(huì),從這些論文中讀出金子需要大量人力和時(shí)間,絕對(duì)算得上沙子里面淘黃金,Intel的研究院有很多預(yù)研人員做這些事,我國目前除了少數(shù)幾家有相關(guān)預(yù)研人員,其他公司還未曾聽說有這方面投入。最后,很多論文中很漂亮的idea,評(píng)估效果也不錯(cuò),但是真正落到芯片中代價(jià)太大,例如面積太大、時(shí)序緊張等,但是嘗試把新feature落到產(chǎn)品的周期都要以年為單位計(jì)算。

5. 很多公司不愿意投入去設(shè)計(jì)新的高性能CPU core,造不如買。自己設(shè)計(jì)出來的core,10分/GHz,買來的20+;自己設(shè)計(jì)要投入十幾億甚至幾十億資金,周期還長,不如直接買來省錢便捷。


那怎么才能設(shè)計(jì)出真正的高性能CPU呢?我也不知道,只能從失敗的經(jīng)驗(yàn)判斷大概有那么幾條:

  1. 融資足夠或者產(chǎn)品能迭代起來有利潤,只有這樣才能養(yǎng)得起研發(fā)團(tuán)隊(duì)長期投入??匆幌履壳皣鴥?nèi)做的比較好的CPU設(shè)計(jì)公司,特點(diǎn)都是公司有利潤、產(chǎn)品能賣得出去,沒有資本愿意長期投入不考慮回報(bào),只有自己能造血才可以長久。

  2. 人員要穩(wěn)定,CPU設(shè)計(jì)不像應(yīng)用軟件,上手很慢,看著文檔理解代碼都很難。之前看過一篇描述Adobe屎山代碼沒法改的文章,與其類似自行腦補(bǔ)。

  3. 領(lǐng)頭人(或者技術(shù)負(fù)責(zé)人)必須要懂CPU設(shè)計(jì),外行堅(jiān)決不行。曾經(jīng)有個(gè)自認(rèn)為很懂ASIC的領(lǐng)導(dǎo)定目標(biāo),要自研CPU吊打AMD和Intel,研發(fā)團(tuán)隊(duì)經(jīng)過討論后我去匯報(bào),我說需要100個(gè)人,三年開發(fā)兩代產(chǎn)品(我已經(jīng)是覺得資源很緊張了,而且只是打算對(duì)標(biāo)A76),對(duì)方站起來來了一句“不make sense”摔門而去,我心里也只能默念一句sx。。。一個(gè)好的技術(shù)負(fù)責(zé)人,往上能頂住來自不懂行的sx的瞎指揮,不要讓這種無意義的瞎指揮影響研發(fā)進(jìn)度和研發(fā)工程師的心態(tài);往下能安排好項(xiàng)目進(jìn)度,對(duì)于各研發(fā)人員的技術(shù)能力做到了如指掌,對(duì)項(xiàng)目難度和計(jì)劃做到心中有數(shù),自己的名聲還要足夠大且能力足夠強(qiáng),否則無法招聘到能力合適的員工,說白了你自己不行就不可能招聘到行的人?!拔娜讼噍p”在這一行表現(xiàn)比較明顯,有人覺得我自己技術(shù)牛逼,看不起其他人,但是CPU是需要通力合作才能做好的項(xiàng)目,負(fù)責(zé)人還要有能力按住這些人,不要鬧內(nèi)訌。

  4. 少一點(diǎn)內(nèi)斗,再少一點(diǎn)。目測(cè)創(chuàng)業(yè)公司中因?yàn)閮?nèi)斗直接或間接死掉的不低于30%吧,即使還沒倒的,內(nèi)斗也一直在持續(xù)。

  5. 想盡辦法找市場(chǎng),賣不出去就沒法回籠研發(fā)資金,也就沒法讓研發(fā)人員持續(xù)深入的死磕微結(jié)構(gòu)改進(jìn)。研發(fā)人員對(duì)于市場(chǎng)的認(rèn)識(shí)很差,總感覺的我自己技術(shù)牛逼,做出來就不怕沒人買,實(shí)際情況是越是高科技越要做好銷售,因?yàn)榭蛻艨赡懿欢愕募夹g(shù)細(xì)節(jié),要千方百計(jì)服務(wù)好客戶才能獲得訂單,千萬不要覺得“酒香不怕巷子深”。

以上幾個(gè)條件,融資和市場(chǎng)是基礎(chǔ),其他部分是頂層建筑,缺一不可。

在我看來,真正高性能CPU(世界第一梯隊(duì))微結(jié)構(gòu)設(shè)計(jì)的難度和重要性,不亞于5G、光刻機(jī),只是目前暫時(shí)沒有因?yàn)檫@個(gè)卡脖子。如果未來我們買不到任何一款國外高性能CPU芯片,買到的IP授權(quán)也不允許繼續(xù)使用(國內(nèi)能買到ARM N2的IP),作為信息時(shí)代最重要基礎(chǔ)設(shè)施的國產(chǎn)云未來怎么辦?

評(píng)論區(qū)有人噴我說單核單線程性能是按照每GHz,意思是我不懂主頻是什么意思?這里強(qiáng)調(diào)單核單線程每G分?jǐn)?shù),是為了強(qiáng)調(diào)微結(jié)構(gòu)設(shè)計(jì)的能力,而且,CPU運(yùn)行時(shí)不是定頻,因此CPU vendor公布很多IP都會(huì)以每GHz表示其性能高低(有的會(huì)同時(shí)展示其總分),例如SiFive公布其P870可以達(dá)到SPEC 2006 17分/GHz, 噴子肯定不是CPU設(shè)計(jì)從業(yè)人員,因?yàn)镃PU designer都懂這些指標(biāo)的意義,但凡多看幾個(gè)CPU vendor ppt也不至于拿這一點(diǎn)噴. naive。

還有人噴龍芯造假,對(duì)于每個(gè)CPU設(shè)計(jì)公司而言,都會(huì)有配套的編譯器團(tuán)隊(duì),那些所謂沒造假的CPU設(shè)計(jì)公司為什么不去改編譯器?況且編譯器隨著CPU設(shè)計(jì)進(jìn)行改動(dòng)本身也是一家CPU設(shè)計(jì)公司的基礎(chǔ)能力,Intel ICC編譯器號(hào)稱benchmark編譯器你們就不噴了?這就像說UFC小鷹拳擊不行,只是地面功夫厲害,那你倒是打得過他啊?naive。


編輯于 2023-11-09 09:43

發(fā)布一條帶圖評(píng)論吧


64 條評(píng)論

默認(rèn)

最新

常成

猜測(cè)答主經(jīng)過2次失敗,已經(jīng)遠(yuǎn)離了CPU設(shè)計(jì)領(lǐng)域。對(duì)國內(nèi)幾支處理器核設(shè)計(jì)團(tuán)隊(duì)目前的進(jìn)展基本一無所知。就拿海思圖靈來說,繼tsv110之后,已經(jīng)研發(fā)了3代核心,最新的核心性能對(duì)標(biāo)Apple的A13。另一支研發(fā)兼容ARM指令集的團(tuán)隊(duì),則在去年公開了最新核心性能,已經(jīng)與N2相當(dāng)。

08-23?·?IP 屬地湖南

Qianlong

作者

我一直奮戰(zhàn)在一線,也在海思工作過,也跟圖靈核的一些研發(fā)熟悉,沒量產(chǎn)的CPU就沒寫出來。

08-24?·?IP 屬地北京

常成

Qianlong

那我猜錯(cuò)了,失敬,失敬。上述兩個(gè)團(tuán)隊(duì)都遭遇了A國多輪禁運(yùn),所以相當(dāng)?shù)驼{(diào)。其實(shí)都是有產(chǎn)品的,只不過出于低調(diào)幾乎沒有宣傳,基本不為外人所知而已。

08-24?·?IP 屬地湖南

開心的小福

我看有些年輕人噴龍芯垃圾 不理解

08-23?·?IP 屬地上海

Xi Yang

蠢而已。這種領(lǐng)域能幾乎全靠自研做到二流水平,已經(jīng)是非常非常厲害了。

08-24?·?IP 屬地北京

開心的小福

Xi Yang

同意。。他們言必稱riscv。。

08-25?·?IP 屬地上海

回旋的電子

哥,這里有個(gè)錯(cuò)別字

08-23?·?IP 屬地廣東

回旋的電子

Qianlong

老哥,最近那篇文章的評(píng)論怎么關(guān)了

08-24?·?IP 屬地廣東

Qianlong

作者

改了,謝謝

08-24?·?IP 屬地北京

當(dāng)時(shí)若見得

那這么說看來你很看好龍芯了,你說的這些基本只有龍芯是一步不落在做的

08-24?·?IP 屬地黑龍江

常成

龍芯的成績吹的很兇

:其實(shí)全靠編譯優(yōu)化。上一代3A5000如果使用開源主線源碼只做兼容性適配構(gòu)建的編譯器,其性能大概8分/Ghz,3A6000目前還沒有人做過類似測(cè)試,如果按編譯優(yōu)化對(duì)3a5000成績提升的比例來算,3a6000大約13分/Ghz。雖然已經(jīng)不錯(cuò)了,但和其宣傳的分?jǐn)?shù)比差了不止兩個(gè)檔次。

08-23?·?IP 屬地湖南

南風(fēng)

你邏輯反了,cpu 才是核心科技。。。 cpu 提供了優(yōu)化指令集,編譯器沒用,那是編譯器的問題,何況龍芯也在往 gcc 提交代碼。等著唄,等主線 gcc 也能針對(duì)龍芯優(yōu)化的很好,你就閉嘴了

08-24?·?IP 屬地北京

維生素面包

小朋友,是編譯器跟著CPU走,不是CPU去適應(yīng)編譯器

08-24?·?IP 屬地北京

白飛夢(mèng)

別說你CPU了,現(xiàn)在其他IT領(lǐng)域都是這個(gè)樣子,產(chǎn)品剛出來甚至還沒有出來都沒有經(jīng)過市場(chǎng)的檢驗(yàn),就開始秒天秒地了,真讓人無語。

08-24?·?IP 屬地重慶

乙亥生人

原來單核單線程的性能是指每g分?jǐn)?shù) 學(xué)習(xí)了,果然大牛

08-24?·?IP 屬地廣東

peakyboi

感覺這個(gè)作者并不是內(nèi)行

,太不專業(yè)了

11-08?·?IP 屬地四川

okfine

100人團(tuán)隊(duì)用3年時(shí)間經(jīng)過2代產(chǎn)品做出高性能CPU,這個(gè)平心而論,雖然領(lǐng)導(dǎo)不懂行,但是一般人也覺得這是在吹牛。啥技術(shù)負(fù)責(zé)人到最后都得背鍋。

08-25?·?IP 屬地北京

Qianlong

作者

當(dāng)時(shí)技術(shù)討論其實(shí)是兩代后對(duì)表標(biāo)A76

08-25?·?IP 屬地北京

隨便逛逛

看了內(nèi)行人的文章,才知道龍芯的不易和成就。。

08-24?·?IP 屬地江蘇

污污污

高通已經(jīng)買了nuvia團(tuán)隊(duì),是蘋果之前的CPU團(tuán)隊(duì)

08-24?·?IP 屬地江蘇

Qianlong

作者

高通把自己的QDT團(tuán)隊(duì)1000多人砍掉,過幾年又收購一家Nuvia,這就像是覺得自己的手不好用,砍掉再接個(gè)假肢。完全是因?yàn)橘Y方短視的問題,后來發(fā)現(xiàn)砍掉是錯(cuò)的,又趕緊買一家。中晟宏芯、華芯通都是這樣,現(xiàn)在都重啟了。

08-24?·?IP 屬地北京

無名

Qianlong

大佬,現(xiàn)在華芯通改成改成中安辰鴻了,這個(gè)公司如何?。靠孔V不?

09-20?·?IP 屬地廣東


【知乎】高性能CPU設(shè)計(jì)為什么很難?的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
方山县| 哈密市| 华池县| 伊宁县| 炎陵县| 虎林市| 永州市| 唐山市| 武冈市| 方山县| 什邡市| 夏河县| 旌德县| 城口县| 成安县| 青阳县| 那坡县| 靖西县| 西城区| 合川市| 如东县| 灵寿县| 漠河县| 栾城县| 岳西县| 都安| 金山区| 密云县| 原阳县| 旌德县| 盖州市| 鹤峰县| 鄯善县| 永新县| 化德县| 罗山县| 万安县| 新昌县| 海兴县| 新营市| 广宁县|