【知乎】后摩爾時(shí)代的“芯”路,中國的燎“原”之火
后摩爾時(shí)代的“芯”路,中國的燎“原”之火

猛練自然強(qiáng)
一個(gè)不會寫軟文的段子手不是好投資經(jīng)理!
2021年12月,在中美關(guān)系最嚴(yán)峻一年的年末,芯片巨頭英特爾的一封信炸了鍋,激起中國人的巨大憤慨。英特爾在信中表示“需要確保我們的供應(yīng)鏈不使用任何來自新疆地區(qū)的勞工、采購產(chǎn)品或服務(wù)”。一石激起千層浪,各方面紛紛指責(zé)英特爾是在危險(xiǎn)邊緣試探,是自尋死路的瘋狂行為。

針對美國等西方國家污蔑新疆存在“強(qiáng)迫勞動”,中國早已表達(dá)嚴(yán)正立場:這是一個(gè)世紀(jì)謊言。個(gè)別西方政客特別是美國政客,鼓噪所謂的“強(qiáng)迫勞動”,實(shí)質(zhì)是打著人權(quán)的幌子搞政治操弄,干涉中國內(nèi)政,遏制打壓中國特別是新疆的發(fā)展。明眼人都知道這是赤裸裸的誣陷,但英特爾高管依然聽信了美國政客的說辭。早在今年7月,就有美國政客拿新疆問題逼Airbnb、可口可樂、英特爾、寶潔以及Visa等5家美國企業(yè)表態(tài),其他公司都含糊其辭,但只有英特爾高管明確表達(dá)聲稱相信美政府結(jié)論:“我研究過它,所以我相信這份報(bào)告的結(jié)論?!?/p>
這顯然是對中國的最大冒犯。
得罪中國顯然沒有好果子吃,廣大網(wǎng)友紛紛表示不再購買英特爾的產(chǎn)品和服務(wù)。英特爾廣告則被滿屏的“AMD,Yes!”的嘲諷彈幕刷屏。
雖然AMD也是美國公司,但是由于AMD的CEO蘇媽這位華裔傳奇人物的原因,廣大中國網(wǎng)友對AMD有更多的好感。

雖然英特爾口碑跌倒谷底,但是從現(xiàn)實(shí)來看,目前在CPU領(lǐng)域英特爾處于領(lǐng)先地位,但是AMD也緊追不舍。根據(jù)市場調(diào)研機(jī)構(gòu)Mercury Research的數(shù)據(jù)顯示,2021年第三季度,AMD在X86 CPU市場上的整體份額環(huán)比增加了2.1個(gè)百分點(diǎn),達(dá)到24.6%,這是AMD歷史上第二高的紀(jì)錄,15年前該公司曾創(chuàng)下最高紀(jì)錄25.3%,雖然AMD現(xiàn)階段依然小弟,但是正在快速蠶食英特爾的份額。
雖然兩家公司競爭激烈,不過AMD也是美國公司,在CPU領(lǐng)域國內(nèi)雖然也有海光、兆芯、華為鯤鵬、天津飛騰等公司,但是相比之下依然有著巨大的差距,這個(gè)領(lǐng)域美國依然強(qiáng)大。
回顧這兩家公司的斗爭歷史,是否有值得借鑒的歷史意義?中國在這個(gè)領(lǐng)域要如何追趕美國?
16年前,曾經(jīng)AMD最輝煌的年代是如何把英特爾逼到手忙腳亂?這次歷史能否重演?在后摩爾時(shí)代,中國半導(dǎo)體要如何和歐美強(qiáng)國抗衡,遠(yuǎn)方的“芯”路上,誰能逐鹿中“原”?是否有一家公司能夠讓眾多小伙伴能夠站在其肩膀上眺望遠(yuǎn)方,與歐美巨頭一爭高下?
在后摩爾時(shí)代的遠(yuǎn)方的“芯”路,中國如何讓希望之火燎“原”?
全文34000字。
英特爾和AMD的江湖恩怨(一)——初期的甜蜜
如果英特爾是這個(gè)星球上最可怕的商業(yè)對手,宛如一條巨龍,而AMD則是挑戰(zhàn)巨龍的無畏騎士!
翻開半導(dǎo)體歷史,有這么一家半導(dǎo)體公司絕對是最具傳奇色彩,那就是仙童(Fairchild)。
1956年,威廉肖克利和巴丁,布拉頓三人因?yàn)榘l(fā)明晶體管,榮獲諾貝爾物理學(xué)獎。而寫下《半導(dǎo)體空穴與電子》巨著的肖克利博士也被譽(yù)為“晶體管之父”。于是肖克利博士創(chuàng)辦的肖克利半導(dǎo)體一時(shí)風(fēng)頭無二,引來眾多青年才俊前來工作學(xué)習(xí)。雖然肖克利博士是技術(shù)大牛,但是缺乏管理才能,而且脾氣不好,為人刻薄,不僅氣跑了巴丁和布拉頓兩位大佬,更是引來徒子徒孫們的不滿。后來有八個(gè)人一起辭職,拿了一個(gè)做攝影器材公司的一筆風(fēng)投資金,創(chuàng)立了一家半導(dǎo)體歷史上最傳奇的公司——仙童,肖克利博士得知后氣的大罵“你們這些叛徒”,這就是有名的“仙童八叛逆”故事。

仙童在成立后突飛猛進(jìn),成為炙手可熱的公司,但是后面由于和股東經(jīng)營理念上的差別,導(dǎo)致日后仙童也出走諸多精英,這些人日后創(chuàng)立了一家又一家的半導(dǎo)體公司,四處開枝散葉,給行業(yè)輸送了大量的人才,因此仙童被稱為世界半導(dǎo)體領(lǐng)域的“黃埔軍?!?。如今不少公司都成長為行業(yè)巨無霸,成為芯片領(lǐng)域舉足輕重的公司,比如英特爾和AMD,英特爾的創(chuàng)始人諾伊斯和戈登摩爾,以及AMD創(chuàng)始人拉里桑德斯曾經(jīng)都在仙童工作過,也算是老同事了。
雖然創(chuàng)始人都在同一個(gè)老東家工作過,但是雙方恩怨頗深。
AMD和英特爾在初期都曾有過甜蜜期,雙方攜手打天下,但是在上世紀(jì)90年代,英特爾收回X86 CPU的授權(quán)后,雙方迅速交惡,前前后后斗了二十多年。面對英特爾的咄咄逼人,AMD從未退縮,哪怕AMD比英特爾渺小的多,在與英特爾長達(dá)8年的專利訴訟中,AMD從未屈服。AMD創(chuàng)始人兼CEO頂著標(biāo)志歪鼻子的桑德斯,不止一次的站在法庭上怒斥英特爾的種種不公,把不服和倔強(qiáng)寫在臉上,最終迫使英特爾達(dá)成和解,因此AMD也被人稱為最勵(lì)志最頑強(qiáng)的半導(dǎo)體公司。

最初英特爾是做內(nèi)存起家的,并不是做CPU,而AMD的初期策略則是跟隨和模仿,作為第二供應(yīng)商,只要客戶有需求,有什么做什么。
在CPU的道路上,當(dāng)初最強(qiáng)的就是“藍(lán)色巨人”IBM,IBM發(fā)明CPU后,將其CPU專利授權(quán)給英特爾,讓它幫助自己一起擴(kuò)大商業(yè)版大,于是英特爾利用IBM的技術(shù)授權(quán)推出了第一塊16位CPU 8086,這款CPU讓英特爾一戰(zhàn)成名,在IBM后續(xù)的個(gè)人電腦中,也是用了英特爾的處理器,讓英特爾確立在PC市場的霸主地位。
為了防止英特爾一家獨(dú)大,IBM后面又扶持了另外一家公司,就是現(xiàn)在的AMD。一開始是英特爾和AMD是合作關(guān)系的。當(dāng)時(shí)英特爾的8086處理器的產(chǎn)能不足,為了保證生產(chǎn),在1982年的時(shí)候與AMD合作生產(chǎn)8086。
上世紀(jì)80年代,微軟贏得IBM PC的大訂單,在其整個(gè)發(fā)展史上都是至關(guān)重要的,PC走入千家萬戶迅速發(fā)展。不過,IBM深知,如果CPU訂單給一家供應(yīng)商,勢必造成尾大不掉。為此,IBM要求第一供應(yīng)商將自家技術(shù)授權(quán)給第二供應(yīng)商AMD,必須形成“我開放,你也開放”的局面。當(dāng)時(shí)可供選擇的微處理器廠商至少有摩托羅拉、國民半導(dǎo)體、仙童半導(dǎo)體、英特爾、AMD等。但為拿下IBM的訂單,英特爾和AMD迅速走向聯(lián)合——英特爾授權(quán)AMD生產(chǎn)X86系列處理器,AMD放棄自家競爭產(chǎn)品,作為第二供應(yīng)商聯(lián)合向IBM供貨。
此次多方合作一舉奠定微軟在操作系統(tǒng)上的地位,也奠定了英特爾和AMD在X86芯片上的地位,尤其奠定了“Wintel”模式在PC時(shí)代的獨(dú)霸天下。
在于IBM的合作中,讓英特爾逐漸看到PC行業(yè)的巨大潛力,于是把CPU作為核心業(yè)務(wù)。這種戰(zhàn)略轉(zhuǎn)變讓英特爾開始謀求獨(dú)家供應(yīng),并與AMD生了嫌隙——1987年AMD被英特爾提前結(jié)束80386系列芯片技術(shù)授權(quán)。
AMD將英特爾告上法庭,但官司延宕了5年。到1992年時(shí),AMD被判獲勝,獲得賠償并獲得386的任何知識產(chǎn)權(quán),包括X86指令集。盡管AMD贏得官司,但判決的執(zhí)行又被英特爾拖延到兩年多以后的1995年。
前后七八年時(shí)間,英特爾在1985年推出386、在1989年推出486系列芯片、在1993年推出586,即奔騰1代,席卷整個(gè)PC市場,1993年還發(fā)起Intel inside的強(qiáng)化品牌運(yùn)動,讓“燈,等燈等燈”的魔性聲音深入人心。

在長達(dá)七八年的訴訟中,AMD差點(diǎn)錯(cuò)過了PC發(fā)展的黃金期,所幸AMD贏得了X86指令集的永久知識產(chǎn)權(quán),于是1990年代初開始大力自主研發(fā),盡管在1991年成功仿制386并將之命名為AM386,隨后又成功仿制了486,但由于產(chǎn)品技術(shù)和性能的代際落差,AMD逐漸落后。
英特爾和AMD的江湖恩怨(二)—— AMD的逆襲
在CPU發(fā)展過程中,英特爾推出“唯主頻論”,意思是誰家CPU主頻高,誰的CPU性能就強(qiáng),這招近乎洗腦的營銷手段簡單粗暴但是很有效,對于并不專業(yè)的消費(fèi)者而言,無腦選頻率高的就行。AMD與英特爾的較量中,1GHz的大關(guān)便成了雙方必爭的陣地,于是雙方都鉚足勁更早推出主頻超過1GHz的產(chǎn)品。最終AMD在1999年推出K7構(gòu)架的雷鳥,先于英特爾的奔騰3讓自家CPU主頻邁過1GHz大關(guān),盡管這款CPU還需要額外轉(zhuǎn)接卡,實(shí)際上并賣出多少,但是確實(shí)讓AMD在市場關(guān)注度方面一炮走紅。緊接著K7構(gòu)架的毒龍,速龍等品牌深入人心,但是英特爾迅速反擊,除了比較糟糕的奔騰3 1.13G之外,后續(xù)同檔次的CPU主頻均超過AMD。

因?yàn)锳MD當(dāng)時(shí)的制造水平不如英特爾,所以在雖然在“主頻爭奪戰(zhàn)”上AMD落了下風(fēng),但是AMD構(gòu)架上的也具有一定優(yōu)勢,所以盡管AMD CPU主頻不如英特爾但是綜合性能并不弱,但是消費(fèi)者并了解。于是為了更好地宣傳,AMD干脆放棄采用主頻給產(chǎn)品命名的方法,全部采用PR標(biāo)稱法,比如速龍3000+,實(shí)際頻率其實(shí)只有2.4GHz,但是看起來似乎和英特奔騰4 3.0差不多。AMD K7系列芯片的大賣讓2000年的銷售額達(dá)到46億美元,K7構(gòu)架經(jīng)典款的“巴頓2500+”以700元出頭的售價(jià)與高出自己一倍價(jià)格的奔4 2.4G性能相當(dāng),這是AMD歷史上最輝煌的一戰(zhàn)。
2004年,AMD K8構(gòu)架橫空出世,這是一款劃時(shí)代的經(jīng)典作品。隨后的首款64位速龍系列,讓AMD乘勝追擊,當(dāng)時(shí)AMD在臺式機(jī)市場占有50%以上的份額,這是AMD歷史上首次在市場份額上超越英特爾。
AMD K8構(gòu)架有多達(dá)16個(gè)版本,從最早130nm制程的Sledgehammer 核心到最后一版65nm的Sparta核心,接口包括Socket 745/939/940/AM2等,特別是940和AM2接口,很多舊主板幾乎都可以通過刷BIOS升級的方式兼容新CPU,對比英特爾出一款新CPU就要換一套主板相比,可謂天地良心。
期間涌現(xiàn)出Athlon 64 3000+、Athlon FX-57 、Athlon X2 3600+/3800+、Athlon 64 X2 5000+等多款經(jīng)典產(chǎn)品,極具性價(jià)比的策略一度將英特爾奔騰系列按在地上摩擦。
為什么在當(dāng)時(shí)英特爾CPU主頻遠(yuǎn)遠(yuǎn)高于AMD,但是實(shí)際應(yīng)用上性能卻相差無幾,因?yàn)锳MD的K8構(gòu)架中將主板北橋中的內(nèi)存控制器整合到CPU內(nèi),極大提高CPU與外界數(shù)據(jù)吞吐能力,堪稱天馬行空般的創(chuàng)造力。
熟悉電腦的朋友都知道,老式主板是分南北橋的,其中南橋芯片負(fù)責(zé)外部設(shè)備I/O接口(輸入輸出),比如硬盤,USB,聲卡,PCI槽等部件等;北橋芯片則負(fù)責(zé)CPU與內(nèi)存以及顯卡之間的通信,其中FSB(Front Side Bus)前端總線程負(fù)責(zé)最關(guān)鍵的CPU和內(nèi)存之間的通信,即數(shù)據(jù)沿CPU——北橋芯片(FSB)——內(nèi)存的路徑來回傳輸。

在早期,CPU的外頻和FSB的頻率保持同步。即外頻頻率=FSB頻率,舉例賽揚(yáng)300A的外頻為66MHz,那么它的FSB頻率也是66MHz。而到了奔騰4時(shí)代,F(xiàn)SB總線速度已經(jīng)無法滿足CPU的帶寬需求,于是英特爾引入了Quad Pumped Bus技術(shù),讓FSB在一個(gè)周期內(nèi)可以傳輸四倍的數(shù)據(jù)。于是FSB的帶寬公式變成:FSB頻率=外頻頻率*4,比如333MHz的外頻的CPU,其FSB等效頻率為333*4=1333MHz。
同時(shí)內(nèi)存技術(shù)經(jīng)過一系列演變,從SDRAM內(nèi)存到DDR1代內(nèi)存,雖然時(shí)鐘頻率變化不大,但是由于DDR1內(nèi)存在一個(gè)時(shí)鐘頻率內(nèi)的上行和下行可以各傳輸一次數(shù)據(jù),因此等效速度翻倍;到DDR2時(shí)代,變成傳輸2次,速度再次提高一倍,因此 DDR2 800核心頻率是200MHz,等效工作頻率800MHz,對應(yīng)帶寬6.4G/sec,標(biāo)稱PC 6400。

隨著數(shù)據(jù)處理量越來越大,CPU和內(nèi)存之間數(shù)據(jù)交換激增,F(xiàn)SB則變成性能瓶頸,弊端顯露無疑,為什么不能讓CPU內(nèi)部直接和內(nèi)存連接呢?這樣CPU的處理效率就能大幅提高。于是AMD在K8構(gòu)架上首次提出新型總線結(jié)構(gòu),創(chuàng)新性的將內(nèi)存控制器集中到CPU內(nèi)部,讓CPU和內(nèi)存直連,大大提高了數(shù)據(jù)交換效率,這個(gè)技術(shù)就是AMD當(dāng)年吊打英特爾的殺手锏——HyperTransport, 簡稱HT總線技術(shù)。
HT最早叫“閃電數(shù)據(jù)傳輸”Lighting Data Transport ,LDT。是一種高速、雙向、低延時(shí)、點(diǎn)對點(diǎn)、串/并行兩用的高速帶寬連接技術(shù)。事實(shí)上英特爾早年也做過這樣的方案,在最早奔騰4配套主板82810芯片上,獨(dú)創(chuàng)了Hub Link技術(shù)來連接南北橋芯片,以發(fā)揮 Ultra DMA 66傳輸芯片的芯片組,但是也僅僅用在南北橋信號互聯(lián)上,未進(jìn)一步發(fā)揮。

AMD在當(dāng)時(shí)已經(jīng)看到,CPU,北橋,內(nèi)存之間捉急的效率,急需新的總線技術(shù)來滿足巨量的數(shù)據(jù)傳輸,迫切的需要實(shí)使用新技術(shù)來抗衡英特爾。1999年,HT總線聯(lián)盟成立,AMD參與其中,后來這個(gè)陣營里有NV,ATI,IBM等大佬支持。HT總線技術(shù)對外開放,而改進(jìn)則由聯(lián)盟內(nèi)的大佬進(jìn)行。而HT總線具有恐怖的傳輸速率。最早的1.0版本推出時(shí)間是2001年,它的雙向傳輸速率最大就達(dá)到了12.8GB/s,雖然AMD用的單路16位遠(yuǎn)遠(yuǎn)沒有達(dá)到這個(gè)速度。而同時(shí)期的英特爾還在使用老態(tài)龍鐘FSB總線,533MHz下只有4.3GB/s的傳輸帶寬,高下立判。而HT總線有多個(gè)版本,HT3.1總線發(fā)布于2008年,最大帶寬為51.2GB/s,這個(gè)數(shù)據(jù)即便放到今天也是很可怕的,現(xiàn)在顯卡用的PCI-Express X16 接口雙向帶寬僅為32GB/s。而HT總線同樣不僅僅用于CPU和內(nèi)存之間通信,包括AMD的多路CPU之間也把HT做為內(nèi)部總線,而思科更是把HT總線技術(shù)丟到了自家路由器和交換機(jī)上,大大提升了交換機(jī)的多路傳輸性能。
至于PCI-E發(fā)展這么多年還是一副老樣子,甚至還不如十多年前的HT總線帶寬來的大,這里牽涉到英特爾的核心利益,后文有詳細(xì)講解。
HT技術(shù)大獲成功,并且在CPU從單核到多核路線上,HT顯示出強(qiáng)悍的性能,依靠HT總線,CPU的內(nèi)部多個(gè)處理單元能夠及時(shí)高速傳輸海量的數(shù)據(jù),HT技術(shù)讓AMD突飛猛進(jìn),而英特爾則節(jié)節(jié)敗退。
在CPU從單核走入多核心的過程中,面對AMD的窮追猛打,英特爾倉促應(yīng)對拿出第一款雙核產(chǎn)品——奔騰D 820,然而這掀起一場“真假雙核”的爭論。因?yàn)橛⑻貭栔皇呛唵蔚陌褍蓚€(gè)奔騰4 630的裸芯粒封裝到了一個(gè)基板上,CPU之間進(jìn)行數(shù)據(jù)通信竟然要經(jīng)過北橋芯片來進(jìn)行交換而不是內(nèi)部直連。雖然這款CPU有高達(dá)2.5億晶體管,主頻也高達(dá)2.8GHz,(當(dāng)時(shí)單核CPU只有1-1.2億個(gè)晶體管)但是根本發(fā)揮不了1+1>2的作用,被網(wǎng)友戲稱為“膠水雙核”,而且發(fā)熱量巨大,效果奇差無比,這一仗英特爾輸?shù)捏w無完膚。

AMD的HT總線就像一條新建設(shè)的雙向八車道的高速公路,CPU與內(nèi)存之間,CPU內(nèi)部各個(gè)核心之間,都由HT總線串聯(lián)起來,使得整個(gè)系統(tǒng)的效率有著極大提高,而英特爾的FSB則依然是一條堪比印度農(nóng)村的破馬路嚴(yán)重制約著CPU的性能,由此可見這條總線“芯路”有多重要!

有總線和沒有總線,有好的總線和沒有好總線,芯片的性能可謂天差地別!
英特爾和AMD的江湖恩怨(三)——精密的戰(zhàn)爭機(jī)器
被逼到絕境的英特爾終于發(fā)現(xiàn)自己之前給民眾洗腦的CPU“唯主頻論”開始反噬自己。之前因?yàn)椤拔ㄖ黝l率”,只要主頻高,CPU就是性能好的理念灌輸下,為了提高CPU主頻,英特爾不斷給CPU增加流水線級數(shù),這樣主頻就能更容易的提高,因此在奔騰4的Prescott核心中設(shè)計(jì)了史無前例的超長31級流水線。雖然CPU主頻被不斷提高到接近4GHz,但是其實(shí)應(yīng)用中大家發(fā)現(xiàn)CPU效率并沒有太多提高,反而因?yàn)闃O高的主頻帶來巨大的功耗和發(fā)熱,被各種吐槽,典型的高耗低效,英特爾騎馬難下。
因?yàn)榫薮蟮陌l(fā)熱量,Presscott 核心系列奔騰4被戲稱“烤箱”。最終,時(shí)任英特爾CEO貝瑞特在6000多人面前驚天一跪,承認(rèn)英特爾走錯(cuò)了路,并宣布放棄4.0G主頻的產(chǎn)品,奔騰4 4.0G胎死腹中,NetBurst構(gòu)架被徹底放棄,落得貽笑大方。

經(jīng)歷過奔騰系列的失敗,英特爾痛定思痛,放棄了Netburst構(gòu)架,放棄“唯主頻論”切到“功效論”上。同時(shí)提出了“Tick-Tock”(鐘擺策略),每一次“Tick”代表著一代微架構(gòu)的處理器芯片制程的更新,而每一次“Tock”代表著在上一次“Tick”的芯片制程的基礎(chǔ)上,更新微處理器架構(gòu)提升性能。兩者交替更新,一般一次“Tick-Tock”的周期為兩年,“Tick”占一年,“Tock”占一年。

認(rèn)真的英特爾像一臺精密的戰(zhàn)爭機(jī)器,是地球上最可怕的商業(yè)對手。經(jīng)過一些系列的動作,英特爾將劣勢逐漸扳回。
在新構(gòu)架方面啟用了迅馳筆記本平臺的奔騰M系列CPU的設(shè)計(jì)團(tuán)隊(duì)——即名噪一時(shí)的以色列海爾法團(tuán)隊(duì)。該團(tuán)隊(duì)此前在迅馳筆記本平臺大獲成功,奔騰M的CPU占領(lǐng)了90%的市場。于是英特爾決定把該構(gòu)架移植到所有PC平臺和移動平臺。該團(tuán)隊(duì)重新設(shè)計(jì)一款CPU,核心代號Merom,Merom其實(shí)只是一款過渡產(chǎn)品,隨后Core構(gòu)架出現(xiàn),第一款是桌面處理器核心代號“Conroe”,這就是大名鼎鼎的酷睿2!

在Core構(gòu)架設(shè)計(jì)上,英特爾吸取Netburst的失敗教訓(xùn),在Coro構(gòu)架上的每個(gè)環(huán)節(jié)都比過去的CPU更大更寬,它的向量和標(biāo)量執(zhí)行單元要比過去的Netburst構(gòu)架大的多。更大的DL解碼邏輯電路、更大的RBS重排序緩存、更大的RS預(yù)留緩存、更大的數(shù)據(jù)輸出口,更多的晶體管、更多的緩存,英特爾把一系列強(qiáng)大的硬件條件集合在了Core一體,最重要的是兩個(gè)核心共享一組L2緩存,不再像奔騰D 820一樣還需要依靠FSB來交換數(shù)據(jù),甚至還優(yōu)于用HT總線做互聯(lián)總線構(gòu)架的AMD,CPU整體性能有了大幅提高。

但是英特爾依然還是采用原來的FSB總線,只是不斷的把總線頻率提高,從800MHz到1066MHz,再到1333MHz,盡管FSB總線不如HT總線來的高效,但是由于英特爾的在Core構(gòu)架方面的做出巨大的改進(jìn)而得以讓CPU性能有了巨大的提升。在工藝方面,有著更深厚制造底水平蘊(yùn)的英特爾就比AMD強(qiáng)的多了,因此擁有更先進(jìn)HT總線的AMD也只是和英特爾打成平手。
在這個(gè)期間除了英特爾認(rèn)真應(yīng)對之外,AMD在戰(zhàn)略上面出現(xiàn)了一定的偏頗。
2006年AMD做出了一個(gè)大膽的決定,斥巨資54億美金收購ATi,轟動業(yè)界。這次收購案如果從實(shí)際效果來看,算自己給自己挖了一個(gè)大坑,但是不能否認(rèn)AMD超前的思維。
當(dāng)時(shí)收購前的競爭格局是:AMD與英特爾在CPU上競爭,ATi與英偉達(dá)在GPU上競爭。而英偉達(dá)和AMD是關(guān)系不錯(cuò)的合作伙伴,英特爾和ATi則是另外一對。
英偉達(dá)推出的nForce系列主板芯片與當(dāng)時(shí)AMD的王牌產(chǎn)品Athlon的組合是很多DIY玩家津津樂道的搭配,比如經(jīng)典的巴頓2500+配合nForce2 Ultra(灑家當(dāng)年的配置),僅僅以1500元出頭的價(jià)格,吊打2300多的P4 2.4C+i865的組合,極具性價(jià)比。后面Athlon 64 X2 3600+配nForce 4 SLi是當(dāng)時(shí)的最強(qiáng)王炸組合,SLi雙顯卡交火平臺帶來超強(qiáng)的性能,特別是在游戲體驗(yàn)上,要想玩的爽,十個(gè)頂級發(fā)燒友會有十二個(gè)人告訴你,別問,問就是上SLi 雙顯卡平臺!

ATi也和英特爾打的火熱,ATi和英特爾進(jìn)行交叉授權(quán),英特爾的高端雙顯示卡平臺就是用的ATi的交火平臺(Cross Fire)。最終形成“AMD+英偉達(dá)”對抗“英特爾+ATi”。AMD和英偉達(dá)也算是互相成就。
但是不知怎么想的,突然之間AMD把ATi給娶了。這次交易好比是AMD當(dāng)著自己的女朋友英偉達(dá)的面,搶了英特爾的女朋友ATi。此后AMD與英偉達(dá)反目成仇,關(guān)系一落千丈,而此前和英特爾合作愉快的ATi,也因?yàn)锳MD合并而終止了合作,全部成為赤裸裸的競爭關(guān)系。唯一的好處是兩家姓A的公司合并,“A卡”依然叫“A卡”,稱呼未變。

雖然AMD在產(chǎn)品策略上也推出的APU產(chǎn)品(融合了CPU與GPU的功能于一體),也是以這次并購為基礎(chǔ),但是實(shí)際上市場上叫好不叫座,未取得理想中的預(yù)期。而且 AMD不得不在CPU和GPU兩條線上分別與不同的強(qiáng)敵競爭,疲于奔命。這對于從研發(fā)資源和市場資源的層面都不占優(yōu)的AMD來說無疑是捉襟見肘。
歷史上雙線作戰(zhàn)基本都沒什么好果子吃,兩面豎敵十分致命。AMD低估了并購造成的競爭格局,而競爭格局的變化后的壓力則是給AMD帶來更大的困難。
此后的十年,成為AMD沒落的十年,最慘的時(shí)候落得一個(gè)“i3默秒全”的稱號,i3默認(rèn)秒你全家!

這一仗英特爾大獲全勝。
雖然英特爾從產(chǎn)品到市場策略上全面壓倒了AMD,但是英特爾也沒閑著,對自家的FSB總線早就不滿意了,開始醞釀著新的總線了。
根據(jù)“木桶理論”,一個(gè)木桶能裝多少水取決于最短的木板。英特爾清楚的意識到,F(xiàn)SB已經(jīng)成為整個(gè)系統(tǒng)最大的短板,單純的提高外頻并不能徹底解決短板,急需一種新型總線來替代老舊的FSB,于是英特爾開發(fā)了一款新型總線——QPI 。
Qucik Path Interconnect,簡稱QPI,意為快速通道互聯(lián),在2008年的新一代Nehalem處理器上提出,英特爾表示QPI總線技術(shù)會取代陪伴多年的FSB總線,成為新一代CPU與CPU之間,CPU與芯片組之間,CPU與內(nèi)存之間的連接總線,一經(jīng)發(fā)布便引起極大關(guān)注。

其實(shí)QPI總線在此前已經(jīng)用于安騰以及至強(qiáng)的服務(wù)器平臺上,用于取代老舊的FSB,隨后加入桌面級Nehalem處理器中。和HT總線一樣,QPI總線一樣是點(diǎn)對點(diǎn)通信,用于CPU,北橋,內(nèi)存,南橋之間的點(diǎn)對點(diǎn)連接。而它的速度也遠(yuǎn)遠(yuǎn)超越了FSB總線。以末代的1600MHz的FSB為例,它的傳輸速度為12.8GB/s,而初版的QPI總線就達(dá)到了25.6GB/s,相比上一代直接翻了一倍。
隨著英特爾新處理器的上線,更好的構(gòu)架,更強(qiáng)的總線,以及領(lǐng)先對手的先進(jìn)制程,多管齊下后的英特爾奪回失地,而AMD因?yàn)轭l繁更換CEO,收購ATi面臨雙線作戰(zhàn)的巨大壓力,K10構(gòu)架設(shè)計(jì)能力雖堪稱天馬行空,CPU和APU融合看起來很美好,但是實(shí)際效果不達(dá)預(yù)期,以及拆分后格羅方德羸弱的制造水平拖累AMD等多方面原因,此后的十年變成AMD沒落的十年,最慘的時(shí)候AMD的股價(jià)只有1.6美金,市值從高峰跌去95%,僅剩英特爾的零頭。
而贏的關(guān)鍵戰(zhàn)役的英特爾,開始選擇躺贏,反正AMD已經(jīng)給不了太多威脅,在沒有太多競爭壓力情況下,英特爾每一代產(chǎn)品僅比上一代做了微小的改進(jìn),提升速度就和擠牙膏似的,但是售價(jià)則提高不少,于是落得一個(gè)“牙膏廠”的外號。

英特爾又回到獨(dú)霸天下的狀態(tài),風(fēng)雨飄搖的AMD怎么辦?
英特爾和AMD的江湖恩怨(四)—— 鳳凰涅槃的AMD
硅谷最有權(quán)勢的女人
在AMD50多年發(fā)展史上,迄今為止共經(jīng)歷了5任CEO,其中,創(chuàng)始CEO桑德斯任職時(shí)間最長,到2002年AMD進(jìn)入高速發(fā)展時(shí)期卸任。其身后,魯毅智任職6年到2008年,經(jīng)歷由盛轉(zhuǎn)衰,2008年7月離任時(shí)已經(jīng)連續(xù)7個(gè)季度虧損。德克.梅耶爾2008年下半年臨危受命,但在兩年多以后未能止住AMD的頹勢,黯然離職,并導(dǎo)致AMD CEO在2011年上半年空缺長達(dá)半年之久。直到2011年8月,羅瑞德成為AMD新任CEO,但羅瑞德重復(fù)了前任的故事,最終在2014年底蘇姿豐上任成為CEO,帶領(lǐng)AMD逆境翻盤!
蘇豐姿,Lisa Su,在全世界都是響當(dāng)當(dāng)?shù)娜宋?!她是宅男心中的女王,是全球理工學(xué)子仰望的學(xué)霸,是《巴倫周刊》評出的全球最佳CEO,也是《財(cái)富》雜志上的“2020年全球最有權(quán)勢的女人”。她還是被視作半導(dǎo)體領(lǐng)域的諾貝爾獎——羅伯特·諾伊斯獎歷史上的首位女性獲獎?wù)?,也是第二位華人。
但所有這一切,都比不上那一句“蘇媽”,代表著粉絲們對Lisa Su 的尊重、熱愛、贊美、以及認(rèn)可!

在AMD最危難的時(shí)刻,她放棄在大公司待遇優(yōu)厚的高管職位,選擇接手處在破產(chǎn)邊緣的瀕危公司,并憑借自身卓越的才能,將AMD從死亡邊緣奇跡般地拽了回來。
她帶領(lǐng)團(tuán)隊(duì)開發(fā)出了很多優(yōu)秀的芯片產(chǎn)品,打破了行業(yè)巨頭英特爾長期的壟斷行為,改變了行業(yè)格局,讓AMD重回巔峰,也讓消費(fèi)者用上了更便宜性能更高的芯片,一腳踩爆了牙膏廠,讓“i3 默秒全”恥辱性口號掃進(jìn)歷史垃圾堆。

1969年,蘇媽出生于中國臺灣臺南市,年幼隨家遷至美國。年輕的蘇媽是妥妥的學(xué)霸,考入紐約市三所明星高中之一的布朗克斯科技高中,高中畢業(yè)后考上常春藤名?!槭±砉W(xué)院(MIT),選擇了最難的專業(yè)——電氣工程,1990年MIT本科畢業(yè)后,蘇媽僅僅用了4年時(shí)間一口氣讀完了碩士和博士的全部課程,于是年僅24歲時(shí)的蘇媽就的獲得MIT的電機(jī)博士學(xué)位順利畢業(yè)!

1994年,蘇媽頂著MIT電機(jī)博士的光環(huán)到德儀工作,在德州儀器工作了很短一段時(shí)間后,蘇媽加入了IBM。在IBM的逾10年光陰里,她不僅僅僅帶領(lǐng)團(tuán)隊(duì)進(jìn)行集成電路技術(shù)創(chuàng)新方面的工作,最重要是蘇媽在IBM創(chuàng)奇人物尼古拉斯.多諾弗里奧身邊學(xué)習(xí)到很多優(yōu)秀的管理才能,經(jīng)驗(yàn)以及如何應(yīng)對困難,解決問題的信心和文化。
在IBM,蘇媽有段時(shí)間負(fù)責(zé)開發(fā)了新的互聯(lián)工藝——銅互聯(lián)材料,當(dāng)時(shí)的互聯(lián)工藝制程還是鋁-鎢工藝,于是她立排眾議,主張用銅來代替鋁導(dǎo)線。這是因?yàn)殂~比鋁的電阻系數(shù)要低3倍,而低電阻系數(shù),能夠減少發(fā)熱量,方便未來集成更多的晶體管數(shù)量。
但是銅互聯(lián)材料也面臨一系列的工藝難題,首先銅很容易在二氧化硅上擴(kuò)撒而導(dǎo)致漏電,極容易導(dǎo)致晶體管失效;其次銅無法用干法刻蝕,而且附著性不如鋁,因此銅互連工藝和過去的鋁互連工藝相比難度大不止一丁半點(diǎn)。最終蘇媽最終帶領(lǐng)團(tuán)隊(duì)突破了技術(shù)瓶頸。首先用CVD法形成一層摻入氟離子的二氧化硅,形成FSG的Low-K(低介電常數(shù))材料的緩沖層,同時(shí)刻蝕部分區(qū)域形成形狀,接著再用PVD法(物理氣相沉積)分別沉積成鉭,氮化鉭和銅種子層,再用電鍍法沉積銅溶液形成銅互連,同時(shí)改進(jìn)CMP銅拋技術(shù),解決表面不平整問題,從而進(jìn)一步提高了高晶體管的密度,降低損耗,最終成功實(shí)現(xiàn)讓芯片的性能提升了2倍。這一整套工藝有個(gè)形象而古老的名字——大馬士革工藝,又叫鑲銅工藝,一直沿用至今,成為12英寸金屬互聯(lián)布線工藝的核心,蘇媽功不可沒!
銅互聯(lián)+Low-K工藝在IBM發(fā)明后于1998年推向市場,成為8英寸130nm到12英寸工藝90nm的關(guān)鍵節(jié)點(diǎn)技術(shù),而這次銅工藝革命也影響著當(dāng)時(shí)臺灣兩大代工巨頭聯(lián)電和臺積電的命運(yùn)。最終這場工藝大戰(zhàn)中,臺積電由蔣爸帶著梁孟松等一干得力干將用更好的技術(shù)打敗了聯(lián)電而贏得了勝利。(點(diǎn)贊過千,UP這段歷史)
銅互聯(lián)制程的成功很快讓蘇媽脫穎而出,升任IBM研發(fā)部門主管。隨后IBM撥下一筆經(jīng)費(fèi),研發(fā)Cell Chip。這種早期的異構(gòu)架多核心的解決方案,讓眾多游戲廠商的主機(jī)性能突飛猛進(jìn),索尼的PS3對比PS2性能提升了一千倍!甚至還能處理3D圖形和音效,隨后微軟的X-BOX和任天堂也找上門來,三大游戲廠商都開始使用這套技術(shù)。于是蘇媽又多一個(gè)新稱號:Video Game Technology Queen!游戲女王!
這次開發(fā)異構(gòu)架多核的經(jīng)歷彌足珍貴,也讓蘇媽對異構(gòu)架芯片集成有了更深刻的理解,讓日后AMD和英特爾大戰(zhàn)中絕地翻盤埋下伏筆。
2007年,F(xiàn)reescale Semiconductor(飛思卡爾)邀請?zhí)K媽擔(dān)任首席技術(shù)官。飛思卡爾原本是摩托羅拉的一個(gè)事業(yè)部,曾為阿波羅登月項(xiàng)目生產(chǎn)芯片,后被剝離出去成立新的公司。蘇媽到飛思卡爾之后任CTO,主要負(fù)責(zé)網(wǎng)絡(luò)芯片業(yè)務(wù),最終帶領(lǐng)飛思卡爾在2011年上市,再一次證明了自己的才華。(飛思卡爾后被荷蘭NXP收購,收購?fù)瑫r(shí)NXP為了過反壟斷審查,把自己原來的功率器件業(yè)務(wù)和射頻業(yè)務(wù)拆分也就是現(xiàn)在的安世半導(dǎo)體和安譜隆,后均被建廣資產(chǎn)收入囊中,其中安世賣給了聞泰科技,最近安譜隆賣給了錫產(chǎn)微芯,點(diǎn)贊過千,UP這段故事)
2012年,陷入谷底的AMD,已經(jīng)到了崩潰邊緣,股價(jià)不足1.6美金。
在這種生死存亡的關(guān)頭,AMD花高價(jià)請來了剛剛帶領(lǐng)飛思卡爾上市的蘇媽來救急。
當(dāng)時(shí)恩師多諾弗里奧已經(jīng)從IBM退休,但沒閑著而是進(jìn)入了AMD董事會幫助AMD籌劃扭虧戰(zhàn)略。AMD的問題根深蒂固,但也有一群天才工程師和以及獨(dú)家知識產(chǎn)權(quán),因此急需一個(gè)強(qiáng)有力的領(lǐng)導(dǎo)人帶領(lǐng)AMD脫困,于是多諾弗里奧就請來自己的愛徒蘇媽。
多諾弗里奧回憶道,當(dāng)時(shí)對蘇媽說:“這個(gè)時(shí)機(jī)太適合你了?!?/p>
“您說的太對了?!碧K媽爽快地答應(yīng)下來。
于是蘇媽在2012年離開飛思卡爾加入AMD任CTO。她迅速組建團(tuán)隊(duì),首先在游戲業(yè)務(wù)方面投入資源,幫助AMD做到了這個(gè)領(lǐng)域的老大,憑借這個(gè)業(yè)務(wù)賺取的利潤,減輕了AMD此前連年虧損帶來的壓力,幫助AMD暫時(shí)度過了危機(jī)。
2014年,蘇媽因?yàn)楣ぷ鞒錾珡腃TO升任CEO,帶領(lǐng)AMD第二次鳳凰涅槃。
蘇媽上任之后,經(jīng)過深思熟慮認(rèn)為:“我們擁有世界領(lǐng)先的技術(shù),但我們同時(shí)開發(fā)的產(chǎn)品太多,導(dǎo)致我們沒有明確的目標(biāo)和重點(diǎn)。”
隨后,她提出了AMD公司的三大目標(biāo):打造偉大產(chǎn)品,深化合作伙伴關(guān)系,簡化業(yè)務(wù)運(yùn)營,讓AMD重新聚焦于自身最擅長的CPU和GPU研發(fā),承諾按時(shí)推出新產(chǎn)品。當(dāng)時(shí)AMD并沒有盲目跟從移動端處理器的開發(fā),而是長期聚焦在高性能計(jì)算市場,重點(diǎn)市場包括數(shù)據(jù)中心、個(gè)人電腦、游戲主機(jī)等。面向高性能計(jì)算,爭奪高端市場,逐漸成為AMD發(fā)展的主要策略。
在2017年,AMD憑借推出的全新研發(fā)的"Zen"核心架構(gòu),大獲全勝,打破了英特爾在市場上長期的主導(dǎo)地位。
為什么積貧積弱的AMD在蘇媽帶領(lǐng)下短短幾年時(shí)間就突然大翻盤?
在這個(gè)過程中,蘇媽干了三件非常重要的事:第一、請回幾位技術(shù)大牛,并充分相信他們,讓他們盡情發(fā)揮;第二、芯片制造訂單從格羅方德轉(zhuǎn)移到臺積電,讓AMD的工藝水平追上英特爾;第三、在未來芯片技術(shù)發(fā)展路線上,沒有盲目跟隨英特爾的高集成度的大核SoC路線,而是選擇了多chip的小芯片的路線。
人才引進(jìn)方面,蘇媽邀請了前IBM重臣、曾幫助史蒂夫.喬布斯開發(fā)用于iPhone系列芯片的多諾福里奧擔(dān)任首席技術(shù)官,還引進(jìn)其他明星工程師,其中包括拉加.庫德里。當(dāng)蘇姿豐2015年將AMD所有圖形芯片業(yè)務(wù)整合為一家公司,選擇的負(fù)責(zé)人就是拉加·庫德里。
當(dāng)然最重要的還有辣個(gè)男人,曾經(jīng)AMD輝煌的締造者——Jim Keller
"硅仙人"—— Jim Keller
前文提到過,在“鐘擺策略”下的英特爾猶如精密的戰(zhàn)爭機(jī)器,是這個(gè)世界上最可怕的競爭對手。英特爾在構(gòu)架上和制造工藝方面,遙遙領(lǐng)先于AMD。
怎么辦?
AMD如果還想逆襲那必須拋棄原有的構(gòu)架重新開發(fā)一款新的構(gòu)架,同時(shí)制造工藝上要能和英特爾看齊。
帶領(lǐng)這些天才工程師開發(fā)新構(gòu)架,誰能擔(dān)起這個(gè)重?fù)?dān)?蘇媽的選擇是請回當(dāng)年開發(fā)K7&K8構(gòu)架,以及HT總線技術(shù)的總設(shè)計(jì)師,在硅谷有著“硅仙人”外號之稱的 Jim Keller。

被蘇媽拉過來開發(fā)新產(chǎn)品之后就變成這樣了,暴瘦幾十斤,我很想知道Jim Keller在蘇媽手上到底經(jīng)歷了什么?

Jim keller 外號叫“硅仙人”。
關(guān)于他段子頗多,什么“Jim Keller 站在任何一家公司大門口20秒,就會自動變成高管”,“AMD 有個(gè)按鈕,有難的時(shí)候一鍵就能把Jim keller 召回”……
雖然都是調(diào)侃,但是顯然是對Jim Keller一生化腐朽為神奇能力的極大肯定。
Jim Keller 畢業(yè)于賓西法尼亞州立大學(xué),在那里獲得了電子工程學(xué)士學(xué)位。與其他芯片領(lǐng)域大神常見的動不動就是名校博士生不同,Jim Keller學(xué)位一直就是學(xué)士,但是學(xué)士學(xué)位就有這樣的非凡成就,真乃神人也。
畢業(yè)后,Jim Keller 供職于當(dāng)時(shí)如日中天的DEC公司,并且一干就是15年。
當(dāng)他是一個(gè)芯片新人的時(shí)候,當(dāng)時(shí)在DEC接受培訓(xùn),有人進(jìn)來講了一個(gè)關(guān)于構(gòu)架層次設(shè)計(jì)問題,然后Jim Keller覺得這個(gè)人說的一半有道理,另一半則非常愚蠢,然后就和這個(gè)人開始爭論。一個(gè)小時(shí)后,誰也沒有說服誰,直到這個(gè)人走了,旁邊的人才告訴Jim Keller,那個(gè)人是戈登.貝爾,我們DEC的首席技術(shù)官。
這位戈登.貝爾也是一位技術(shù)大牛,被譽(yù)為“小型機(jī)之父”,還有一個(gè)以他命名的獎項(xiàng),戈登.貝爾獎(GORDONBELL PRIZE),主要頒發(fā)給高性能應(yīng)用領(lǐng)域最杰出成就,通常會由當(dāng)年TOP500排行名列前茅的計(jì)算機(jī)系統(tǒng)的應(yīng)用獲得,中國的太湖之光的應(yīng)用也曾獲得此殊榮。能夠和自家CTO爭論一番也是人才,不過在Jim Keller 眼里才不管你是不是CTO,是不是技術(shù)大牛,說的有道理就贊同,沒有道理就要力爭一番。
在DEC的十五年,Jim Keller 參與和主導(dǎo)了并參與了Alpha 21164和21264兩款處理器的設(shè)計(jì),這兩款處理器影響了很多架構(gòu)師和設(shè)計(jì)者,而他也從“初生牛犢不怕虎”的敢和CTO當(dāng)面爭論的芯片新人成長到一個(gè)可以獨(dú)擋一面的芯片架構(gòu)大師。
(Alpha 成就 Get)
離開DEC之后,Jim keller 開始了他開掛般的人生。
Jim keller先是在AMD擔(dān)任處理器K7&K8的架構(gòu)師,前文提到的K8構(gòu)架中的HT總線技術(shù)就是他的手筆,K8架構(gòu)第一次讓AMD具備了可以和英特爾掰掰手腕的能力,同時(shí)還參與設(shè)計(jì)了X86-64的架構(gòu)設(shè)計(jì),X86-64架構(gòu)使AMD第一次在技術(shù)路線上領(lǐng)先了英特爾,這兩項(xiàng)成就都讓Jim keller名聲大震。
( X86 成就 Get)
隨后Jim Keller 去了sibyte 做基于MIPS的網(wǎng)絡(luò)處理器。后來2004年離職加入P.A. Semi。
(MIPS & Power/PowerPC 成就 Get)
2008年,蘋果出手收購P.A. Semi,Jim Keller也自然成為蘋果公司的員工。在蘋果工作期間,Jim Keller主持設(shè)計(jì)了蘋果A4、A5兩代移動處理器,用在iPhone 4/4s、iPad/iPad2等產(chǎn)品上。而從iPhone 4時(shí)代開始,蘋果引領(lǐng)了整個(gè)智能手機(jī)時(shí)代,成為這個(gè)時(shí)代的巨無霸,其中A4/A5處理器的成功研發(fā),奠定了蘋果自研手機(jī)處理器之路,這讓苛刻的喬布斯都感到非常滿意。要知道蘋果最早的iPhone3的處理器來自于三星,能夠拋開三星,自主設(shè)計(jì)定制自己的處理器這個(gè)是一個(gè)非常大的進(jìn)步,最關(guān)鍵的是在Jim Keller帶領(lǐng)下,蘋果鍛煉出一支實(shí)力強(qiáng)悍的芯片設(shè)計(jì)團(tuán)隊(duì)。自此蘋果手機(jī)的處理器始終保持極高的水準(zhǔn),甚至引領(lǐng)業(yè)界開創(chuàng)64位處理器,并且定義了其中相當(dāng)多的64位指令集。難怪當(dāng)年iPhone 6年代蘋果能把眾多安卓廠商吊著打,這和蘋果先進(jìn)的處理器構(gòu)架以及指令集構(gòu)架方面的優(yōu)勢密不可分,ARM的64位處理器都是我定的標(biāo)準(zhǔn),是我?guī)е魑煌娴模魑幌牒臀野馐滞螅?/p>
(ARM 成就 Get)
2012年,Jim Keller 被蘇媽“一鍵召回”,重回AMD然后繼續(xù)他的封神之路?;貧wAMD后,他開始著手主持設(shè)計(jì)新一代微架構(gòu),代號為:Zen,這是一個(gè)革命性的架構(gòu),這個(gè)架構(gòu)號稱將把AMD處理器性能提升40%。
當(dāng)時(shí)項(xiàng)目組的都覺得這是無法實(shí)現(xiàn)的目標(biāo)。大家都是在這個(gè)行業(yè)的人,都有自己專業(yè)的判斷力,性能突然提高40%?這怎么可能?當(dāng)時(shí)的副總裁Suzanne打電話給Jim Keller說,”Zen“項(xiàng)目組不相信這個(gè)目標(biāo)是合理的,因?yàn)樘鰧?shí)際了,不相信這個(gè)目標(biāo)可以達(dá)成。Jim Keller則回復(fù):我需要一個(gè)會議室和一塊白板。
(可見芯片公司有一塊好的白板有多重要)
當(dāng)進(jìn)入會議室時(shí),面對眾人的質(zhì)疑,他開始舌戰(zhàn)群儒,向大家解釋為什么”Zen“可以做到。
Jim Keller的理念是:AMD已經(jīng)大幅落后于英特爾,但是路線圖并不激進(jìn)。 如果處于落后地位,還按部就班,那么就是死局。因此為了扭轉(zhuǎn)局面,至少要目標(biāo)要定在性能提高40%上,他計(jì)劃把Zen做成一個(gè)大核,讓IPC每個(gè)時(shí)鐘執(zhí)行的指令數(shù)目更多,同時(shí)設(shè)計(jì)新的總線,處理器更大的基礎(chǔ)結(jié)構(gòu)非常重要,保證整體設(shè)計(jì)不弱于英特爾。
會上發(fā)生了激烈的爭論,最終在Mike Clark(AMD功勛元老,AMD企業(yè)院士)力推之下,成功的說服了所有人。 Mike Clark說,雖然過程中有很多困難,但是這些問題都可以解決,并非遙不可及,“我們很難才去說服我們的團(tuán)隊(duì)我們能夠?qū)崿F(xiàn)40%的改進(jìn),這是一個(gè)非常難以實(shí)現(xiàn)的目標(biāo)。但是為了更具競爭力,我們必須實(shí)現(xiàn)!”
最后的故事,大家都知道了,“Zen ”大獲成功,成就AMD第二次鳳凰涅槃。
“Zen”架構(gòu)成為了AMD歷史上又一款著名的架構(gòu),Jim Keller 也獲得了“Zen之父”的美譽(yù)。不過Jim Keller 則謙虛的稱:“我最多算Zen的叔叔,畢竟代碼不是我寫的”。但是確實(shí)團(tuán)隊(duì)在他帶領(lǐng)下脫胎換骨,戰(zhàn)力飆升。
2015年,“Zen”發(fā)布后,好評如潮,AMD大獲成功,只是那時(shí)他已經(jīng)離開AMD,并未看到Zen上市那一刻。盡管Jim Keller 已離開AMD,但是他帶出來的團(tuán)隊(duì)已經(jīng)能夠獨(dú)當(dāng)一面,這保證AMD香火不斷,未來依然有一戰(zhàn)之力。
從Zen到現(xiàn)在最新的Zen5, Jim Keller說出了一個(gè)事實(shí):就是芯片設(shè)計(jì)要考慮長遠(yuǎn),沒有前瞻性的路標(biāo),就會處處受挫,步步落后于對手。芯片的研發(fā)周期,特別是大型芯片的研發(fā)周期在12個(gè)月甚至更長的時(shí)間,從構(gòu)想,設(shè)計(jì),量產(chǎn),市場反饋,短則1-2年,長則更久,因此要看到5年后的芯片形態(tài)就非常重要,這需要Leader有足夠的的遠(yuǎn)見,幸好Jim Keller就是這樣富有遠(yuǎn)見且堅(jiān)韌不拔的家伙。
Jim Keller的理念就是:做正確的事,而不是容易的事,因?yàn)閮H做容易的事,往往就是投機(jī)取巧。
2015年9月,Jim Keller再次離職AMD,這一次是被“鋼鐵俠”埃隆.馬斯克說服,Jim Keller要給特斯拉的自動駕駛研制世界上最好的Ai芯片!這次在Jim Keller在特斯拉工作三年,最終特斯拉的研發(fā)的Hardware 3.0 FSD Ai芯片最終成為業(yè)界最強(qiáng)。
(Ai 芯片成就 Get)
2018年,Jim Keller 入職英特爾。在英特爾,他領(lǐng)導(dǎo)了10000人的工程師團(tuán)隊(duì),這個(gè)記錄很難被打破,由于和英特爾簽署保密協(xié)議的,所以這個(gè)階段Jim Keller到底做了些什么,一直諱莫如深。
2年后,2020年,Jim Keller離開英特爾去創(chuàng)業(yè),擔(dān)任Tenstorrent的聯(lián)合創(chuàng)始人兼任CTO,負(fù)責(zé)Ai方面的創(chuàng)業(yè)工作。Jim Keller這次是在Ai/ML芯片領(lǐng)域的創(chuàng)業(yè)顯額很有信心和激情。一方面是因?yàn)榭捎^的股份,另一方面也有對他忽悠來創(chuàng)業(yè)朋友的承諾。

Jim Keller 除了高瞻遠(yuǎn)矚的把控未來芯片發(fā)展之路外,最重要的是能打造一支一流的設(shè)計(jì)團(tuán)隊(duì),在AMD如此,在蘋果如此,在特斯拉也是如此,強(qiáng)將手下無弱兵!
(卓越的領(lǐng)導(dǎo)力&培養(yǎng)力&組織力 成就 Get)
AMD的殺手锏——Infinity Fabric
在Zen系列上,除了對原有指令集和構(gòu)架的更新,最重要的是,徹底貫徹Jim Keller的理念,即基礎(chǔ)構(gòu)架是最要的!這次又他又拿出新玩意兒,一款新的總線技術(shù)—— Infinity Fabric 總線。
Infinity Fabric 脫胎于原來的HT總線技術(shù),但是和HT技術(shù)并不兼容。相比對外開放的HT總線技術(shù),Infinity Fabric總線則是AMD的專利技術(shù),想要用要必須給AMD交授權(quán)費(fèi)。
Infinity Fabric 總線由傳輸數(shù)據(jù)的SDF(Infinity Scalable Data Fabric)和負(fù)責(zé)控制的 SCF (Infinity Scalable Control Fabric)兩個(gè)系統(tǒng)組成。如果把Infinity SDF比作芯片運(yùn)輸數(shù)據(jù)的血管,Infinity SCF就是芯片的神經(jīng)了。
可以說Infinity Fabric 是AMD這個(gè)時(shí)代的基石,它的傳速速率從30GB/s開始最高可以到512GB/s,這個(gè)水平已經(jīng)超過英特爾的總線了。
AMD有了新的總線構(gòu)架,于是又提出了一個(gè)新的理念:讓不同類型的芯片進(jìn)行異構(gòu)融合。
AMD收購ATi之后,擁有了CPU和APU/GPU技術(shù),但是如何“融合”到一起變成難點(diǎn),因?yàn)镃PU和APU都屬于比較難大型數(shù)字電路,設(shè)計(jì)難,制造也難。因此AMD提出這么一個(gè)設(shè)想:能不能分開設(shè)計(jì)和制造再用一條總線連接到一起?變成一個(gè)組合方案?這樣就能更靈活更高效的拿出產(chǎn)品方案。
于是AMD開始動手,開啟核心模塊化之路。
CCX到CCD的嘗試
首先AMD在銳龍?zhí)幚砥髦凶鲆恍﹪L試,多核CPU的堆疊開始走模塊思路,即CCX到CCD。


CCX是CPU Complex的縮寫,它是AMD Zen架構(gòu)的最基本組成單元,每個(gè)CCX整合了四個(gè)Zen內(nèi)核,每個(gè)核心都有獨(dú)立的L1與L2緩存,核心內(nèi)部擁有完整的計(jì)算單元,不再像此前的推土機(jī)架構(gòu)共享浮點(diǎn)單元,這四個(gè)核心將共享L3緩存,每個(gè)核心都可以選擇性的附加SMT超線程,另外CCX內(nèi)部的核心是可以單獨(dú)關(guān)閉的。

基于Zen架構(gòu)的產(chǎn)品中可以存在多于一個(gè)CCX,其實(shí)非APU的產(chǎn)品內(nèi)部都有兩個(gè)CCX,即使是銳龍5 1500X這樣的四核處理器也是由兩個(gè)CCX所組成的,而銳龍5 2400G這樣的APU和所有的AMD移動處理器內(nèi)部都只有一個(gè)CCX,CCX之間使用高速Infinity Fabric進(jìn)行通信,這種模塊化設(shè)計(jì)允許AMD根據(jù)需求擴(kuò)展核心、線程和緩存數(shù)量,針對消費(fèi)客戶,服務(wù)器和高性能計(jì)算市場推出不同的產(chǎn)品。
嘗到甜頭之后AMD再前進(jìn)一步,在CCX基礎(chǔ)上改進(jìn)出CCD模塊。
CCD是Core Chiplet Die的縮寫,是伴隨新的Zen2架構(gòu)處理器所誕生的縮寫。Zen2架構(gòu)處理器不是一個(gè)封裝在一起的大核心,而是被分為了CCD核心以及I/O核心兩個(gè)部分,其中CCD核心是單純的計(jì)算核心,里面包含兩個(gè)CCX,也就是每個(gè)CCD是8核16線程的,而內(nèi)存、PCI-E、USB以及SATA控制器都被整合到I/O核心里面,而這些核心會被一同封裝進(jìn)一顆銳龍3000系列處理器里面。
然后CCD核心以及I/O核心之間采用第二代Infinity Fabric總線連接,它在擴(kuò)展性、延遲和能效方面都有所提升,總線位寬從256-bit翻倍到512-bit,單位功耗降低了27%之多。AM4平臺上所用的I/O核心最多可與兩個(gè)CCD相連,也就是最多16核,而TR4平臺上所用的I/O核心是可連接8個(gè)CCD的,所以最多可達(dá)64核。

把計(jì)算核心和I/O核心分開這樣的設(shè)計(jì)其實(shí)有點(diǎn)像以前的南北橋設(shè)計(jì),CPU只負(fù)責(zé)計(jì)算,而通信都交給北橋,而南橋則是北橋的一個(gè)手下,只不過AMD現(xiàn)在是把CPU和北橋封裝到一塊PCB上罷了。
雖然這樣設(shè)計(jì)必然會增大延遲,同時(shí)這樣結(jié)構(gòu)并不利于CPU核心與內(nèi)存控制器之間的數(shù)據(jù)交換,作為補(bǔ)救措施AMD增加了Zen 2架構(gòu)內(nèi)的L3緩存,與上代相比直接翻了一倍,并且使用了新的指令預(yù)測機(jī)制,延遲的問題其實(shí)很大程度上已經(jīng)得到了解決。
但是從綜合性能上看,單核損失的性能可以靠堆疊更多的CCD模塊實(shí)現(xiàn),你四核,我就六核,你八核,我就十核,多核心可以帶來的性能巨大提升,雖然看似成本更高,但是因?yàn)樵O(shè)計(jì)難度和制造難度遠(yuǎn)低于競爭對手,反而綜合成本更低,傳導(dǎo)到終端產(chǎn)品體現(xiàn)出更好的性價(jià)比優(yōu)勢,最終實(shí)現(xiàn)逆轉(zhuǎn)。
這種分開設(shè)計(jì),模塊化組合思路被證明是可行的,而這一切都因?yàn)镮nfinity Fabric 總線成為現(xiàn)實(shí)。
接著AMD為了讓CPU,GPU,APU以及其他高性能運(yùn)算核心能夠更好的互相協(xié)同工作。AMD提出了“融合”+“黏合”的概念。
Infinity Fabric 定義了AMD內(nèi)部SoC IP區(qū)塊的通用控制方式,無論是“融合”或是“黏合”都能有一個(gè)條高效,高性能的總線串聯(lián)其各個(gè)核心,滿足海量的數(shù)據(jù)交換。甚至PlayStation4和Xbox One后繼機(jī)種的SoC都可以這樣設(shè)計(jì)。
其實(shí)這就是Chiplet小芯粒的設(shè)計(jì)思路的運(yùn)用。
使用了Chiplets小芯片的設(shè)計(jì)思路,通過用不同的工藝制造后,再來集成到一起。Chiplets設(shè)計(jì)不同于以往的英特爾奔騰D的“膠水雙核”,本質(zhì)上是把不同工藝、不同架構(gòu)的芯片電路按需搭配,比單純的硬拼要高明多了,工藝也復(fù)雜多了,需要運(yùn)用TSV通孔硅技術(shù)和2D/2.5D/3D 封裝技術(shù)。
Infinity Fabric 成為AMD的技術(shù)與產(chǎn)品實(shí)現(xiàn)的基石!
極致性價(jià)比的秘密
總線Infinity Fabric技術(shù)雖好,但是看起來似乎使用比競爭對手更多的核心,成本的問題不可能被忽視,這樣如何平衡性能和成本之間的關(guān)系呢?
上文提到,Zen2中,CCD和I/O實(shí)際上分開生產(chǎn),再封裝到一起。這里AMD又來了次業(yè)界首創(chuàng)。將處理器各種模塊用不同的工藝生產(chǎn)!
比如CCD核心使用7nm工藝生產(chǎn),而I/O核心則采用更為成熟的12nm工藝。所以Zen2是一個(gè)“7+12”的混合制造方案。
在7nm節(jié)點(diǎn)上,一款芯片的流片時(shí)僅支付的IP費(fèi)用高達(dá)3億美元,哪怕對于AMD這樣大公司而言成本也是相當(dāng)昂貴。CPU核心對性能要求高,對功耗也敏感,提升工藝對CPU核心來說大有裨益,好鋼要用在刀刃上,因此核心單元用7nm工藝制造。而I/O核心整合了內(nèi)存控制器、PCI-E控制器等I/O單元,這部分電路對性能、功耗要求沒那么高,而且I/O單元并不容易隨著工藝微縮,所以使用的是相對低一檔的工藝,因此使用改良版的12nm工藝足以。
于是就有這“7+12”的混合工藝制造方案。
這種把各種裸芯片封裝到一起是不是有點(diǎn)眼熟?前文提到過的英特爾奔騰D系列,以及第一代酷睿處理器都使用過這樣的技術(shù),甚至蘇媽早期給游戲機(jī)公司搞的Cell Chip 也有異曲同工之妙。
最重要的是這樣的方案,芯片面積差別太大了,導(dǎo)致成本天差地別,有人會不解,按理用低一檔的工藝不是會導(dǎo)致芯片面積更大嗎?
我們拿英特爾14nm時(shí)期Skylake架構(gòu)的那幾兄弟舉例:
七代i7,原生4C Ring,Die面積為122mm2左右;
八代i7,原生6C Ring,Die面積為153.6mm2左右;
9900K,原生8C Ring,Die面積為180mm2;
11900K:原生8C Ring,Die面積為280mm2,

可以看到,隨著CPU的微架構(gòu)每次帶動IPC/CPI大進(jìn)步的時(shí)候都會帶動微架構(gòu)規(guī)模的暴漲(變得更寬、更深、更多),最終導(dǎo)致CPU Die(裸芯粒)的面積不斷增大。
面積這么大有個(gè)最直接問題——成本奇高無比,同時(shí)也帶來更大的功耗。
晶體管數(shù)量更多,就會使晶粒的面積更大,那么最終在12英寸晶圓上可切割的數(shù)量會更少,而且如果晶圓上某個(gè)點(diǎn)存在缺陷,就會導(dǎo)致這個(gè)面積下的整個(gè)芯粒直接報(bào)廢,因此最終得到的能用的CPU會更少,最終成本居高不下。
在Zen 2架構(gòu)中,一個(gè)chiplets芯片的總面積才74mm2,其中CCX+16MB L3緩存的核心面積才31.3mm2,同比減少了47%,一方面是因?yàn)?nm工藝的密度優(yōu)勢,一方面也跟Zen2的CCX只有CPU核心有關(guān),減少了I/O單元后富裕的空間可以大幅增加L3緩存,因此每個(gè)CCX翻倍到16MB L3緩存,但是CCX核心面積依然減少一半左右。
拿AMD的一個(gè)CCD核心面積只有80mm2都不到和英特爾280mm2的芯片一比,高下立判。同樣一片12英寸的晶圓上切割的可用晶粒的數(shù)量AMD比英特爾多好多倍,因此成本大幅低于英特爾,而且節(jié)省下來的空間就上來更大的L3緩存,更大的緩存帶來性能上的提升也是肉眼可見的!
芯片有三大核心指標(biāo),P.P.A,Performance(性能),Power(功耗),Area(面積尺寸),無論除了性能和功耗,面積也是必須要考慮的問題。面積越大,良率就很容易下降,成本就會上升,因此如何如何不能忽視面積這個(gè)關(guān)鍵因素。
當(dāng)然混合生產(chǎn)之后還要封裝到一起難度也不小,于是AMD的神隊(duì)友來了!
不再坑爹的隊(duì)友
構(gòu)架的問題基本得到解決,新型總線技術(shù)也開始發(fā)揮威力,接著就是芯片制造的問題,畢竟再好的設(shè)計(jì)理念也要造出來才能賺錢。
AMD此前被英特爾吊打的原因,除了核心構(gòu)架設(shè)計(jì)不如英特爾之外,還有一點(diǎn)極其重要的原因就是豬隊(duì)友坑爹的制造水平拖累。

誰?
曾經(jīng)的“女朋友”,格羅方德。

格羅方德之前是AMD的制造部門,在AMD收購ATi之后,將其制造部門拆分,隨后引入阿布扎比先進(jìn)技術(shù)投資公司(ATIC)這個(gè)土豪爸爸后組建了一家新公司——格羅方德,Global Foundries,簡稱GF,戲稱“AMD女朋友”。
雖然從AMD拆分,但是兩家人依然保持良好的關(guān)系。AMD依然把CPU制造的訂單交給格羅方德。但是格羅方德糟糕的工藝水平,拉胯的良率,巨大的發(fā)熱量,以及不確定的交期,總在關(guān)鍵時(shí)刻掉鏈子把AMD坑的不要不要的。再加上AMD不成熟的設(shè)計(jì),于是就造成那幾年AMD與英特爾競爭中處處落下風(fēng)。


蘇媽上臺之后,雖然依然保持和格羅方德合作,但是逐漸把訂單轉(zhuǎn)給了芯片制造水平不弱于英特爾的另外一個(gè)集成電路制造大廠——臺積電,TSMC。

2018年,AMD新產(chǎn)品上市當(dāng)時(shí)EPY、Ryzen都來自格羅方德14nm工藝,當(dāng)時(shí)AMD和臺積電的合作并不深,臺積電的16nm只負(fù)責(zé)少數(shù)半定制APU。Zen2 上來的時(shí)候AMD想使用7nm制程。結(jié)果格羅方德又拉胯了,明確表示放棄7nm先進(jìn)制程的研發(fā)。

無奈之下AMD只能選擇和臺積電加強(qiáng)合作,于是從Zen2開始全面導(dǎo)入臺積電N7以及N7+工藝。(N7+工藝開始導(dǎo)入ASML的EUV光刻機(jī))
結(jié)果大獲成功!
AMD對臺積電的高水平的工藝以及良率贊不絕口,果斷加大投片量,如今成為臺積電最大的客戶之一。
臺積電的N7工藝,特別是N7+業(yè)界第一個(gè)導(dǎo)入EUV光刻機(jī)制程,使得臺積電的制造水平無人出其左右,這樣AMD的7nm芯片與Intel的10nm不相上下。不僅如此,而且還在時(shí)間進(jìn)度上贏了,而AMD的7nm工藝的高性能桌面版處理器出貨早于英特爾的10nm處理器。雖然英特爾的10nm制程和臺積電N7制程相比,并不是簡單看數(shù)字大小就判定誰的工藝更先進(jìn),因?yàn)榇S的工藝節(jié)點(diǎn)和英特爾這類IDM的工藝節(jié)點(diǎn)很多地方都是完全不一樣的,雖然看起來7nm比10nm更先進(jìn),但是事實(shí)上英特爾的10nm和代工廠的7nm綜合水平相差無幾,但是對于并不專業(yè)的消費(fèi)者來講,7nm和10nm兩款差不多的CPU放在你面前,你選誰?
7nm,真香!
正是因?yàn)檫@一點(diǎn),使得AMD在7nm銳龍?zhí)幚砥魃洗蛄艘粋€(gè)漂亮翻身仗,這是十多年來AMD首次在工藝及性能上能和英特爾齊平,絕對是歷史性時(shí)刻。
曾經(jīng)英特爾引以為傲的集成電路制造工藝水平,在臺積電的加持下,使得AMD追上。而英特爾自己的7nm的工藝,就像孔乙己欠咸亨酒店的那十九個(gè)銅板一樣,不知猴年馬月才能兌現(xiàn)。哦不,人家現(xiàn)在直接把7nm產(chǎn)品改名叫 “intel 4”,一步到“胃”。
更好的總線技術(shù)加上模塊化的設(shè)計(jì),再加上高水準(zhǔn)的臺積電制造工藝,以及更低成本制造方案,從性能到能效到成本都是質(zhì)的變化!銳龍系列處理器,以價(jià)格不到同檔次英特爾i7/i9一半的價(jià)格,讓落后多年的AMD拿回高性能CPU市場的門票, 用更強(qiáng)的性能,超高的性價(jià)比把英特爾碾壓了!
從此這個(gè)市場不再是英特爾的獨(dú)角戲,英特爾也不再擠牙膏,DIY玩家期待的雙雄爭霸局面又回來了。
臺積電的秘密武器
臺積電不僅用先進(jìn)工藝帶領(lǐng)著AMD進(jìn)入7nm,更重要是臺積電用了5年的時(shí)候摸索出一套新技術(shù),而這套技術(shù)成為后摩爾時(shí)代的臺積電安身立命之法寶!
前文提到過了,AMD的CCD模塊和I/O集成到一起,是分別用7nm和12nm工藝制造,然后在集成到一起的封裝方案。這種混合封裝方法,最早應(yīng)該是蘋果iwatch上出現(xiàn)。2014年,蘋果的iwatch驚艷亮相,小小的iwatch內(nèi)有各種傳感器,控制,算法,藍(lán)牙無線模塊等各種芯片,如果在普通PCB板上集成這些芯片,那iwatch怕是比你手掌還大,當(dāng)時(shí)臺積電就是開發(fā)了一套先進(jìn)封裝工藝,把各種需要用的裸芯粒直接封裝到一起,大獲成功,從此之后這種先進(jìn)封裝方案在手機(jī)等消費(fèi)產(chǎn)品上大行其道,再接著就是高性能的礦機(jī)上使用,后面就是AMD這種高性能處理器也開始用這種封裝集成方案。
臺積電在為各種客戶定制的幾代產(chǎn)品的集成方案上,做了許多嘗試,最終形成了一整套先進(jìn)封裝集成工藝,包括2D/2.5D/3D封裝等。
上圖a是傳統(tǒng)的SoC 方案,在單顆芯片(Sigle Die)上實(shí)現(xiàn)最大規(guī)模的線路即把所有的IP核設(shè)計(jì)到一起,屬于傳統(tǒng)的系統(tǒng)LSI(SoC)方案。
b是3D Stack,為在邏輯芯片(Logic Die)上堆疊邏輯芯片(Logic Die)或者存儲芯片的方案(SoIC),海思巴龍5000曾用過這方案,基帶芯片下掛了一個(gè)美光3GB的內(nèi)存顆粒。
c為水平放置邏輯芯片(Logic Die)或者存儲芯片的案例。
d為在(c)的基礎(chǔ)上,堆疊傳感器芯片(Sensor Die)、高電壓線路(HV)、邏輯芯片(Logic Die),或者存儲芯片的SoIC案例,這是現(xiàn)在以及未來的異構(gòu)集成方案。
最終臺積電把各種封裝技術(shù)集合到一起推出一個(gè)新的工藝平臺和品牌,取名“3D Fabric”。
“3D Fabric”原來的2.5D/3D 集成化封裝技術(shù)重新整合而來,由前道芯片級堆疊封裝Front-end(FE 3D) 和后道先進(jìn)封裝Back-end(BE 3D)兩處工程構(gòu)成。
FE 3D之前叫TSMC-SoIC,由CoW(Chip on Wafer)和WoW (Wafer on Wafer)兩種封裝鍵合工藝。Front-end(FE 3D)是一種堆疊硅裸芯粒(Silicon Die)后并相互連接的工藝技術(shù)。有多種分類,如將采用不同代際技術(shù)生產(chǎn)的硅裸芯粒連接起來的技術(shù)、把硅裸芯粒與其他材質(zhì)的Die搭載于同一塊基板上的技術(shù)等。
通過采用硅穿孔(TSV)技術(shù),臺積電 SoIC 技術(shù)可達(dá)到無凸起的鍵合結(jié)構(gòu), 從而可將不同尺寸、制程、材料的小芯片重新集成到一個(gè)類似 SoC 的集成芯片中,使最終的集成芯片面積更小,并且系統(tǒng)性能優(yōu)于原來的 SoC。
Back-end(BE 3D)是一種高密度地把多個(gè)硅裸芯粒(Die)連接起來的同時(shí),再與封裝基板連接的技術(shù)。之前,TSMC開發(fā)了用于智能手機(jī)的封裝技術(shù)“InFO(Integrated Fan-Out,集成扇出型)”在蘋果手機(jī)芯片上非常成功。而高性能計(jì)算機(jī)的封裝技術(shù)“CoWoS(Chip on Wafer on Substrate,晶圓級封裝)”包括英偉達(dá)和AMD的都使用過這套先進(jìn)封裝技術(shù),取得不錯(cuò)的效果。
臺積電在與AMD,蘋果,高通,英偉達(dá)多年的合作中,終于把設(shè)計(jì)公司想要的方案落地變成現(xiàn)實(shí)。也讓每一代芯片都有比上一代芯片更強(qiáng)的性能。
如果說Chiplet小芯粒異構(gòu)架集成是IC設(shè)計(jì)公司的理論和想法,臺積電的“3D Fabric”則把想法落地的硬件保障。
Chiplet成為后摩爾時(shí)代的靈魂,而3D堆疊封裝則成為后摩爾時(shí)代的肉體,兩者共同從另外一個(gè)維度打開了后摩爾定律時(shí)代的大門!
總線的故事(五)—— CXL聯(lián)盟誕生
現(xiàn)在計(jì)算機(jī)系統(tǒng)里的CPU和內(nèi)存無論內(nèi)外部已經(jīng)不再有短板,只剩就是把其他其他重要的外部高性能計(jì)算單位也更好的整合進(jìn)來,例如GPU,DPU,Ai,以及其他專用ASIC了。換言之,CPU和GPU們能不能的更好的連接到一起,同時(shí)合理分配內(nèi)存資源,發(fā)揮更強(qiáng)的協(xié)同性能?
英特爾表示你們想的美!
實(shí)際上在過去幾十年的時(shí)間里,CPU的存儲子系統(tǒng)部分,幾乎是被英特爾完整地封閉在它私有的生態(tài)里面。為了賺錢英特爾想盡一切辦法限制你。比如在合作合同里面嚴(yán)格限定了能做什么、不能做什么,包括HP、Dell、聯(lián)想,任何想在內(nèi)存上做點(diǎn)手腳的優(yōu)化,都是不能做的,甚至同樣核心的一顆CPU,就因?yàn)橹С植煌萘康膬?nèi)存,都能賣兩個(gè)價(jià)格。
英特爾一直以來打造理念就是CPU是宇宙中心,這種思路為CPU銷售上的高溢價(jià)是很有幫助的。但為了維持保持這種中心化的形態(tài),英特爾干了不少缺德的事。比較典型的案例:某些內(nèi)存數(shù)據(jù)庫,缺的不是算力,就是缺內(nèi)存容量想擴(kuò)展的,不行,你得買CPU才能擴(kuò)內(nèi)存。歷史上有很多公司嘗試過某些歪路子,例如利用QPI擴(kuò)展,要么失敗,要么被英特爾制止,總之被限制死死的。
想繞開CPU,讓內(nèi)存和其他處理器直連?門都沒有!
同時(shí)英特爾還把持著PCI-E的標(biāo)準(zhǔn)。PCI-Express,peripheral component interconnect express,簡稱“PCI-E”,它是一種高速串行計(jì)算機(jī)擴(kuò)展總線標(biāo)準(zhǔn),它原來的名稱為“3GIO”。在90年代時(shí)替代了ISA總線后,PCI總線成為計(jì)算機(jī)局里的I/O總線標(biāo)準(zhǔn)一直使用至今。在2001年,英特爾提出更強(qiáng)的PCI-Express總線標(biāo)準(zhǔn),旨在替代舊的PCI,PCI-X和AGP總線標(biāo)準(zhǔn),這個(gè)接口規(guī)范組織PCI SIG里雖然有不少其他大佬,但是由于在系統(tǒng)里PCI-E必須和CPU互聯(lián),因此英特爾就又有很強(qiáng)的話語權(quán)。
從主板上顯卡的專用接口就從AGP變成PCI-E開始,英特爾又開始搞壟斷了。
總結(jié)起來,因?yàn)檫^去英特爾在CPU上的強(qiáng)勢,造成兩個(gè)最重要的資源內(nèi)存資源和系統(tǒng)總線PCI-E都被英特爾卡死死的,所有人都要聽命于英特爾,畢竟這是繞不過去的門檻,英特爾在CPU上隨便整點(diǎn)花樣,你就要買單,趁機(jī)就能賺更多的壟斷利潤。所以英特爾是這個(gè)世界上最封閉的家伙,出了名的吸血鬼。
近年來,因?yàn)樽约覕D牙膏能力不足,為了避免其他設(shè)備異構(gòu)架芯片比如GPGPU這些玩意兒喧賓奪主,英特爾故意阻礙了PCI-E接口的演進(jìn),明明提頻到64G/s甚至更大帶寬的都是早就能做的事,英特爾就硬是要拖著不給增加,真拿它沒辦法。
天下苦英特爾久已!不管是誰都很想打破英特爾的壟斷。
特別英特爾拖著PCI-E不提速,其他公司早就不爽了,紛紛弄出各種總線技術(shù)組成各種聯(lián)盟來和英特爾競爭。大家都希望通過新的總線技術(shù)能突破英特爾的壟斷和封鎖,比如英偉達(dá)的NV Link,IBM主導(dǎo)的OpenCAPI,反“英特爾陣營”的Gen-Z等等。即使初衷略有不同,但它們的最終目的,簡單理解就是將內(nèi)存虛擬成一個(gè)全部運(yùn)算單元共享的共享池,不讓CPU一家獨(dú)占,同時(shí)讓自己的處理器和其他設(shè)備能夠更方便的互聯(lián)。
于是各路人馬都在總線構(gòu)架這條“芯路”上爭的面紅耳赤。不過英特爾都不當(dāng)回事,你們隨便玩,我CPU不跟,你們就翻不出什么花樣了。
其中反應(yīng)最激烈的當(dāng)屬英偉達(dá)的老黃,老黃一直都在反抗CPU為中心。
老黃一直喊話:英特爾,求你做個(gè)人吧,改改GPU和CPU之間的PCI-E接口吧,這老爺車的速度實(shí)在受不了。因?yàn)榭v使顯卡性能逆天,但是接口速度帶寬擺著,無法發(fā)揮出最強(qiáng)協(xié)同效果。
英特爾一直無動于衷,于是老黃就搞以CUDA為中心,去CPU中心化,畢竟誰愿意做配角呢?CUDA的存在從第一天起對CPU就是不友好的,因?yàn)镃UDA在GPU內(nèi)部有私有內(nèi)存,并且通過CudaHostAlloc要求CPU強(qiáng)行抓住部分主內(nèi)存地址給它用,一個(gè)大顆粒的計(jì)算任務(wù),在GPU內(nèi)部獨(dú)立完成CPU原本承載的任務(wù)調(diào)度和內(nèi)存分配工作,在CPU隔壁建立起一個(gè)完整的獨(dú)立王國。
英特爾一直拖著不給PCI-E提速,對發(fā)揮GPU的性能影響是很嚴(yán)重的,所以英偉達(dá)不得不搞了自己的NV LINK來互聯(lián)GPU之間的交換,并且快速把速率提升到25G。不過呢,NV LINK需要額外的單板支持才能互聯(lián),大多數(shù)單板只有PCI-E槽位,很難大范圍推廣。所以英偉達(dá)只能持續(xù)挖潛,大搞PCI-E上的GPU 直連技術(shù),用PCI-E點(diǎn)對點(diǎn)直通,去CPU中心,這里面包含了SSD的直連技術(shù),還有和Mellanox合作的遠(yuǎn)程直接數(shù)據(jù)存取直連。
不過英特爾也是狠角色,在skylake核心開始,PCI-E點(diǎn)對點(diǎn)直連性能只有2GB,滿帶寬32GB。英特爾說這是他們設(shè)計(jì)上的一個(gè)bug,雖然是bug,但長期駐留勘誤表,作為bug就一直沒被修正。
這個(gè)bug讓英偉達(dá)欲哭無淚,要直連就得再在單板上加裝一顆PCI-E接口開關(guān)芯片,成本高的不行。于是英偉達(dá)直接購買了網(wǎng)卡公司Mellanox,可以預(yù)見的未來,所謂DPU DOCA一定會增加某種接口或者手段,保證GPU和網(wǎng)卡之間的高效直通,繼續(xù)向去CPU中心化的道路前進(jìn)。
但是三十年河?xùn)|三十年河西。但是沒想到而云計(jì)算,Ai這一波的爆發(fā),給了英偉達(dá)GPU帶來巨大增長空間,讓老黃笑的合不攏嘴,因?yàn)樵品?wù)為了增加算力買GPU越多,買CPU的就越少。
云計(jì)算時(shí)代下GPU大賣還是讓英特爾感到深深地不安,英特爾的CPU就是宇宙中心,就是你大爺?shù)母粍訐u了。
你要是英特爾,你咋辦?莫非笑看老黃一騎絕塵?然后回頭繼續(xù)擠牙膏?
面對GPU以及其他各路人馬的圍剿,英特爾深思熟慮一個(gè)月后做出一個(gè)違背祖宗的決定,主動把蛋糕放到了桌子上!
最終,英特爾破天荒的鼓起勇氣打開大門,搞了一個(gè)新的互聯(lián)總線標(biāo)準(zhǔn)聯(lián)盟——CXL聯(lián)盟,表示歡迎各位大爺來玩。這個(gè)總線技術(shù)底層技術(shù)就是PCI-E。也就說英特爾把PCI-E技術(shù)拿出來,給行業(yè)讓利!

2019年3月,英特爾公布了牽頭開發(fā)的CXL開放互連技術(shù),表示CXL互連總線技術(shù)將服務(wù)于下一代高性能計(jì)算、數(shù)據(jù)中心,底層基于PCIe,可消除CPU與設(shè)備、CPU與存儲之間的計(jì)算密集型工作負(fù)載的傳輸瓶頸,顯著提升性能。
并在同年9月20日,在英特爾主導(dǎo)下,包括阿里巴巴、思科、戴爾EMC、Facebook、Google、HPE、華為、微軟等業(yè)界巨頭們聯(lián)合宣布,CXL聯(lián)盟(Compute Express Link Consortium)正式成立,并公布了新的董事會成員。

在未來隨著數(shù)據(jù)爆炸式增長,以及特定工作負(fù)載的快速創(chuàng)新,例如壓縮、加密和人工智能等促進(jìn)了異構(gòu)計(jì)算中專用加速器和通用CPU的協(xié)同工作。這些加速器不僅需要與處理器實(shí)現(xiàn)高性能連接,理想情況下,它們還能夠共享一個(gè)公共內(nèi)存,以減少損耗和延遲。在PCIe 5.0高帶寬時(shí)代,CXL將會成為一項(xiàng)關(guān)鍵性技術(shù),使加速器和CPU之間實(shí)現(xiàn)更加連貫的內(nèi)存共享。
CXL在CPU和工作負(fù)載加速器如GPU、FPGA 和網(wǎng)絡(luò)之間創(chuàng)建了高速、低延遲的互連性,使設(shè)備之間實(shí)現(xiàn)內(nèi)存一致性,允許資源共享,從而獲得更高的性能、降低軟件堆棧復(fù)雜性,以及更低的總體系統(tǒng)成本。
CXL在提供CPU/設(shè)備內(nèi)存一致性,降低設(shè)備復(fù)雜性,以及在單一技術(shù)中提供行業(yè)標(biāo)準(zhǔn)物理和電氣接口,以獲得最佳即插即用體驗(yàn)方面,有了獨(dú)特的價(jià)值,所有人都皆可以自由運(yùn)用CXL技術(shù),給自己家產(chǎn)品或者直連別人家芯片或者和所有人更好的共用內(nèi)存空間。
CXL就像頂級食材,就看各位廚子怎么做出精美的食物了。
這就是英特爾放到桌子上的蛋糕,一次對產(chǎn)業(yè)的巨大讓利,但是也有人說這英特爾的陰謀2.0。
CXL聯(lián)盟誕生沒多久之后,之前反英特爾的Gen-Z陣營就基本倒向CXL了。
總線的故事(六)——UCle聯(lián)盟的誕生
CXL聯(lián)盟建立沒多久,在CXL基礎(chǔ)上發(fā)展出來的,由更多行業(yè)大佬參加的新的總線標(biāo)準(zhǔn)UCle來了。

2022年3月3日,全球知名芯片制造商英特爾、臺積電、三星聯(lián)手芯片封測龍頭日月光,攜AMD、Arm、高通、谷歌、微軟、Meta等科技行業(yè)巨頭推出了一個(gè)全新的通用芯片互連標(biāo)準(zhǔn):通用小芯片快連,Universal Chiplet Interconnect Express,簡稱UCle標(biāo)準(zhǔn)。
該協(xié)議專為chiplet而設(shè)置,旨在為小芯片互連制定一個(gè)新的開放標(biāo)準(zhǔn),簡化相關(guān)流程,并且提高來自不同制造商的小芯片之間的互操作性。該標(biāo)準(zhǔn)下,芯片制造商可以在合適的情況下混合構(gòu)建芯片。
UCle聯(lián)盟之前的CXL聯(lián)盟相比,這里面多了臺積電,日月光等制造型公司,依然不變的是選擇強(qiáng)硬到底不和英特爾同流合污的老黃,(老黃不要慫,就是干它?。?,以及表示我木有興趣的蘋果。
老實(shí)說,這文長文創(chuàng)作到一半的時(shí)候看到新聞的時(shí)候?yàn)⒓疫€挺興奮的,想啥來啥,為我提供了更多的寫作素材,但是隨后表示MMP,一是又花了好多時(shí)間和精力去學(xué)習(xí)UCle,拉長了本文的寫作時(shí)間,導(dǎo)致后續(xù)文章被催稿催死了,第二是UCLe標(biāo)準(zhǔn)深究之下你說英特爾的陰謀2.0我也信。
首先Chiplet的接口物理層依然是一片混戰(zhàn),比春秋戰(zhàn)國時(shí)期的文字還混亂,目前沒有一個(gè)明確的統(tǒng)一的路徑和共識。

上表之中是幾個(gè)已經(jīng)商業(yè)用的chiplet的接口協(xié)議,包括intel、AMD、TSMC都在內(nèi),無論是帶寬密度、延遲、能耗,差別巨大,因?yàn)樗麄兏髯栽谶M(jìn)化路徑中都選擇了其各自不同的進(jìn)化路徑。他們之間是無可能互聯(lián)的。
除開接口規(guī)格,chiplet本身的封裝形式帶來的物理約束也相差甚大。包括上文提到的臺積電“3D Fabric”的全家桶,工藝種類多,價(jià)格規(guī)格隨便選,但實(shí)際上幾種封裝技術(shù)的管腳的最小間距是不一樣的,從20微米到150微米不等,最開始不商量好,后面是無辦法弄成"die-to-die"的。

硬件之外,協(xié)議層呢?
UCle用的是PCI-E+CXL的方案。
知乎大佬夏晶晶總結(jié):
假設(shè)你是一個(gè)chiplet接口的設(shè)計(jì)者,你希望設(shè)計(jì)一個(gè)能夠獨(dú)立自主、流芳百世的接口協(xié)議,你說,我復(fù)用PCI-E,甚至狠一點(diǎn),intel UPI的協(xié)議 ? 行不行?
嗯,如果你在今天的俄國,你可以的。這里面的專利和授權(quán),一環(huán)套一環(huán)不說,你覺得PCIE SIG組織同意不?
假如做一個(gè)有點(diǎn)像PCI-E一樣的接口協(xié)議行不行? 客戶信得過你嗎?還是能讀得懂你?
所以,誰能定一個(gè)chiplet協(xié)議,并且用PCIE/CXL做協(xié)議層呢? 答案只有一個(gè),英特爾。
再思考一下英特爾在這個(gè)局中的位置。
前一段時(shí)間有一個(gè)新聞,是說英特爾授權(quán)X86 CPU軟核IP給客戶,實(shí)際上這屁用沒有,你不可能用英特爾軟核代碼再整一個(gè)CPU出來,這里面工程量太復(fù)雜了,其次你也沒有英特爾的工藝,英特爾是IDM廠,它的標(biāo)準(zhǔn)晶體管單元制造工藝自成體系,你造不出來的。
英特爾的算盤是希望通過賣X86 核心芯粒給客戶二次集成定制的方式實(shí)現(xiàn)對原本的fabless和foundry的商業(yè)模式的超越。你認(rèn)真想一想,這種跨流程的商業(yè)模式,是不是一種極具想象力的生意? 搞得不好真的就是英特爾的二次騰飛。只要他家的芯片有競爭力,做下來比你在TSMC最先進(jìn)工藝的投片費(fèi)便宜,是不是很香,再想一想你是不是已經(jīng)付不起臺積電的投片費(fèi)了?
鬧半天,用的越多,英特爾生態(tài)圈就越大,依然是給它在砌圍墻……,所以灑家研究了半天,覺得UCLe是英特爾的一次讓利,更是一次擴(kuò)大版圖的機(jī)會,保證英特爾江山不倒。
總線的故事(七)——Mochi沒有完成的夢想
早在2015年Marvell 曾提出過一個(gè)方案,Marvell MoChi 模塊化芯片技術(shù)。
當(dāng)時(shí)提出這個(gè)想法也很簡單,保持芯片設(shè)計(jì)的靈活性,同時(shí)降低成本,特別是制造工藝方面的成本。
在2015年,業(yè)界已經(jīng)看到隨著半導(dǎo)體工藝尺寸進(jìn)一步縮小,集成電路制造面臨的挑戰(zhàn)日益增大,“摩爾定律”日趨放緩,急需一種新方案來給“摩爾定律”續(xù)命。
從專業(yè)的技術(shù)角度而言,整個(gè)芯片分成負(fù)責(zé)運(yùn)算的數(shù)字電路部分和負(fù)責(zé)信號控制,I/O輸入輸出部分,以及緩存等各個(gè)部分。
使用越先進(jìn)的制程成本就越高昂,特別是模擬電路、I/O 等愈來愈難以隨著制程技術(shù)縮小,而且很多工藝壓根就和數(shù)字電路部分不兼容。因此對設(shè)計(jì)和制造都提出的巨大的挑戰(zhàn)。
在這種情況下,Chiplet概念應(yīng)運(yùn)而生,Chiplet走向了和傳統(tǒng)的片上系統(tǒng)SoC完全不同的道路,類似于搭建樂高積木,通過一組小芯片混搭成“類樂高”的組件。它通過將SoC分成較小的裸片(Die),再將這些模塊化的小芯片(裸片)互聯(lián)起來,采用新型封裝技術(shù),將不同功能不同工藝制造的小芯片封裝在一起,成為一個(gè)異構(gòu)集成芯片。
前文提到的AMD的Zen2中用7nm工藝制造核心CCX模塊,用12nm制造I/O 部分,然后集成到一起成為一個(gè)CCD模塊,就是最典型的案例。

在Chiplet還沒有概念的年代,Marvell 的提出的Mochi 方案就是要以一種的新內(nèi)連技術(shù)——Mochi實(shí)現(xiàn)SoC的功能,降低研發(fā)與生產(chǎn)成本,并且可以加快上市時(shí)間。MoChi互連芯片是基于運(yùn)行速度高達(dá)8Gbps甚至更快的ARM AXI鏈路,它可以保持很低的芯片到芯片時(shí)延。MoChi鏈路可以將多個(gè)芯片以菊花鏈的形式連在一起,并且可以實(shí)現(xiàn)緊湊型串行/解串器(micro-serdes)和低電壓差分信號。
這個(gè)MoChi方案核心就是利用一個(gè)高速低延遲的內(nèi)部高速SerDes接口快速的把現(xiàn)有的Die根據(jù)需求用TSV技術(shù)封裝在一起。


這個(gè)天才般的想法是ISSCC 2015會議上由Marvell 首席執(zhí)行官Dr. Sehat Sutardja 最早提出來的。
他是個(gè)印尼華人還有個(gè)中文名叫周秀文。

只可惜當(dāng)時(shí)想法雖好,但是業(yè)界一直沒有標(biāo)準(zhǔn)總線接口,這個(gè)周秀文這個(gè)想法并沒有得到很好的應(yīng)用和落地。
隨著蘋果,英偉達(dá),以及AMD公司使用自家總線標(biāo)準(zhǔn)搞各種互連直連,以及臺積電以及日月光等制造公司在物理層面怎么用先進(jìn)封裝把這一套技術(shù)玩熟之后。Chiplet,異構(gòu)架系統(tǒng)集成的新世界大門終于打開了!
今天UCIe技術(shù)標(biāo)準(zhǔn)落地,成為了未來工業(yè)標(biāo)準(zhǔn)互連,它可以提供高帶寬、低延遲、高功率和高成本效益的芯片封裝連接方案。UCIe 1.0標(biāo)準(zhǔn)定義了芯片間I/O物理層、芯片間協(xié)議、軟件堆棧等,基本共用了PCle和CXL這兩個(gè)協(xié)議的部分技術(shù)標(biāo)準(zhǔn),可以說UCle就是CXL和PCle的衍生。
可惜Mochi 方案當(dāng)年就是缺這么一個(gè)互連的總線標(biāo)準(zhǔn)!Marvell 真的很可惜!
不過上文提到的什么CXL,UCLe標(biāo)準(zhǔn)落地,還是標(biāo)志著后摩爾時(shí)代的來臨!當(dāng)年周秀文的設(shè)想正在一步步實(shí)現(xiàn)。
(八)后摩爾時(shí)代下中國的領(lǐng)頭羊
周秀文有個(gè)非常厲害的妻子,叫戴偉立,兩夫妻共同創(chuàng)業(yè)成立了一家半導(dǎo)體領(lǐng)域響當(dāng)當(dāng)?shù)墓尽狹arvell,中文名叫美滿電子。

因?yàn)镸arvell上市當(dāng)天股價(jià)上漲278%,作為公司創(chuàng)始人,戴偉立女士一夜之間在財(cái)富榜上排名超過了籃球之神喬丹,于是就有媒體給戴偉立女士按了一個(gè)肯尼迪坐敞篷車——腦洞大開的外號,叫“使喬丹甘拜下風(fēng)的女人“的中二稱號……
更厲害的是,戴偉立女士有兩個(gè)哥哥,戴偉民先生和戴偉進(jìn)先生,也是中國芯片領(lǐng)域最牛逼的人物。
戴家三兄妹絕對是中國芯片界中的最牛逼最傳奇的一家人!
1995年至今,三兄妹共創(chuàng)辦了6家芯片公司,其中2家已經(jīng)上市,3家被收購。二哥戴偉進(jìn)曾經(jīng)兩度創(chuàng)業(yè),分別是硅谷遠(yuǎn)景公司(Silicon Perspective)以及GPU IP企業(yè)圖芯芯片技術(shù)公司,大哥戴偉民也曾經(jīng)創(chuàng)辦Ultima。
其中兩家上市公司除了Marvell,還有一家就是大哥戴偉民和二哥戴偉進(jìn)的回國創(chuàng)辦的芯原微電子,一家成立于2001年8月,走過近二十載春秋于2020年上市的科創(chuàng)板公司,芯原股份(688521),原名思略微電子。

中國最具科創(chuàng)價(jià)值的科創(chuàng)板公司!
芯原微是全球第七大芯片IP授權(quán)企業(yè),也被稱為“中國芯片IP第一股”,“中國的ARM”,其實(shí)我覺得以芯原的產(chǎn)業(yè)鏈重要性,以及戴家兄弟的水平冠以“中國IC設(shè)計(jì)基石”都沒啥問題,只可惜的二級市場能正確認(rèn)知芯原真正價(jià)值的寥寥無幾,諾安基金的蔡總算一個(gè),灑家算一個(gè),其他的估計(jì)也沒剩幾個(gè),(看懂的記得留言)。
芯片IP到底是什么?
全球芯片產(chǎn)業(yè)目前已經(jīng)基本形成了芯片設(shè)計(jì)、芯片制造、封裝測試三大核心環(huán)節(jié)。
其中在三大核心產(chǎn)業(yè)鏈之上是支撐產(chǎn)業(yè)鏈,其中芯片制造和封裝的支撐產(chǎn)業(yè)鏈?zhǔn)前雽?dǎo)體設(shè)備以及材料與耗材。對于芯片設(shè)計(jì)公司而言,它的支撐產(chǎn)業(yè)鏈則是EDA工具和IP。

如果把芯片比作一座大廈的建設(shè)過程,芯片設(shè)計(jì)的負(fù)責(zé)的內(nèi)容就是出整個(gè)大廈的設(shè)計(jì)圖紙,EDA軟件就是繪制這張圖紙的操作工具,只不過相比于建筑設(shè)計(jì),芯片設(shè)計(jì)的復(fù)雜度要出好幾個(gè)數(shù)量級,畢竟現(xiàn)在芯片已經(jīng)到了上百億個(gè)晶體管的集成水平。
在集成電路設(shè)計(jì)的遠(yuǎn)古時(shí)代,當(dāng)時(shí)芯片結(jié)構(gòu)簡單,就幾個(gè)二極管,三極管堆一起,IC設(shè)計(jì)師可通過手動作圖滿足設(shè)計(jì)要求。隨著芯片功能越來越多,性能越來越強(qiáng),單位面積內(nèi)集成的晶體管數(shù)量以幾何數(shù)量級上升,手工作圖不可能滿足這巨大的工作量,于是EDA自動化工具誕生,且隨著摩爾定律而不斷高速發(fā)展。通過數(shù)十年的競爭和商業(yè)并購后,目前還剩下Cadence,Synopsys,Mentor三大EDA巨頭,目前EDA工具也是中國芯片一大短板之一。
上世紀(jì)70年代可編程邏輯技術(shù)出現(xiàn),開發(fā)人員開始了將設(shè)計(jì)流程自動化的嘗試,硬件描述語言VHDL與Verilog隨之產(chǎn)生,開發(fā)人員使用硬件描述語言完成對設(shè)計(jì)邏輯的描述后將代碼輸入電子設(shè)計(jì)自動化軟件中即可自動生成電路圖,EDA軟件開始大規(guī)模使用并商業(yè)化。
芯片的設(shè)計(jì)涉及功能、算法、協(xié)議等等。利用EDA軟件工具,IC設(shè)計(jì)工程師們能夠?qū)崿F(xiàn)從功能模塊拆解、電路設(shè)計(jì)、性能分析到輸出IC版圖的整個(gè)過程。一顆芯片上有數(shù)億到百億以上的晶體管,設(shè)計(jì)的過程要持續(xù)模擬和驗(yàn)證,有了EDA軟件,芯片設(shè)計(jì)工作的效率可以大大提高。同時(shí),EDA軟件工具在芯片制造和封測環(huán)節(jié)也有應(yīng)用,從掩膜板制造,PDK工具,后端設(shè)計(jì)驗(yàn)證,到各種fab廠各種TCAD工具均屬于EDA范圍。
除了EDA之外, IP也是IC設(shè)計(jì)公司離不開的東西。
IP核是芯片上具有較為獨(dú)立的功能模塊的成熟設(shè)計(jì),可編輯,可復(fù)用,IC設(shè)計(jì)環(huán)節(jié)通常會評估整體設(shè)計(jì)成本來進(jìn)行IP的外采。IP核的模式進(jìn)一步提高了IC設(shè)計(jì)過程的整體效率。市場上各種類型的芯片產(chǎn)品均是由大量晶體管構(gòu)成,并且具備功能分區(qū),從而實(shí)現(xiàn)復(fù)雜的功能,處理不同的任務(wù)。
廣義上來說,按照不同層次的授權(quán)等級,可把芯片IP分類為指令集、IP核、芯片架構(gòu)等。如果說指令集是一本“字典”,那么IP核提供了“段落”的寫作方式,芯片架構(gòu)則可被視作是“整篇文章的提綱”。
隨著集成電路功能復(fù)雜化與產(chǎn)品推新周期縮短的趨勢顯現(xiàn),半導(dǎo)體領(lǐng)域出現(xiàn)獨(dú)立IP廠商,獨(dú)立IP廠商為芯片設(shè)計(jì)企業(yè)直接提供經(jīng)過驗(yàn)證的IP模塊庫,設(shè)計(jì)企業(yè)的開發(fā)者無需從頭設(shè)計(jì),而是直接調(diào)用特定功能模塊,經(jīng)過調(diào)整后便可實(shí)現(xiàn)所需功能,芯片設(shè)計(jì)企業(yè)可將其余人力物力傾斜于產(chǎn)品定義、系統(tǒng)架構(gòu)、市場營銷等環(huán)節(jié)。
芯片IP企業(yè)作為芯片設(shè)計(jì)企業(yè)的上游供應(yīng)商,通常以授權(quán)的方式,向后者收取專利費(fèi)用。而芯片設(shè)計(jì)企業(yè)通過購買不同層級的IP授權(quán),可以設(shè)計(jì)出不同自研程度的芯片。
IP為什么這么重要?
很多芯片設(shè)計(jì)公司都依賴IP來設(shè)計(jì)和生產(chǎn)一款新的SoC芯片。
SoC芯片的設(shè)計(jì)工程從某種角度而言就是尋找,驗(yàn)證及整合IP的過程。如果能夠找到滿足需求的,質(zhì)量可靠的,驗(yàn)證過的IP會極大縮短SoC的開發(fā)周期,這個(gè)模式在過去幾十年間已經(jīng)證明非常成熟可靠。
換言之,現(xiàn)在設(shè)計(jì)一款SoC芯片其實(shí)就是在定義好芯片需求和功能后,把各種需要用的,更好用的IP整合到一起的過程。
隨著芯片復(fù)雜度的提高,定制化需求越來越多,IP產(chǎn)品也有自己的開發(fā)和生命周期。是否能夠在上市時(shí)間和定制化方面更好的滿足客戶需求,也成為IP供應(yīng)商和用戶越來越關(guān)心的事情。
SoC對IP的應(yīng)用模式隨著市場需求,芯片復(fù)雜度,上市時(shí)間和成本的壓力一直在發(fā)生變化,當(dāng)然這也間接導(dǎo)致了行業(yè)內(nèi)IP的生態(tài)發(fā)生相應(yīng)的變化。從SoC視角看,對IP的使用可以簡單的分為三種情況
1、只為這一個(gè)芯片定制的IP,通常發(fā)生在公司內(nèi)部單項(xiàng)目上。
2、IP的選擇來自于IP平臺,成熟的固化 IP。有些企業(yè)內(nèi)部有自己的IP平臺,同時(shí)也會選擇第三方IP平臺的產(chǎn)品。這類IP的開發(fā)就是為了被大量的用戶重復(fù)使用以降低成本,比如開發(fā)一款MCU,你可以選擇ARM的Cortex-M0/M3系列,這類MCU IP已經(jīng)被反復(fù)使用,出貨量高達(dá)數(shù)十億顆,這被證明是相當(dāng)成熟可靠的。
3、IP的選擇來自于IP平臺,但在SoC 規(guī)格選型階段就一起規(guī)劃IP 開發(fā),為滿足用戶的計(jì)劃清單,其研發(fā)周期幾乎與SoC同步,所以IP公司和設(shè)計(jì)公司其實(shí)是深度綁定的關(guān)系,互相成就。
對IP的選擇除了質(zhì)量因素,功能因素,價(jià)格也是重要的考量。隨著用戶數(shù)越多,這個(gè)價(jià)格會被分?jǐn)偟?,相對容易承受,對于IP公司而言,也有降價(jià)占市場的動力。比如上文提到的ARM Cortex-M0/M3系列,已經(jīng)取消了IP授權(quán)費(fèi)用,每片wafer僅抽幾美金的版稅,平均下來一片芯片只有幾美分的版權(quán)費(fèi),但這依然讓ARM賺的盆滿缽滿。

戴偉民董事長曾在一次采訪中形象的描述芯原的定位:“在我們的平臺上,我提供IP,提供服務(wù),(芯片設(shè)計(jì))企業(yè)就不要養(yǎng)這么多人。我們是芯片界的藥明康德。藥明康德不做藥,但是做新藥的公司一定要依靠它的平臺,因?yàn)椴恍枰垦邪l(fā)一次新藥都去重復(fù)搞那些基礎(chǔ)的東西。”
戴總其實(shí)就是把IP比做成芯片設(shè)計(jì)的非?;A(chǔ)的可以重復(fù)利用的東西。
但是其實(shí)戴總只說了一半。藥明康德本質(zhì)只是代工一款生物藥而已,但其知識產(chǎn)權(quán)并不屬于藥明康德,而是屬于原藥研發(fā)團(tuán)隊(duì);但是芯原的平臺上,誰都可以交授權(quán)費(fèi)使用芯原的各種IP,但是IP始終是屬于芯原的,這和藥明康德有本質(zhì)上的區(qū)別。
換言之,芯原的IP可以重復(fù)賣給很多人,在覆蓋研發(fā)成本之后做到毛利率等于凈利率!
同時(shí)IP越多,就像超市貨架一樣,選擇也越多。對于芯片設(shè)計(jì)公司而言,足夠多足夠好的IP庫大大方便了芯片設(shè)計(jì)的效率以及提供更多的功能性,這是一種良性的循環(huán),更多人使用自家的IP,就能不斷完善自己IP庫,保持競爭力。
目前芯原微除了X86構(gòu)架的IP,以及eFlash之外,其他諸如數(shù)模混合及射頻等 IP ,RISC-V,DSP,均處于先進(jìn)水平, 其中公司的圖形處理器 IP、數(shù)字信號處理器 IP 分別排名全球前三,視頻處理器 IP全球領(lǐng)先。
對于芯原而言,IP的數(shù)量和質(zhì)量就是其護(hù)城河,雖然目前排名為全球第七,但是只要日后只要越多人用芯原的IP,芯原的收入越多,就有更多的錢投入研發(fā)新的IP,而IP庫也變得更好更豐富,這幾乎是一個(gè)正向循環(huán),且增長永無止境。
特別是芯原在FD-SOI,以及RISC-V上的布局,會有一天讓世人看到什么叫金光閃閃的價(jià)值!
IP芯片化之路
按照未來芯片設(shè)計(jì)發(fā)展路徑,在后摩爾定律的Chiplet時(shí)代,IP不需要再費(fèi)勁整合到一個(gè)個(gè)SoC里面,完全可以做到用最適合的工藝直接生產(chǎn)出來,然后再用封裝技術(shù)整合到一起。以Chiplet實(shí)現(xiàn)特殊功能IP的“即插即用”,解決7nm、5nm及以下工藝中,性能與成本的平衡,并降低較大規(guī)模芯片的設(shè)計(jì)時(shí)間和風(fēng)險(xiǎn),從SoC中的IP到SiP中以Chiplet形式呈現(xiàn)的IP。
這就是戴總口中經(jīng)常說的“IP芯片化”。
現(xiàn)在UCLe的行業(yè)技術(shù)標(biāo)準(zhǔn)已經(jīng)確定,最后一公里難關(guān)已經(jīng)打通,此前還要考慮做出來怎么在不同的芯粒的數(shù)據(jù)互聯(lián)互通的問題,現(xiàn)在交給UCle就行了(Marvell周秀文一聲長嘆),芯原只需要根據(jù)UCle的協(xié)議要求,推出各類接口IP,IC設(shè)計(jì)公司在設(shè)計(jì)一款新的SoC中,只需要整合加入芯原的接口IP即可,最終實(shí)現(xiàn)die-to-die的直連。
戴總此前舉例:采用Chiplet架構(gòu)所設(shè)計(jì)和推出的高端應(yīng)用處理器平臺,從定義到流片僅用了12個(gè)月的時(shí)間,2021年5月工程樣片已回片并在當(dāng)天被順利點(diǎn)亮,Linux/Chromium操作系統(tǒng)、YouTube等應(yīng)用在工程樣片上已順利運(yùn)行,基于該樣片的Chromebook 樣機(jī)也已經(jīng)在各大活動中成功展示并吸引了大量關(guān)注。這個(gè)高端應(yīng)用處理器平臺還集成了芯原的很多IP,包括芯原的神經(jīng)網(wǎng)絡(luò)處理器NPU、圖像信號處理器ISP、視頻處理器、音頻數(shù)字信號處理器和顯示控制器等。
對于芯原而言,業(yè)內(nèi)通行的標(biāo)準(zhǔn)互聯(lián)總線之后,其實(shí)對IP公司而言是巨大的利好,因?yàn)樽约旱腎P庫的價(jià)值更大了。芯片設(shè)計(jì)人員就像去超市買菜一樣,想要什么,就拿什么,然后確定好方案,就可以讓芯原進(jìn)行一站式流片服務(wù),直接把芯片生產(chǎn)出來拿來賣,之前二級市場炒的火熱的什么預(yù)制菜概念,按照這個(gè)邏輯芯原就是芯片設(shè)計(jì)預(yù)制菜的No.1!
最關(guān)鍵的是,芯原這個(gè)業(yè)務(wù)模式能幫助各個(gè)芯片設(shè)計(jì)初創(chuàng)公司定制一款天使輪估值高達(dá)20億的PPT融資方案,叫一聲“中國芯片設(shè)計(jì)基石”不過分吧。
因?yàn)橛辛薝Cle總線,一切都有了標(biāo)準(zhǔn),有了標(biāo)準(zhǔn)過去很多難題都迎刃而解,die-to-die的直連成為可能。UCIe的發(fā)布打通了Chiplet未來發(fā)展障礙,對于推動Chiplet有歷史性的意義。芯原可以基于自身先進(jìn)的芯片設(shè)計(jì)能力,致力于“IP芯片化”“芯片平臺化”的發(fā)展。
這就是后摩爾時(shí)代的新時(shí)代下,未來芯片設(shè)計(jì)的景象。
芯原則成為這個(gè)生態(tài)圈最底層的存在,所有IC設(shè)計(jì)公司都將站在芯原打好的地基上眺望詩和遠(yuǎn)方。
中國的芯路
傳統(tǒng)摩爾定律確實(shí)已經(jīng)走到盡頭,但是后摩爾時(shí)代才剛剛開始。在追求更高集成度、更高性能、更多功能、更小面積、更低功耗的路上永無止境,這也是人類科技在信息時(shí)代不斷進(jìn)步的基石。
在這條通往遠(yuǎn)方的芯路上,中國有自己獨(dú)特的產(chǎn)業(yè)鏈定位,即下游應(yīng)用主動權(quán)在中國,各種豐富的需求對芯片設(shè)計(jì)提出更高的要求,即快速響應(yīng),特色定制,成本可控。有了UCle的互聯(lián)總線,芯片設(shè)計(jì)就可以靈活響應(yīng)市場提出的高性能,多功能,以及低成本三個(gè)要求。
灑家總結(jié)總結(jié)至少對比傳統(tǒng)SoC設(shè)計(jì)方案,用chiplet思路能減少三分之二的設(shè)計(jì)用時(shí),三分之一的制造成本,且保持性能和功能性符合客戶需求。
盡管UCle標(biāo)準(zhǔn)并非中國公司制定,但是英特爾已經(jīng)把蛋糕放在桌子上,就看各位怎么利用,至少對芯原來講有了更廣闊的發(fā)揮平臺。
結(jié)語
全文到這里,希望各位看官基本能理解對于芯片而言,內(nèi)部與外部的信號互聯(lián)的“芯路”有多重要。摩爾定律背后是芯片不斷提高集成度,從而不斷提高性能,縮小體積,降低功耗,以及擴(kuò)展更多的功能,這些都離不開芯片構(gòu)架的更新,離不開更好的總線技術(shù),離不開制造工藝的進(jìn)步,更重要的是IP公司有了更大的勇武之地,芯片設(shè)計(jì)公司才能很好對應(yīng)市場端不斷變化的新需求。
集成電路領(lǐng)域能有今天令人嘆為觀止的成果,是過去幾十年全球分工協(xié)作,共同努力的結(jié)果。但是近年來夾雜太多政治因素后,整個(gè)行業(yè)的基礎(chǔ)信任被切割的支離破碎,逼迫各國必須建立一套自己的體系,中美之間,日韓之間,都在建立本國的整套產(chǎn)業(yè)體系。
進(jìn)入后摩爾時(shí)代,芯片設(shè)計(jì)領(lǐng)域和過去有很大的變化,面對多樣性,靈活性以及成本控制的挑戰(zhàn),Chiplet+先進(jìn)封裝軟硬結(jié)合的道路成為未來的關(guān)鍵。更多的IP庫,能讓芯片設(shè)計(jì)人員能夠保持靈活性以及高效應(yīng)對市場端的訴求,UCle總線為異構(gòu)架芯片的集成提供了信號高速互聯(lián)的基礎(chǔ),而3D 堆疊封裝則賦予異構(gòu)架的肉體。
當(dāng)然在這條路上,中國也有自己的方案。2021年5月,中國計(jì)算機(jī)互連技術(shù)聯(lián)盟(CCITA)在中電標(biāo)協(xié)立項(xiàng)了chiplet標(biāo)準(zhǔn),即《小芯片接口總線技術(shù)要求》,由中科院計(jì)算所、工信部電子四院和國內(nèi)多個(gè)芯片廠商合作展開標(biāo)準(zhǔn)制定工作。
中國留有后手,萬一遇到麻煩,也能有Plan B的方案。
而在這條通往遠(yuǎn)方后摩爾時(shí)代的“芯”路上,中國也有燎“原”的火種!
作者有話說
老實(shí)說,以我的專業(yè)水平(作者文科生,非半導(dǎo)體科班畢業(yè)),是很難駕馭這么宏大的歷史進(jìn)程和技術(shù)細(xì)節(jié),只能是邊看邊學(xué),所以筆者水平有限,如其中有錯(cuò)誤,望各位大佬多指正,不甚感激。
去年12月底,筆者有幸與戴總面對面暢談兩小時(shí),學(xué)習(xí)到了很多寶貴的知識和經(jīng)驗(yàn),從張江出來的路上開始構(gòu)思整篇文章,隨后一邊工作一邊學(xué)習(xí)一邊碼字,前后花了足足三個(gè)多月時(shí)間。因?yàn)橐婚_始就立了flag,所以中間被人催稿無數(shù)次……搞的我頭皮發(fā)麻,最終還是硬著頭皮寫完了這34000多字,原計(jì)劃是3月初完成,結(jié)果硬是又多用了一個(gè)月時(shí)間,和久等的人說聲抱歉。
寫作過程中,本著不懂就問,按打破砂鍋問到底的風(fēng)格,期間騷擾了無數(shù)行業(yè)大佬,搞的人家以為我要去開發(fā)芯片了……,紛紛投來好奇的目光,得知我是要學(xué)習(xí)芯片知識寫篇大文的時(shí)候表示,你丫的要不要這么卷,你們投資人都這么精通了,我們以后還怎么融資???
網(wǎng)上搜過太多的資料,已經(jīng)完全記不清了,所以結(jié)尾不能把所有的參考資料列明,萬分抱歉。
——by 猛練自然強(qiáng) 2022.3.27
參考資料:
知乎大佬夏晶晶:談一下UCle,聊一聊CXL等;
SIP多樣化應(yīng)用于先進(jìn)封裝發(fā)展趨勢;
英特爾:2021-2025展望;
一文看盡英特爾50年發(fā)展歷史;
PC 處理器 50年發(fā)展歷史;
顯卡發(fā)展風(fēng)云歷史;
臺積電工藝開發(fā)歷史;
制程之爭,臺積電是如何一步步崛起;
AMD:回顧Zen構(gòu)架開發(fā)歷史;
UCLe,下一個(gè)芯片發(fā)展風(fēng)口——chiplet;
多Die封裝:chiplet研究報(bào)告;
繞開先進(jìn)制程封鎖,中國小芯粒標(biāo)準(zhǔn)草案即將公示;
萬字總結(jié)CPU構(gòu)架;
顛覆SoC構(gòu)架, Marvell Mochi模塊化芯片設(shè)計(jì);
AMD 7nm Zen2 構(gòu)架解析;
芯片設(shè)計(jì)挑戰(zhàn)重重,如何解決IP重用與集成難題?
硅仙人,Jim Keller的芯片研發(fā)之道;
超詳細(xì)解讀先進(jìn)封裝;
淺談先進(jìn)晶體管技術(shù);
PCLe 體系結(jié)構(gòu)簡介;
2022年全球半導(dǎo)體行業(yè)發(fā)展10大技術(shù)趨勢;
芯片是怎么設(shè)計(jì)的?;
對話戴偉民:從IP芯片化到芯片平臺化;
蘇豐姿,AMD歷史上首個(gè)女性CEO;
格羅方德近年發(fā)展歷程梳理;
臺積電官網(wǎng)資料;
AMD官網(wǎng)資料;
英偉達(dá)官網(wǎng)資料;
英特爾官網(wǎng)資料;
格羅方德官網(wǎng)資料;
芯原微官網(wǎng)資料;
……
編輯于 2023-03-17 14:26?IP 屬地未知
芯片(集成電路)
半導(dǎo)體