【知乎】史上什么CPU堪稱發(fā)熱量巨大?
史上什么CPU堪稱發(fā)熱量巨大?
關(guān)注者
433
被瀏覽
1,533,563
關(guān)注問(wèn)題寫回答
邀請(qǐng)回答
好問(wèn)題 34
1 條評(píng)論
分享
103?個(gè)回答
默認(rèn)排序
cotton
筆記本電腦話題下的優(yōu)秀答主
?關(guān)注
804 人贊同了該回答
(修改了部分表達(dá)貶義的詞匯。)
(本文暫時(shí)僅涉及PC處理器,不包括手機(jī)處理器。)
現(xiàn)代的英特爾Skylake-W和Skylake-EP、AMD線程撕裂者和EPYC,這些動(dòng)輒十幾核甚至幾十核的怪物就不講了,它們雖然發(fā)熱巨大,但是性能也非常強(qiáng)。
講兩個(gè)發(fā)熱大性能又相對(duì)差的。
英特爾 奔騰D(2005年)
2005年,AMD率先推出了速龍64 X2系列的雙核處理器,也是在民用市場(chǎng)普及的第一款x86雙核CPU。當(dāng)時(shí)的英特爾正被奔騰4的高頻低能所困擾,而奔騰D也是英特爾為了應(yīng)對(duì)AMD的雙核速龍,應(yīng)急推出的一款產(chǎn)品。
奔騰D采用的仍然是奔騰4的Netburst架構(gòu),把兩個(gè)單核奔4的硅晶核心封裝在一個(gè)基板上,一度被AMD和硬件發(fā)燒友笑稱為“假雙核”、“膠水雙核”。最早的一批奔騰D 800系列基于90nm制程,后來(lái)的奔騰D 900系列基于65nm制程,均采用LGA775接口。
問(wèn)題來(lái)了,Netburst本就是一個(gè)能效比低的架構(gòu),同頻下性能相對(duì)較差,只能靠強(qiáng)行拉高頻率(3GHz以上)來(lái)解決性能較弱的問(wèn)題,這也讓高頻奔4的發(fā)熱量普遍很高,單核滿載能達(dá)到70W以上。
奔騰D相當(dāng)于把兩個(gè)大火爐集中在了一起,其發(fā)熱量有多恐怖,就可想而知了。
此外,奔騰D的兩個(gè)核心沒(méi)有共享緩存,核心間也沒(méi)有任何獨(dú)立的總線互聯(lián),因此它們之間的數(shù)據(jù)交換全部需要通過(guò)北橋中的內(nèi)存控制器由內(nèi)存交換數(shù)據(jù),交換效率受FSB的帶寬和延遲影響較大,導(dǎo)致奔騰D的性能表現(xiàn)也不理想。
種種缺陷注定了奔騰D失敗的命運(yùn),雖然后期900系列的奔騰D更新制程后發(fā)熱表現(xiàn)好了一些,但仍然不能扭轉(zhuǎn)奔騰D急轉(zhuǎn)直下的口碑和不盡人意的性能表現(xiàn)。在能效比大幅提升的酷睿2發(fā)布后,奔騰D便退居為入門級(jí)雙核處理器產(chǎn)品,直到2007年停產(chǎn)。
AMD FX系列 8核處理器(推土機(jī)和打樁機(jī),2011-2013年)
來(lái)到2012年,此時(shí)的Intel酷睿處理器已經(jīng)成為新的王者,而AMD這時(shí)候卻走上了一條不歸路——CMT技術(shù)
推土機(jī)架構(gòu)把兩個(gè)核心及相關(guān)單元封裝成一個(gè)模塊,每一個(gè)核心都有完整的整數(shù)運(yùn)算單元;但兩個(gè)核心共用一個(gè)浮點(diǎn)運(yùn)算單元,因此推土機(jī)的8核處理器實(shí)際上只有4個(gè)模塊和4個(gè)浮點(diǎn)運(yùn)算單元。AMD認(rèn)為,未來(lái)CPU主要承擔(dān)的運(yùn)算是以整數(shù)運(yùn)算為主,浮點(diǎn)運(yùn)算更多可以交給GPU來(lái)完成(因?yàn)橥瑑r(jià)位顯卡的浮點(diǎn)運(yùn)算能力比CPU高得多),且將來(lái)的程序會(huì)越來(lái)越多地向多線程優(yōu)化。
然而事與愿違,大部分程序并沒(méi)有按AMD想象的去做(0202年的很多游戲依然對(duì)單線程性能有較高要求、仍需要CPU執(zhí)行大量的浮點(diǎn)運(yùn)算)。此外,類似奔騰4的超長(zhǎng)流水線設(shè)計(jì)、及減少了一半的浮點(diǎn)單元,讓推土機(jī)也成了一個(gè)像奔4一樣高頻低能的架構(gòu),單核性能相比自家的上代K10架構(gòu)有明顯的倒退。
后面的故事就和奔騰D很像了,“性能不夠、超頻來(lái)湊”,因此AMD推出了一系列高頻的8核處理器,如FX-8150、FX-8350。
把這一點(diǎn)做到極致的是FX-9590,基礎(chǔ)頻率4.7GHz、最大能動(dòng)態(tài)加速到5.0GHz,官方標(biāo)稱TDP達(dá)到恐怖的220W,90%以上的風(fēng)冷散熱器根本壓不住,以至于在后來(lái)AMD零售FX-9590的時(shí)候還搭配了高端水冷散熱器捆綁銷售。盡管如此,F(xiàn)X-9590的性能也就是一個(gè)默頻i7-4770K的水平。
推土機(jī)架構(gòu)的失敗讓AMD在CPU領(lǐng)域遭遇了前所未有的滑鐵盧,成為玩家口中的笑柄,催生出了“i3默秒全”、“農(nóng)企今天翻身了嗎”這樣的口號(hào)。一直到2017年Zen架構(gòu)的發(fā)布,AMD在CPU領(lǐng)域才得以重新翻身。
雖然這倆CPU耗電高、性能弱,但它們并不是沒(méi)有存在的價(jià)值,而且有價(jià)值的原因也是相同的——
便宜
在速龍64 X2開(kāi)始風(fēng)生水起的時(shí)候,AMD的定價(jià)很高,2005年和2006年的雙核基本上都要2000塊起步,而奔騰D 820的價(jià)格只要1000多塊,后續(xù)推出的入門級(jí)PD 805甚至打到了千元以內(nèi)。
同理,AMD的推土機(jī)系列價(jià)格也不算高,F(xiàn)X-8150也只要不到2000塊就能入手,并且不鎖倍頻,和帶K的二代、三代四核i5價(jià)格相仿。
編輯于 2020-03-30 16:10
贊同 804127 條評(píng)論
分享
收藏喜歡
收起
BORN
除了作死什么都不會(huì),不過(guò)幸運(yùn)的是每次我都作得一手好死
?關(guān)注
405 人贊同了該回答
要是把范圍局限在通用CPU上的話(WSE那種專用處理器不算),那沒(méi)什么CPU的功耗能和IBM大型機(jī)服務(wù)器比,巴掌大的CPU算什么?來(lái)看看和人頭一樣大的CPU。
IBM Z196,十年前的產(chǎn)品,45nm工藝制造,每個(gè)PU包含四個(gè)5.2GHz核心,4*1.5MB L2和24MB L3。
下面圖片里的Z196 MCM,集成了20個(gè)PU(MCM里其實(shí)集成了24個(gè),但是有4個(gè)是用來(lái)備份的,最多只有20個(gè)能工作),一共80個(gè)5.2GHz核心,120MB L2、480 MB L3和1920MB L4(每?jī)蓚€(gè)PU單元共享192MB),每套功耗1800W。沒(méi)錯(cuò),煮飯、炒菜、燒開(kāi)水無(wú)所不能。
Z196最高配置(M80),可以放80個(gè)PU(4套MCM),每個(gè)book里可以放1套,都位于A Frame機(jī)柜里。
后來(lái)IBM Z13/14和15的處理器,外觀類型都是類似的,都是這樣的多芯片MCM結(jié)構(gòu)。
2020.04.02更新
今天來(lái)回答幾個(gè)大家都比較關(guān)心的問(wèn)題,IBM大型機(jī)處理器的性能,和同年代x86處理器相比如何?
首先要明確的一點(diǎn)是,諸如Z196這樣的處理器,名義上是通用處理器,但實(shí)際上它的業(yè)務(wù)特性是比較明顯的,最典型的就是銀行和證券公司的交易,每天進(jìn)出多少金額、買賣多少股票,全部都是非常單純的數(shù)學(xué)計(jì)算。
更關(guān)鍵的是,我們知道一般的計(jì)算機(jī)都是指2進(jìn)制計(jì)算機(jī),CPU內(nèi)部運(yùn)算時(shí)都使用2進(jìn)制浮點(diǎn)數(shù),但我們?nèi)粘J褂玫臄?shù)字卻是10進(jìn)制。而用2進(jìn)制去表示10進(jìn)制浮點(diǎn)數(shù)時(shí),其結(jié)果只是近似的,而且是不連續(xù)的。這一點(diǎn)在金融系統(tǒng)高頻次、大數(shù)據(jù)量的交易當(dāng)中會(huì)導(dǎo)致一些問(wèn)題,比如誤差的累積。
這一點(diǎn)其實(shí)反映到了這類CPU的硬件設(shè)計(jì)上,我先看看下面的微架構(gòu)圖。
拿Z196來(lái)說(shuō),我們可以明顯的看出,這是一個(gè)三發(fā)射、亂序執(zhí)行的超標(biāo)量處理器。
很多朋友可能會(huì)認(rèn)為,三發(fā)射?這豈不和奔騰4一樣落后?其實(shí)不然,因?yàn)橄啾葂86,Z系列是更接近于傳統(tǒng)CISC的設(shè)計(jì),流水線的復(fù)雜性比x86要更復(fù)雜,所以不能直接比較。
就拿奔騰4來(lái)說(shuō),3個(gè)解碼器其實(shí)是1+2的配置,也就是1個(gè)Complex Decoder和2個(gè)Simple Decoder,前者的輸出是3個(gè)uops,后者是1個(gè)uop,也就是理論情況下每周期能輸出5個(gè)uops。而和Z196同時(shí)代的Nehalem(INTEL第一代i系列),則是1+3配置,3個(gè)Simple Decoder的輸出也是1個(gè)uop,而1個(gè)Complex Decoder的輸出是4個(gè)uops,一共是7個(gè)uops,INTEL擠了那么多年的牙膏Skylake架構(gòu)也只是1+4配置,一共8個(gè)uops。
回到Z196上,我們可以發(fā)現(xiàn),這貨根本沒(méi)有Simple Decoder,3個(gè)都是Complex Decoder,這是之前我說(shuō)它更接近于CISC的原因。每個(gè)解碼器都能輸出3個(gè)uops,一共是9個(gè)uops,也就是說(shuō)理論上它的單周期解碼能力其實(shí)要比nehalem更強(qiáng)。同時(shí)帶來(lái)的是240字節(jié)的超大Instruction buffer,Nehalem上功能類似的Pre-decoder buffer只有16字節(jié)。
再來(lái)看后端SIMD部分,Z196有3組通用執(zhí)行端口,對(duì)應(yīng)2組Integer單元、1組Floathing單元,以及2組獨(dú)立的Load/store單元(就是圖中的AGU)。Nehalem同樣是是3組通用執(zhí)行端口,對(duì)應(yīng)1組Integer單元、2組Floathing單元,以及3組Load/store單元??梢钥闯龆叩膫?cè)重程度不同,Z系列是更側(cè)重整數(shù)運(yùn)算的,這點(diǎn)也能從80組整數(shù)浮點(diǎn)/微代碼寄存器和4uops的寬度看出來(lái)。
然后我們可以注意到Z196最大的一個(gè)不同,在Port 4上還有1組Hex Binary FPU和1組Decimal FPU,這就是IBM的絕活了,這兩組浮點(diǎn)單元可以直接在硬件層面進(jìn)行16進(jìn)制和10進(jìn)制運(yùn)算,直接從根本上解決了2進(jìn)制到10/16進(jìn)制轉(zhuǎn)換的精度問(wèn)題,同時(shí)也提高了效率。
之后是緩存和內(nèi)存部分,這一點(diǎn)其實(shí)沒(méi)什么好比的,Z系列擁有更大的、更多級(jí)、更復(fù)雜的緩存體系,L1 I-Cache和D-Cache的容量是Nehalem的兩倍(其實(shí)可以看出,Z196也是一個(gè)馮諾依曼/哈弗架構(gòu)混合體),L2 Cache的寬度比Nehalem大50%,MCM上那恐怖的1920MB L4甚至都可以當(dāng)內(nèi)存使。
最后由于Z系列的封閉性(資料太少,大多是操作和使用類的),以及客戶的特殊性(都是諸如中國(guó)人民銀行和四大行之類的金融公司,誰(shuí)敢在上面跑一把魯大師?這不是被開(kāi)除的問(wèn)題,而是要進(jìn)監(jiān)獄的),我沒(méi)有辦法從更高的層面去對(duì)比Z196的實(shí)際性能,只能到此為止。但大體看來(lái),個(gè)人認(rèn)為Z196微架構(gòu)比同時(shí)期的Nehalem更強(qiáng)。
Z196系列除了80個(gè)核心外,它還有一個(gè)zBX(zEnterprise BladeCenter Extension)配置,其實(shí)就是提供額外的POWER服務(wù)器來(lái)配合處理數(shù)據(jù)。最高的112 zBX可以擴(kuò)展112臺(tái)雙路8核心POWER7刀片服務(wù)器,裝在4個(gè)機(jī)柜里,一共是224個(gè)處理器1792個(gè)核心。
PS:當(dāng)年IBM基于Z196為12306提交了一套方案,但是最終敗給了價(jià)格,這個(gè)玩意只有金融行業(yè)用得起。
編輯于 2020-04-03 23:18
贊同 40551 條評(píng)論
分享
收藏喜歡
收起
孑然
BIOS, FPGA, IC
?關(guān)注
549 人贊同了該回答
講一個(gè)嚴(yán)格說(shuō)不算CPU的芯片吧,功耗15KW,整片300mm晶圓制成。
這玩意叫Cerebras Wafer Scale Engine,臺(tái)積電16nm工藝制造,面積422.25平方厘米,擁有恐怖的1.2萬(wàn)億個(gè)晶體管,40萬(wàn)個(gè)核心,18GB片上SRAM,100Pb/s片上帶寬。功率大約15KW,含有單個(gè)該芯片的整套系統(tǒng)功耗20KW。怎么樣,比家用電磁爐厲害多了吧!
補(bǔ)充:
散熱系統(tǒng)是這樣的
封裝好是這樣的
編輯于 2020-03-30 19:51
贊同 549106 條評(píng)論
分享
收藏喜歡
收起
匿名用戶
289 人贊同了該回答
PowerMac G5 是蘋果歷史上唯一一個(gè)使用水冷散熱系統(tǒng)的Mac產(chǎn)品,高配型號(hào)使用兩顆PowerPC 970MP雙核處理器,峰值功率達(dá)到4X100W。
但是該型號(hào)水冷系統(tǒng)頻繁出現(xiàn)漏液?jiǎn)栴}。
能讓蘋果唯一一次用上水冷的cpu,可以當(dāng)電暖氣用了。
發(fā)布于 2020-03-25 14:05
贊同 2898 條評(píng)論
分享
收藏喜歡
攢蘑菇的小提莫
消費(fèi)電子一知半解,陰陽(yáng)怪氣一個(gè)頂倆
?關(guān)注
1,409 人贊同了該回答
如圖——
移動(dòng)端火龍當(dāng)屬高通810。
高通驍龍810(MSM8994,2015)為了對(duì)蘋果率先推出移動(dòng)端64位CPU做出回應(yīng),高通不得不提前拿出驍龍810,但事實(shí)證明芯片這東西趕工必暴死——自動(dòng)布線和20nm制程讓本來(lái)就發(fā)高燒的A57架構(gòu)更加雪上加霜。
單核功耗超過(guò)5W,四大核功耗由于散熱問(wèn)題至今無(wú)人得知,這樣的發(fā)熱量直接讓一眾廠商在2015全年都沒(méi)有辦法推出像樣的旗艦機(jī),間接導(dǎo)致了三星獵戶座和海思麒麟的強(qiáng)勢(shì)崛起,還順手把索尼、HTC和LG搞了個(gè)半死。
順帶一提,在冬天的哈爾濱,早年間的蘋果基本通通暴斃,但火龍810不僅可以滿血運(yùn)行,而且自身發(fā)熱還能維護(hù)電池放電。。。
原文地址:
攢蘑菇的小提莫:盤點(diǎn)對(duì)公司進(jìn)程造成巨大影響的七顆移動(dòng)大火龍133 贊同 · 44 評(píng)論文章
—————2020.4.07更新—————
評(píng)論區(qū)說(shuō)X86的HXD提醒了我
280÷64=4.375,不解鎖功耗滿載時(shí)單核才4.4W不到,每個(gè)線程不到2.2W……
大家都是龍系處理器,憑什么你就得噴火呢
地獄炎龍你太丟人了,褪裙吧
編輯于 2020-04-07 08:53