手機(jī)站首頁(yè)散文詩(shī)歌雜文隨筆日記小小說(shuō)

散文網(wǎng) » 生活 »日常 » 【知乎】史上什么CPU堪稱發(fā)熱量巨大？

【知乎】史上什么CPU堪稱發(fā)熱量巨大？

2023-07-21 18:44 作者:失傳技術(shù)電磁所 0人讀過(guò) | 我要投稿

史上什么CPU堪稱發(fā)熱量巨大？

關(guān)注者

433

被瀏覽

1,533,563

關(guān)注問(wèn)題寫回答

邀請(qǐng)回答

好問(wèn)題 34

1 條評(píng)論

103?個(gè)回答

默認(rèn)排序

cotton

筆記本電腦話題下的優(yōu)秀答主

?關(guān)注

804 人贊同了該回答

（修改了部分表達(dá)貶義的詞匯。）

（本文暫時(shí)僅涉及PC處理器，不包括手機(jī)處理器。）

現(xiàn)代的英特爾Skylake-W和Skylake-EP、AMD線程撕裂者和EPYC，這些動(dòng)輒十幾核甚至幾十核的怪物就不講了，它們雖然發(fā)熱巨大，但是性能也非常強(qiáng)。

講兩個(gè)發(fā)熱大性能又相對(duì)差的。

英特爾奔騰D（2005年）

2005年，AMD率先推出了速龍64 X2系列的雙核處理器，也是在民用市場(chǎng)普及的第一款x86雙核CPU。當(dāng)時(shí)的英特爾正被奔騰4的高頻低能所困擾，而奔騰D也是英特爾為了應(yīng)對(duì)AMD的雙核速龍，應(yīng)急推出的一款產(chǎn)品。

奔騰D采用的仍然是奔騰4的Netburst架構(gòu)，把兩個(gè)單核奔4的硅晶核心封裝在一個(gè)基板上，一度被AMD和硬件發(fā)燒友笑稱為“假雙核”、“膠水雙核”。最早的一批奔騰D 800系列基于90nm制程，后來(lái)的奔騰D 900系列基于65nm制程，均采用LGA775接口。

問(wèn)題來(lái)了，Netburst本就是一個(gè)能效比低的架構(gòu)，同頻下性能相對(duì)較差，只能靠強(qiáng)行拉高頻率（3GHz以上）來(lái)解決性能較弱的問(wèn)題，這也讓高頻奔4的發(fā)熱量普遍很高，單核滿載能達(dá)到70W以上。

奔騰D相當(dāng)于把兩個(gè)大火爐集中在了一起，其發(fā)熱量有多恐怖，就可想而知了。

此外，奔騰D的兩個(gè)核心沒(méi)有共享緩存，核心間也沒(méi)有任何獨(dú)立的總線互聯(lián)，因此它們之間的數(shù)據(jù)交換全部需要通過(guò)北橋中的內(nèi)存控制器由內(nèi)存交換數(shù)據(jù)，交換效率受FSB的帶寬和延遲影響較大，導(dǎo)致奔騰D的性能表現(xiàn)也不理想。

種種缺陷注定了奔騰D失敗的命運(yùn)，雖然后期900系列的奔騰D更新制程后發(fā)熱表現(xiàn)好了一些，但仍然不能扭轉(zhuǎn)奔騰D急轉(zhuǎn)直下的口碑和不盡人意的性能表現(xiàn)。在能效比大幅提升的酷睿2發(fā)布后，奔騰D便退居為入門級(jí)雙核處理器產(chǎn)品，直到2007年停產(chǎn)。

AMD FX系列 8核處理器（推土機(jī)和打樁機(jī)，2011-2013年）

來(lái)到2012年，此時(shí)的Intel酷睿處理器已經(jīng)成為新的王者，而AMD這時(shí)候卻走上了一條不歸路——CMT技術(shù)

推土機(jī)架構(gòu)把兩個(gè)核心及相關(guān)單元封裝成一個(gè)模塊，每一個(gè)核心都有完整的整數(shù)運(yùn)算單元；但兩個(gè)核心共用一個(gè)浮點(diǎn)運(yùn)算單元，因此推土機(jī)的8核處理器實(shí)際上只有4個(gè)模塊和4個(gè)浮點(diǎn)運(yùn)算單元。AMD認(rèn)為，未來(lái)CPU主要承擔(dān)的運(yùn)算是以整數(shù)運(yùn)算為主，浮點(diǎn)運(yùn)算更多可以交給GPU來(lái)完成（因?yàn)橥瑑r(jià)位顯卡的浮點(diǎn)運(yùn)算能力比CPU高得多），且將來(lái)的程序會(huì)越來(lái)越多地向多線程優(yōu)化。

然而事與愿違，大部分程序并沒(méi)有按AMD想象的去做（0202年的很多游戲依然對(duì)單線程性能有較高要求、仍需要CPU執(zhí)行大量的浮點(diǎn)運(yùn)算）。此外，類似奔騰4的超長(zhǎng)流水線設(shè)計(jì)、及減少了一半的浮點(diǎn)單元，讓推土機(jī)也成了一個(gè)像奔4一樣高頻低能的架構(gòu)，單核性能相比自家的上代K10架構(gòu)有明顯的倒退。

后面的故事就和奔騰D很像了，“性能不夠、超頻來(lái)湊”，因此AMD推出了一系列高頻的8核處理器，如FX-8150、FX-8350。

把這一點(diǎn)做到極致的是FX-9590，基礎(chǔ)頻率4.7GHz、最大能動(dòng)態(tài)加速到5.0GHz，官方標(biāo)稱TDP達(dá)到恐怖的220W，90%以上的風(fēng)冷散熱器根本壓不住，以至于在后來(lái)AMD零售FX-9590的時(shí)候還搭配了高端水冷散熱器捆綁銷售。盡管如此，F(xiàn)X-9590的性能也就是一個(gè)默頻i7-4770K的水平。

推土機(jī)架構(gòu)的失敗讓AMD在CPU領(lǐng)域遭遇了前所未有的滑鐵盧，成為玩家口中的笑柄，催生出了“i3默秒全”、“農(nóng)企今天翻身了嗎”這樣的口號(hào)。一直到2017年Zen架構(gòu)的發(fā)布，AMD在CPU領(lǐng)域才得以重新翻身。

雖然這倆CPU耗電高、性能弱，但它們并不是沒(méi)有存在的價(jià)值，而且有價(jià)值的原因也是相同的——

便宜

在速龍64 X2開(kāi)始風(fēng)生水起的時(shí)候，AMD的定價(jià)很高，2005年和2006年的雙核基本上都要2000塊起步，而奔騰D 820的價(jià)格只要1000多塊，后續(xù)推出的入門級(jí)PD 805甚至打到了千元以內(nèi)。

同理，AMD的推土機(jī)系列價(jià)格也不算高，F(xiàn)X-8150也只要不到2000塊就能入手，并且不鎖倍頻，和帶K的二代、三代四核i5價(jià)格相仿。

編輯于 2020-03-30 16:10

贊同 804127 條評(píng)論

收藏喜歡

收起

BORN

除了作死什么都不會(huì)，不過(guò)幸運(yùn)的是每次我都作得一手好死

?關(guān)注

405 人贊同了該回答

要是把范圍局限在通用CPU上的話（WSE那種專用處理器不算），那沒(méi)什么CPU的功耗能和IBM大型機(jī)服務(wù)器比，巴掌大的CPU算什么？來(lái)看看和人頭一樣大的CPU。

IBM Z196，十年前的產(chǎn)品，45nm工藝制造，每個(gè)PU包含四個(gè)5.2GHz核心，4*1.5MB L2和24MB L3。

下面圖片里的Z196 MCM，集成了20個(gè)PU（MCM里其實(shí)集成了24個(gè)，但是有4個(gè)是用來(lái)備份的，最多只有20個(gè)能工作），一共80個(gè)5.2GHz核心，120MB L2、480 MB L3和1920MB L4（每?jī)蓚€(gè)PU單元共享192MB），每套功耗1800W。沒(méi)錯(cuò)，煮飯、炒菜、燒開(kāi)水無(wú)所不能。

Z196最高配置（M80），可以放80個(gè)PU（4套MCM），每個(gè)book里可以放1套，都位于A Frame機(jī)柜里。

后來(lái)IBM Z13/14和15的處理器，外觀類型都是類似的，都是這樣的多芯片MCM結(jié)構(gòu)。

2020.04.02更新

今天來(lái)回答幾個(gè)大家都比較關(guān)心的問(wèn)題，IBM大型機(jī)處理器的性能，和同年代x86處理器相比如何？

首先要明確的一點(diǎn)是，諸如Z196這樣的處理器，名義上是通用處理器，但實(shí)際上它的業(yè)務(wù)特性是比較明顯的，最典型的就是銀行和證券公司的交易，每天進(jìn)出多少金額、買賣多少股票，全部都是非常單純的數(shù)學(xué)計(jì)算。

更關(guān)鍵的是，我們知道一般的計(jì)算機(jī)都是指2進(jìn)制計(jì)算機(jī)，CPU內(nèi)部運(yùn)算時(shí)都使用2進(jìn)制浮點(diǎn)數(shù)，但我們?nèi)粘Ｊ褂玫臄?shù)字卻是10進(jìn)制。而用2進(jìn)制去表示10進(jìn)制浮點(diǎn)數(shù)時(shí)，其結(jié)果只是近似的，而且是不連續(xù)的。這一點(diǎn)在金融系統(tǒng)高頻次、大數(shù)據(jù)量的交易當(dāng)中會(huì)導(dǎo)致一些問(wèn)題，比如誤差的累積。

這一點(diǎn)其實(shí)反映到了這類CPU的硬件設(shè)計(jì)上，我先看看下面的微架構(gòu)圖。

拿Z196來(lái)說(shuō)，我們可以明顯的看出，這是一個(gè)三發(fā)射、亂序執(zhí)行的超標(biāo)量處理器。

很多朋友可能會(huì)認(rèn)為，三發(fā)射？這豈不和奔騰4一樣落后？其實(shí)不然，因?yàn)橄啾葂86，Z系列是更接近于傳統(tǒng)CISC的設(shè)計(jì)，流水線的復(fù)雜性比x86要更復(fù)雜，所以不能直接比較。

就拿奔騰4來(lái)說(shuō)，3個(gè)解碼器其實(shí)是1+2的配置，也就是1個(gè)Complex Decoder和2個(gè)Simple Decoder，前者的輸出是3個(gè)uops，后者是1個(gè)uop，也就是理論情況下每周期能輸出5個(gè)uops。而和Z196同時(shí)代的Nehalem（INTEL第一代i系列），則是1+3配置，3個(gè)Simple Decoder的輸出也是1個(gè)uop，而1個(gè)Complex Decoder的輸出是4個(gè)uops，一共是7個(gè)uops，INTEL擠了那么多年的牙膏Skylake架構(gòu)也只是1+4配置，一共8個(gè)uops。

回到Z196上，我們可以發(fā)現(xiàn)，這貨根本沒(méi)有Simple Decoder，3個(gè)都是Complex Decoder，這是之前我說(shuō)它更接近于CISC的原因。每個(gè)解碼器都能輸出3個(gè)uops，一共是9個(gè)uops，也就是說(shuō)理論上它的單周期解碼能力其實(shí)要比nehalem更強(qiáng)。同時(shí)帶來(lái)的是240字節(jié)的超大Instruction buffer，Nehalem上功能類似的Pre-decoder buffer只有16字節(jié)。

再來(lái)看后端SIMD部分，Z196有3組通用執(zhí)行端口，對(duì)應(yīng)2組Integer單元、1組Floathing單元，以及2組獨(dú)立的Load/store單元（就是圖中的AGU）。Nehalem同樣是是3組通用執(zhí)行端口，對(duì)應(yīng)1組Integer單元、2組Floathing單元，以及3組Load/store單元?？梢钥闯龆叩膫?cè)重程度不同，Z系列是更側(cè)重整數(shù)運(yùn)算的，這點(diǎn)也能從80組整數(shù)浮點(diǎn)/微代碼寄存器和4uops的寬度看出來(lái)。

然后我們可以注意到Z196最大的一個(gè)不同，在Port 4上還有1組Hex Binary FPU和1組Decimal FPU，這就是IBM的絕活了，這兩組浮點(diǎn)單元可以直接在硬件層面進(jìn)行16進(jìn)制和10進(jìn)制運(yùn)算，直接從根本上解決了2進(jìn)制到10/16進(jìn)制轉(zhuǎn)換的精度問(wèn)題，同時(shí)也提高了效率。

之后是緩存和內(nèi)存部分，這一點(diǎn)其實(shí)沒(méi)什么好比的，Z系列擁有更大的、更多級(jí)、更復(fù)雜的緩存體系，L1 I-Cache和D-Cache的容量是Nehalem的兩倍（其實(shí)可以看出，Z196也是一個(gè)馮諾依曼/哈弗架構(gòu)混合體），L2 Cache的寬度比Nehalem大50%，MCM上那恐怖的1920MB L4甚至都可以當(dāng)內(nèi)存使。

最后由于Z系列的封閉性（資料太少，大多是操作和使用類的），以及客戶的特殊性（都是諸如中國(guó)人民銀行和四大行之類的金融公司，誰(shuí)敢在上面跑一把魯大師？這不是被開(kāi)除的問(wèn)題，而是要進(jìn)監(jiān)獄的），我沒(méi)有辦法從更高的層面去對(duì)比Z196的實(shí)際性能，只能到此為止。但大體看來(lái)，個(gè)人認(rèn)為Z196微架構(gòu)比同時(shí)期的Nehalem更強(qiáng)。

Z196系列除了80個(gè)核心外，它還有一個(gè)zBX（zEnterprise BladeCenter Extension）配置，其實(shí)就是提供額外的POWER服務(wù)器來(lái)配合處理數(shù)據(jù)。最高的112 zBX可以擴(kuò)展112臺(tái)雙路8核心POWER7刀片服務(wù)器，裝在4個(gè)機(jī)柜里，一共是224個(gè)處理器1792個(gè)核心。

PS：當(dāng)年IBM基于Z196為12306提交了一套方案，但是最終敗給了價(jià)格，這個(gè)玩意只有金融行業(yè)用得起。

編輯于 2020-04-03 23:18

贊同 40551 條評(píng)論

收藏喜歡

收起

孑然

BIOS, FPGA, IC

?關(guān)注

549 人贊同了該回答

講一個(gè)嚴(yán)格說(shuō)不算CPU的芯片吧，功耗15KW，整片300mm晶圓制成。

這玩意叫Cerebras Wafer Scale Engine，臺(tái)積電16nm工藝制造，面積422.25平方厘米，擁有恐怖的1.2萬(wàn)億個(gè)晶體管，40萬(wàn)個(gè)核心，18GB片上SRAM，100Pb/s片上帶寬。功率大約15KW，含有單個(gè)該芯片的整套系統(tǒng)功耗20KW。怎么樣，比家用電磁爐厲害多了吧！

補(bǔ)充：

散熱系統(tǒng)是這樣的

封裝好是這樣的

編輯于 2020-03-30 19:51

贊同 549106 條評(píng)論

收藏喜歡

收起

匿名用戶

289 人贊同了該回答

PowerMac G5 是蘋果歷史上唯一一個(gè)使用水冷散熱系統(tǒng)的Mac產(chǎn)品，高配型號(hào)使用兩顆PowerPC 970MP雙核處理器，峰值功率達(dá)到4X100W。

但是該型號(hào)水冷系統(tǒng)頻繁出現(xiàn)漏液?jiǎn)栴}。

能讓蘋果唯一一次用上水冷的cpu，可以當(dāng)電暖氣用了。

發(fā)布于 2020-03-25 14:05

贊同 2898 條評(píng)論

收藏喜歡

攢蘑菇的小提莫

消費(fèi)電子一知半解，陰陽(yáng)怪氣一個(gè)頂倆

?關(guān)注

1,409 人贊同了該回答

如圖——

移動(dòng)端火龍當(dāng)屬高通810。

高通驍龍810（MSM8994，2015）為了對(duì)蘋果率先推出移動(dòng)端64位CPU做出回應(yīng)，高通不得不提前拿出驍龍810，但事實(shí)證明芯片這東西趕工必暴死——自動(dòng)布線和20nm制程讓本來(lái)就發(fā)高燒的A57架構(gòu)更加雪上加霜。

單核功耗超過(guò)5W，四大核功耗由于散熱問(wèn)題至今無(wú)人得知，這樣的發(fā)熱量直接讓一眾廠商在2015全年都沒(méi)有辦法推出像樣的旗艦機(jī)，間接導(dǎo)致了三星獵戶座和海思麒麟的強(qiáng)勢(shì)崛起，還順手把索尼、HTC和LG搞了個(gè)半死。

順帶一提，在冬天的哈爾濱，早年間的蘋果基本通通暴斃，但火龍810不僅可以滿血運(yùn)行，而且自身發(fā)熱還能維護(hù)電池放電。。。

原文地址：

攢蘑菇的小提莫：盤點(diǎn)對(duì)公司進(jìn)程造成巨大影響的七顆移動(dòng)大火龍133 贊同 · 44 評(píng)論文章

—————2020.4.07更新—————

評(píng)論區(qū)說(shuō)X86的HXD提醒了我

280÷64=4.375，不解鎖功耗滿載時(shí)單核才4.4W不到，每個(gè)線程不到2.2W……

大家都是龍系處理器，憑什么你就得噴火呢

地獄炎龍你太丟人了，褪裙吧

編輯于 2020-04-07 08:53

標(biāo)簽：