散文網(wǎng) » 科技 »數(shù)碼 » 請(qǐng)停止你的YES：軟件實(shí)測(cè)高頻or多核，誰才是生產(chǎn)力的核心因素？

請(qǐng)停止你的YES：軟件實(shí)測(cè)高頻or多核，誰才是生產(chǎn)力的核心因素？

2020-08-13 17:21 作者:老黃科技秀 0人讀過 | 我要投稿

說起AMD和intel，你最先想到的是什么？由AMD評(píng)測(cè)人員帶頭喊出的鋪天蓋地的AMD YES，還是魯大師和R20恐怖的跑分差距？

為什么廠商沒有進(jìn)行多核優(yōu)化

AMD挑起的“核戰(zhàn)爭(zhēng)”得從推土機(jī)說起，不過由于前人栽樹太多，關(guān)于推土機(jī)鋪墊、銳龍成型這條AMD歷史線就不再累述。從財(cái)報(bào)上看，2016-2019，AMD持續(xù)為填補(bǔ)前期錯(cuò)誤戰(zhàn)略導(dǎo)致的財(cái)務(wù)杠桿失衡，不得不在2016年-2018年間分別賣掉了格羅方德晶圓廠和總部大樓。

而在產(chǎn)品戰(zhàn)略上，在經(jīng)由推土機(jī)的失敗后，AMD大膽革新，將共享浮點(diǎn)單元修正為核心獨(dú)立浮點(diǎn)單元。一個(gè)人吃飯一個(gè)碗，自然都能吃飽。借由模塊化設(shè)計(jì)封裝，多核CPU成本也降低了，核心數(shù)想做多高就做多高，似乎這就是完美的CPU設(shè)計(jì)？

并非如此，一個(gè)軟件利用多少物理內(nèi)核，是由軟件開發(fā)廠商決定，而非硬件廠商決定。軟件在使用時(shí)用戶覺得卡頓，就一定是“沒有進(jìn)行多核優(yōu)化”的問題嗎？并不是，卡頓往往由于應(yīng)用程序比如通過readfile函數(shù)讀本地文件、經(jīng)由I/O請(qǐng)求發(fā)送到win內(nèi)核然后將I/O請(qǐng)求包IRP轉(zhuǎn)發(fā)給硬件驅(qū)動(dòng)的隊(duì)列，緊接著的工作就由對(duì)應(yīng)硬件完成。剛才的I/O請(qǐng)求將被掛起成為L(zhǎng)ISTENING偵聽狀態(tài)。硬件完成請(qǐng)求的操作后，線程將被喚醒，由來路給CPU返回指令。

所以，在整個(gè)線程執(zhí)行過程中，任何一步出現(xiàn)問題，都會(huì)導(dǎo)致用戶體驗(yàn)受損，比如在執(zhí)行后端硬件I/O請(qǐng)求時(shí)，如果硬件請(qǐng)求隊(duì)列多余自身設(shè)計(jì)上限，就會(huì)發(fā)生指令延遲（堵車了），這種響應(yīng)延遲現(xiàn)象再多的線程也無法處理。

從經(jīng)濟(jì)角度上看，游戲/軟件廠商為什么要進(jìn)行太多核心的優(yōu)化？在目前沒有AI輔助設(shè)計(jì)的環(huán)境下，開發(fā)多核支持一方面需要更多的開發(fā)者進(jìn)行開發(fā)和調(diào)試，后期維護(hù)的工作量也遠(yuǎn)遠(yuǎn)高于單核，同時(shí)還要支付一大筆人工開支。最后軟件推出市場(chǎng)并不會(huì)因?yàn)橹С侄嗪硕鳛橘u點(diǎn)多賺錢。從游戲體驗(yàn)角度上看，高并發(fā)將給存儲(chǔ)設(shè)備帶來巨大的壓力，由于多數(shù)民用級(jí)SSD對(duì)于IOPS和QD要求并沒有企業(yè)級(jí)SSD那么苛刻。一旦突發(fā)請(qǐng)求超過硬件響應(yīng)上限，數(shù)據(jù)串流就會(huì)產(chǎn)生延遲，反應(yīng)在玩家的屏幕上就是游戲素材丟失、卡頓等現(xiàn)象，這也在廠商考慮范圍內(nèi)。同時(shí)，廠商在多核開發(fā)上投入的人工與時(shí)間成本，最終依然轉(zhuǎn)嫁到了用戶頭上。

為了避免被人說紙上談兵，老黃盡可能找了幾款不同領(lǐng)域的專業(yè)應(yīng)用軟件，給大家演示一下實(shí)際軟件操作中，多核低頻/多核高頻/少核高頻對(duì)用戶實(shí)際使用的影響，希望這里能幫助專業(yè)用戶明白自己究竟應(yīng)該如何選擇配置。

行業(yè)軟件測(cè)試

這次測(cè)試的平臺(tái)是從七彩虹借來的iGAME Z490 VulcanX，該主板為七彩虹目前的頂級(jí)旗艦級(jí)主板，這款主板搭載了14相供電，應(yīng)用了七彩虹自研I.P.P電感，后濾波電容由Z390 VulcanX的鉭電容變更為臺(tái)系鈺邦固態(tài)電容。但是CPU供電由單8pin升級(jí)到了8+4pin，以滿足十代酷睿強(qiáng)悍的性能需求。

CPU也是借的，這篇文章并非送測(cè)。第十代酷睿i9 10900KF，相比10900K少了核顯，多了更好的溫控，這也許就像人生，有舍有得。在intel TVB技術(shù)的加持下睿頻可高達(dá)5.3G，AMD望塵莫及。顯卡為柏能旗下萬麗推出的GTX1660 6G顯卡，這款顯卡的評(píng)測(cè)在之前做過了，有興趣的可以看一下，性價(jià)比也挺好的。

內(nèi)存為兩根七彩虹之前送測(cè)的全新CVN“捍衛(wèi)者”系列RGB內(nèi)存，XMP3200Mhz，8成PCB/ARGB/特挑CJR，在一些Z490平臺(tái)上超上了4400Mhz，性價(jià)比炸裂，而在本次測(cè)試中老黃將該內(nèi)存設(shè)置為3600 C18-22-22-42 1.42v。

軟件環(huán)境為Windows 10 1909專業(yè)版，測(cè)試軟件為blender、C4D、CATIA、Discovery Studio、Matlab。

老黃首先測(cè)試Discovery Studio，這款軟件主要用于生命科學(xué)領(lǐng)域，研究分子建模模擬計(jì)算。要深入了解一款專業(yè)軟件需要非常長(zhǎng)的時(shí)間，以老黃的知識(shí)積累僅能做一些基礎(chǔ)操作演示。這里生成了2個(gè)方案：?jiǎn)我活愋头肿迎h(huán)境和由一堆腺嘌呤、胸腺嘧啶、胞嘧啶、鳥嘌呤和尿嘧啶（A.T.C.G.U）組成的亂七八糟的核酸，模擬正常操作將視角在核酸內(nèi)部和外部之間穿梭。此時(shí)我們觀察核心使用情況會(huì)發(fā)現(xiàn)：僅有兩個(gè)核心處于高負(fù)載下，其他核心均未介入工作，倒是GPU積極介入了工作中。那么針對(duì)這款應(yīng)用，老黃推薦的是核心夠用、頻率夠高的CPU，預(yù)算不足就上i3 8350K，預(yù)算充足推薦10600K。

第二款軟件是法國(guó)達(dá)索公司出品的CATIA，這個(gè)達(dá)索也就是大名鼎鼎的“幻影”系列戰(zhàn)機(jī)的制造商，同時(shí)也在開發(fā)工業(yè)設(shè)計(jì)軟件，目標(biāo)模型是一個(gè)4000*2800像素的輪胎。在對(duì)輪胎進(jìn)行拖動(dòng)和調(diào)整光照時(shí)，均是單核+GPU在發(fā)力。在歸還該平臺(tái)后老黃又學(xué)會(huì)了使用攝像機(jī)做模型實(shí)時(shí)渲染動(dòng)畫，不過結(jié)果依然是單核發(fā)力。

第三款軟件是被AMD粉絲們津津樂道的C4D了，網(wǎng)上有太多的R20跑分來證明多核的強(qiáng)大，不過各位要注意的是：R20跑分僅能代表模型編輯雕刻工作完成后渲染工作的時(shí)長(zhǎng)，不過在實(shí)際使用中對(duì)一個(gè)模型從多邊形的生成到最后貼圖光照一切就緒，所花費(fèi)的時(shí)間遠(yuǎn)遠(yuǎn)多過渲染，何況目前OC2019渲染器后支持GPU渲染甚至支持RT加速。在測(cè)試中將一個(gè)36面的低模細(xì)分到940萬面的高模，然后我們來觀察在拖動(dòng)光源時(shí)低頻和高頻下操作的流暢程度，Msi after監(jiān)視下可以觀察到也能明顯感覺到，高頻CPU在模型編輯階段操作更加流暢。

第四款軟件為Maltab，是一款商業(yè)數(shù)字計(jì)算軟件，在圖像、深度學(xué)習(xí)、材料模擬、無線通訊等領(lǐng)域都有廣泛的應(yīng)用。今天測(cè)試的方面分為兩部分，圖像處理和神經(jīng)網(wǎng)絡(luò)。圖像處理老黃將讀取、計(jì)算一張RTX3080的4K渲染圖最大、最小與平均灰度。計(jì)算結(jié)果：4核8線程/全核4.9G下，33.3秒完成了圖像解析過程，10核20線程/4.9G也差不多，33秒完成，10核20線程/3.9G則耗費(fèi)了60.5秒。 ?

神經(jīng)網(wǎng)絡(luò)測(cè)試設(shè)置為500神經(jīng)元節(jié)點(diǎn)，每5個(gè)神經(jīng)元顯示一次結(jié)果，數(shù)據(jù)池為一個(gè)2450*7的彩票號(hào)整數(shù)矩陣，計(jì)算目的是預(yù)測(cè)下期開獎(jiǎng)號(hào)。在顯示歸一化結(jié)果后加入toc以顯示訓(xùn)練時(shí)間，可以發(fā)現(xiàn)計(jì)算時(shí)調(diào)用了全核資源，但是在結(jié)果方面：4核/4.9G耗時(shí)27.3秒，而10核3.9G則耗時(shí)38.8秒，即便是調(diào)用了全核資源，高頻在計(jì)算上依然優(yōu)于多核。

多核跑分強(qiáng)，未必性能強(qiáng)

從上述軟件來看，絕大部分專業(yè)應(yīng)用在實(shí)際使用時(shí)依然對(duì)單核與頻率有絕對(duì)的需求，少數(shù)專業(yè)軟件即使支持多核，但是多核對(duì)工作效率的提升遠(yuǎn)遠(yuǎn)不如高頻來的明顯。所以本次測(cè)試最終得出結(jié)論---在專業(yè)領(lǐng)域，盡可能優(yōu)先選擇高頻CPU，因?yàn)榻^大部分應(yīng)用僅對(duì)1-2核優(yōu)化，優(yōu)先滿足CPU和GPU需求后將多余的資金安排在存儲(chǔ)和外設(shè)等方向上，不要被R15、R20、魯大師等跑分軟件蒙蔽。

標(biāo)簽：