請(qǐng)停止你的YES:軟件實(shí)測(cè)高頻or多核,誰才是生產(chǎn)力的核心因素?

說起AMD和intel,你最先想到的是什么?由AMD評(píng)測(cè)人員帶頭喊出的鋪天蓋地的AMD YES,還是魯大師和R20恐怖的跑分差距?

為什么廠商沒有進(jìn)行多核優(yōu)化
AMD挑起的“核戰(zhàn)爭(zhēng)”得從推土機(jī)說起,不過由于前人栽樹太多,關(guān)于推土機(jī)鋪墊、銳龍成型這條AMD歷史線就不再累述。從財(cái)報(bào)上看,2016-2019,AMD持續(xù)為填補(bǔ)前期錯(cuò)誤戰(zhàn)略導(dǎo)致的財(cái)務(wù)杠桿失衡,不得不在2016年-2018年間分別賣掉了格羅方德晶圓廠和總部大樓。

而在產(chǎn)品戰(zhàn)略上,在經(jīng)由推土機(jī)的失敗后,AMD大膽革新,將共享浮點(diǎn)單元修正為核心獨(dú)立浮點(diǎn)單元。一個(gè)人吃飯一個(gè)碗,自然都能吃飽。借由模塊化設(shè)計(jì)封裝,多核CPU成本也降低了,核心數(shù)想做多高就做多高,似乎這就是完美的CPU設(shè)計(jì)?

并非如此,一個(gè)軟件利用多少物理內(nèi)核,是由軟件開發(fā)廠商決定,而非硬件廠商決定。軟件在使用時(shí)用戶覺得卡頓,就一定是“沒有進(jìn)行多核優(yōu)化”的問題嗎?并不是,卡頓往往由于應(yīng)用程序比如通過readfile函數(shù)讀本地文件、經(jīng)由I/O請(qǐng)求發(fā)送到win內(nèi)核然后將I/O請(qǐng)求包IRP轉(zhuǎn)發(fā)給硬件驅(qū)動(dòng)的隊(duì)列,緊接著的工作就由對(duì)應(yīng)硬件完成。剛才的I/O請(qǐng)求將被掛起成為L(zhǎng)ISTENING偵聽狀態(tài)。硬件完成請(qǐng)求的操作后,線程將被喚醒,由來路給CPU返回指令。

所以,在整個(gè)線程執(zhí)行過程中,任何一步出現(xiàn)問題,都會(huì)導(dǎo)致用戶體驗(yàn)受損,比如在執(zhí)行后端硬件I/O請(qǐng)求時(shí),如果硬件請(qǐng)求隊(duì)列多余自身設(shè)計(jì)上限,就會(huì)發(fā)生指令延遲(堵車了),這種響應(yīng)延遲現(xiàn)象再多的線程也無法處理。

從經(jīng)濟(jì)角度上看,游戲/軟件廠商為什么要進(jìn)行太多核心的優(yōu)化?在目前沒有AI輔助設(shè)計(jì)的環(huán)境下,開發(fā)多核支持一方面需要更多的開發(fā)者進(jìn)行開發(fā)和調(diào)試,后期維護(hù)的工作量也遠(yuǎn)遠(yuǎn)高于單核,同時(shí)還要支付一大筆人工開支。最后軟件推出市場(chǎng)并不會(huì)因?yàn)橹С侄嗪硕鳛橘u點(diǎn)多賺錢。從游戲體驗(yàn)角度上看,高并發(fā)將給存儲(chǔ)設(shè)備帶來巨大的壓力,由于多數(shù)民用級(jí)SSD對(duì)于IOPS和QD要求并沒有企業(yè)級(jí)SSD那么苛刻。一旦突發(fā)請(qǐng)求超過硬件響應(yīng)上限,數(shù)據(jù)串流就會(huì)產(chǎn)生延遲,反應(yīng)在玩家的屏幕上就是游戲素材丟失、卡頓等現(xiàn)象,這也在廠商考慮范圍內(nèi)。同時(shí),廠商在多核開發(fā)上投入的人工與時(shí)間成本,最終依然轉(zhuǎn)嫁到了用戶頭上。

為了避免被人說紙上談兵,老黃盡可能找了幾款不同領(lǐng)域的專業(yè)應(yīng)用軟件,給大家演示一下實(shí)際軟件操作中,多核低頻/多核高頻/少核高頻對(duì)用戶實(shí)際使用的影響,希望這里能幫助專業(yè)用戶明白自己究竟應(yīng)該如何選擇配置。
行業(yè)軟件測(cè)試
這次測(cè)試的平臺(tái)是從七彩虹借來的iGAME Z490 VulcanX,該主板為七彩虹目前的頂級(jí)旗艦級(jí)主板,這款主板搭載了14相供電,應(yīng)用了七彩虹自研I.P.P電感,后濾波電容由Z390 VulcanX的鉭電容變更為臺(tái)系鈺邦固態(tài)電容。但是CPU供電由單8pin升級(jí)到了8+4pin,以滿足十代酷睿強(qiáng)悍的性能需求。

CPU也是借的,這篇文章并非送測(cè)。第十代酷睿i9 10900KF,相比10900K少了核顯,多了更好的溫控,這也許就像人生,有舍有得。在intel TVB技術(shù)的加持下睿頻可高達(dá)5.3G,AMD望塵莫及。 顯卡為柏能旗下萬麗推出的GTX1660 6G顯卡,這款顯卡的評(píng)測(cè)在之前做過了,有興趣的可以看一下,性價(jià)比也挺好的。

內(nèi)存為兩根七彩虹之前送測(cè)的全新CVN“捍衛(wèi)者”系列RGB內(nèi)存,XMP3200Mhz,8成PCB/ARGB/特挑CJR,在一些Z490平臺(tái)上超上了4400Mhz,性價(jià)比炸裂,而在本次測(cè)試中老黃將該內(nèi)存設(shè)置為3600 C18-22-22-42 1.42v。

軟件環(huán)境為Windows 10 1909專業(yè)版,測(cè)試軟件為blender、C4D、CATIA、Discovery Studio、Matlab。
老黃首先測(cè)試Discovery Studio,這款軟件主要用于生命科學(xué)領(lǐng)域,研究分子建模模擬計(jì)算。要深入了解一款專業(yè)軟件需要非常長(zhǎng)的時(shí)間,以老黃的知識(shí)積累僅能做一些基礎(chǔ)操作演示。這里生成了2個(gè)方案:?jiǎn)我活愋头肿迎h(huán)境和由一堆腺嘌呤、胸腺嘧啶、胞嘧啶、鳥嘌呤和尿嘧啶(A.T.C.G.U)組成的亂七八糟的核酸,模擬正常操作將視角在核酸內(nèi)部和外部之間穿梭。 此時(shí)我們觀察核心使用情況會(huì)發(fā)現(xiàn):僅有兩個(gè)核心處于高負(fù)載下,其他核心均未介入工作,倒是GPU積極介入了工作中。那么針對(duì)這款應(yīng)用,老黃推薦的是核心夠用、頻率夠高的CPU,預(yù)算不足就上i3 8350K,預(yù)算充足推薦10600K。


第二款軟件是法國(guó)達(dá)索公司出品的CATIA,這個(gè)達(dá)索也就是大名鼎鼎的“幻影”系列戰(zhàn)機(jī)的制造商,同時(shí)也在開發(fā)工業(yè)設(shè)計(jì)軟件,目標(biāo)模型是一個(gè)4000*2800像素的輪胎。在對(duì)輪胎進(jìn)行拖動(dòng)和調(diào)整光照時(shí),均是單核+GPU在發(fā)力。在歸還該平臺(tái)后老黃又學(xué)會(huì)了使用攝像機(jī)做模型實(shí)時(shí)渲染動(dòng)畫,不過結(jié)果依然是單核發(fā)力。


第三款軟件是被AMD粉絲們津津樂道的C4D了,網(wǎng)上有太多的R20跑分來證明多核的強(qiáng)大,不過各位要注意的是:R20跑分僅能代表模型編輯雕刻工作完成后渲染工作的時(shí)長(zhǎng),不過在實(shí)際使用中對(duì)一個(gè)模型從多邊形的生成到最后貼圖光照一切就緒,所花費(fèi)的時(shí)間遠(yuǎn)遠(yuǎn)多過渲染,何況目前OC2019渲染器后支持GPU渲染甚至支持RT加速。在測(cè)試中將一個(gè)36面的低模細(xì)分到940萬面的高模,然后我們來觀察在拖動(dòng)光源時(shí)低頻和高頻下操作的流暢程度,Msi after監(jiān)視下可以觀察到也能明顯感覺到,高頻CPU在模型編輯階段操作更加流暢。


第四款軟件為Maltab,是一款商業(yè)數(shù)字計(jì)算軟件,在圖像、深度學(xué)習(xí)、材料模擬、無線通訊等領(lǐng)域都有廣泛的應(yīng)用。今天測(cè)試的方面分為兩部分,圖像處理和神經(jīng)網(wǎng)絡(luò)。圖像處理老黃將讀取、計(jì)算一張RTX3080的4K渲染圖最大、最小與平均灰度。計(jì)算結(jié)果:4核8線程/全核4.9G下,33.3秒完成了圖像解析過程,10核20線程/4.9G也差不多,33秒完成,10核20線程/3.9G則耗費(fèi)了60.5秒。 ?



神經(jīng)網(wǎng)絡(luò)測(cè)試設(shè)置為500神經(jīng)元節(jié)點(diǎn),每5個(gè)神經(jīng)元顯示一次結(jié)果,數(shù)據(jù)池為一個(gè)2450*7的彩票號(hào)整數(shù)矩陣,計(jì)算目的是預(yù)測(cè)下期開獎(jiǎng)號(hào)。在顯示歸一化結(jié)果后加入toc以顯示訓(xùn)練時(shí)間,可以發(fā)現(xiàn)計(jì)算時(shí)調(diào)用了全核資源,但是在結(jié)果方面:4核/4.9G耗時(shí)27.3秒,而10核3.9G則耗時(shí)38.8秒,即便是調(diào)用了全核資源,高頻在計(jì)算上依然優(yōu)于多核。


多核跑分強(qiáng),未必性能強(qiáng)
從上述軟件來看,絕大部分專業(yè)應(yīng)用在實(shí)際使用時(shí)依然對(duì)單核與頻率有絕對(duì)的需求,少數(shù)專業(yè)軟件即使支持多核,但是多核對(duì)工作效率的提升遠(yuǎn)遠(yuǎn)不如高頻來的明顯。所以本次測(cè)試最終得出結(jié)論---在專業(yè)領(lǐng)域,盡可能優(yōu)先選擇高頻CPU,因?yàn)榻^大部分應(yīng)用僅對(duì)1-2核優(yōu)化,優(yōu)先滿足CPU和GPU需求后將多余的資金安排在存儲(chǔ)和外設(shè)等方向上,不要被R15、R20、魯大師等跑分軟件蒙蔽。