對(duì)phx的一些討論,7840h以及相關(guān)馬甲)

phoenix的一些參數(shù)如上圖,就不一一復(fù)讀了,在這里僅代表我個(gè)人做一些理解上面的闡述。 phx相較rem的提升主要兩點(diǎn):頻率以及芯片制程。ipc方面的提升在低功耗的稀釋下幾乎沒(méi)有,可以看作5800h套了三次馬甲。二緩的翻倍對(duì)于游戲性能的提升也聊勝于無(wú),16m三緩是為了在cpu die內(nèi)塞入12cu顯卡所做的必要妥協(xié),amd也想塞32mb三緩,可惜想不得,如是則需要對(duì)整個(gè)cpu die的圖紙進(jìn)行大刀闊斧的更改,其復(fù)雜程度無(wú)異于設(shè)計(jì)新架構(gòu)。 所以我個(gè)人傾向認(rèn)為amd的架構(gòu)團(tuán)隊(duì)和蘋(píng)果一樣在優(yōu)化了單die總線和統(tǒng)一大三緩后發(fā)生了大規(guī)模跑路,其ipc止步于2020年的zen2。 然而臺(tái)積電的芯片制程也不是蓋的,每一年的一點(diǎn)小小的能耗比提升在2018-2023五年光景中為amd提供了恐怖的能耗比優(yōu)勢(shì),使amd可以用更小的電壓跑出更高的頻率,盡管amd在高功耗環(huán)境下由于架構(gòu)劣勢(shì)干不過(guò)i家,但是憑借臺(tái)積電高能效制程使上代amd的8核小芯片在65w以下的中低功耗日常負(fù)載中就能干翻intel了
圖片來(lái)源:硬件茶談
之后再談phx的顯卡單元,如下圖,超頻+架構(gòu)雙重提升使得phx的fp32跑分提升了41%~46%,但是浮點(diǎn)規(guī)浮點(diǎn),在ts的顯卡分測(cè)試子項(xiàng)中phx幾乎原地踏步。這是今天討論的重點(diǎn):為什么落到宇宙第一好玩的游戲—3dmark中,提頻和架構(gòu)的雙重優(yōu)勢(shì)全部消失不見(jiàn)。這里要說(shuō)一下ts的評(píng)分機(jī)制。
圖片來(lái)源:golden pig upgradepack(手動(dòng)滑稽
大量實(shí)驗(yàn)表明在外接顯卡時(shí),ts的顯卡分會(huì)下降,即使使用m.2導(dǎo)出pcie4.0x8的信號(hào)與顯卡互聯(lián)時(shí)也會(huì)有3%~20%左右的性能損失,即使沒(méi)有cpu與顯卡間通訊帶寬的限制。從這里我們可以推斷出ts顯卡分還與幀生成時(shí)間有關(guān)。在同樣的幀率表現(xiàn)下,幀生成時(shí)間長(zhǎng)的跑分結(jié)果會(huì)加上由于幀生成時(shí)間過(guò)長(zhǎng)所帶來(lái)的負(fù)加權(quán)。由于布線過(guò)長(zhǎng),即使是滿帶寬互聯(lián)的外接顯卡與筆記本cpu之間存在不小的延遲,增大了cpu與gpu互發(fā)指令的時(shí)間。有些指令是無(wú)法被預(yù)測(cè)的,因此卡需要等u的回傳指令再進(jìn)行下一步操作,這無(wú)疑增加了每一幀從cpu繪制到gpu渲染傳輸?shù)斤@示器上的的時(shí)間。680m和780m亦是如此。導(dǎo)致幀生成時(shí)間過(guò)長(zhǎng)有很多種原因,布線過(guò)長(zhǎng)在apu上顯然不成立,而內(nèi)存帶寬是其中之一,但是我個(gè)人認(rèn)為windows對(duì)于核心顯卡調(diào)用ddr內(nèi)存的權(quán)限問(wèn)題比物理帶寬的限制更有可能限制780m的發(fā)揮。在偷跑的4050顯卡ts分?jǐn)?shù)中我們可以看出僅有的96bit gd6 顯存總線寬度并未影響其發(fā)揮,4050與4060間ts跑分差異更接近于核心規(guī)模的差異。ddr5 5600的通信帶寬為89.6gb/s,96bit gddr6x的帶寬為186gb/s我們不妨將其之比與780m和4050的浮點(diǎn)性能之比做一些比較。帶寬之比:0.48;fp32之比:0.36
由此可見(jiàn),當(dāng)ddr5內(nèi)存帶寬空閑時(shí),物理帶寬并沒(méi)有限制780m核心規(guī)模的發(fā)揮
我個(gè)人傾向認(rèn)為微軟在Windows中更傾向于給cpu很高的帶寬和大量已分配好的虛擬內(nèi)存從而限制了核顯發(fā)揮。這一點(diǎn)要在之后amd驅(qū)動(dòng)的優(yōu)化中來(lái)慢慢證實(shí)。
當(dāng)內(nèi)存帶寬成為顯卡瓶頸時(shí),有以下三種常見(jiàn)的情況:1.普通清晰度高幀率 2.高清晰度中低幀率 3.高清晰度高幀率。
顯然不是所有游戲中對(duì)于phx的核顯,內(nèi)存帶寬都能成為性能的瓶頸
在當(dāng)今游戲負(fù)載下,就算再給它12cu,780m憑自己實(shí)力也跑不滿第三種情況因此作為phx的潛在用戶們要做好游戲中的圖形優(yōu)化設(shè)置防止帶寬瓶頸的出現(xiàn)。比如讓780m跑2k游戲非常容易占滿內(nèi)存帶寬,一旦內(nèi)存帶寬被占滿,不只有幀率原地踏步這么簡(jiǎn)單的事情會(huì)發(fā)生,可能幀率忽高忽低,也可能一幀卡幾秒,藍(lán)屏微笑也不是不可能出現(xiàn)。做好游戲畫(huà)質(zhì)優(yōu)化可以極有效降低以上情況的出現(xiàn),讓780m跑在均衡的清晰度和幀率的條件下。我個(gè)人相信對(duì)于ddr5 5600 雙通道的能力絕對(duì)可以容下1200p 60~90fps左右的數(shù)據(jù)吞吐量同時(shí)保留足夠的cpu私有虛擬內(nèi)存帶寬。其他的事情就看微軟以及amd的驅(qū)動(dòng)優(yōu)化尿性了。 最后僅代表我個(gè)人做一下驅(qū)動(dòng)表現(xiàn)好的情況下780m相較680m在低幀率表現(xiàn)的游戲中性能提升的預(yù)測(cè):大膽一些30%