星曜之光如7而至,影馳GeForce RTX 4070 星曜OC顯卡首發(fā)評(píng)測(cè)
??前言
距離NVIDIA發(fā)售RTX?40系顯卡已經(jīng)過(guò)去半年有多了,不知道大家用上新顯卡,體驗(yàn)DLSS?3帶來(lái)的巨大性能提升了嗎?也許不少玩家對(duì)高端顯卡的售價(jià)猶豫不決,期待一款既有強(qiáng)勁性能又能維持合理價(jià)格的顯卡,現(xiàn)在它來(lái)了!NVIDIA在昨天終于公布了GeForce?RTX?4070顯卡,新顯卡有著媲美RTX?3080的性能,更低的功耗,相信會(huì)成為更多硬核玩家的首選。

而影馳作為NVIDIA的核心AIC合作伙伴之一,也發(fā)布了旗下的RTX?4070顯卡,我們這次收到的是影馳GeForce?RTX?4070?星曜OC顯卡,這代星曜的設(shè)計(jì)經(jīng)過(guò)全新升級(jí),更強(qiáng)的散熱系統(tǒng)助力顯卡澎湃釋放,更亮眼的ARGB帶來(lái)非凡的視覺(jué)體驗(yàn),下面就一起看看這代星曜究竟有什么魔力能夠讓一眾玩家鐘情
于它。
*下文“影馳GeForce?RTX?4070?星曜?OC”簡(jiǎn)稱為“影馳RTX?4070星曜OC”
??規(guī)格對(duì)比
在開始測(cè)試前,我們先了解一下影馳RTX?4070星曜OC的配置,首當(dāng)其沖的自然是顯卡的“心臟”——AD104核心,在RTX?4070?Ti首發(fā)測(cè)試時(shí)我們知道,那上面搭載的才是完整版的AD104核心,而RTX?4070上的這顆則是閹割版。
從下圖可以看到,完整的AD104核心應(yīng)該包括5個(gè)GPC(圖形處理集群)、30個(gè)TPC(紋理處理集群)、60個(gè)SM(流式多處理器)以及一個(gè)帶有6個(gè)32Bit顯存控制器的256Bit顯存帶寬。
而RTX?4070上的這顆AD104核心則只有4個(gè)GPC(圖形處理集群),其中1個(gè)GPC也是經(jīng)過(guò)閹割的、另外還有23個(gè)TPC(紋理處理集群)、46個(gè)SM(流式多處理器)以及一個(gè)帶有6個(gè)32Bit顯存控制器的256Bit顯存帶寬。二級(jí)緩存部分也與RTX?4070?Ti有細(xì)微差距,RTX?4070?Ti為48MB的二級(jí)緩存,而RTX?4070則是36MB,不過(guò)相比起前代的RTX?3070或RTX?3070?Ti的4MB二級(jí)緩存,可以是降維打擊了。
除此之外,影馳RTX?4070星曜OC上的這顆AD104核心被命名為AD104-250-A1,TSMC?4N工藝制造,芯片面積為295平方毫米,雖然不及上代的面積大,但因?yàn)楣に囍瞥痰倪M(jìn)步,影馳RTX?4070星曜OC上的這顆AD104內(nèi)塞下了更多的晶體管,足足有358億之多,并且頻率上也往前邁進(jìn)了300MHz以上,可以說(shuō)是全方位的領(lǐng)先。
其他參數(shù)也是堆料十足,5888個(gè)CUDA,46個(gè)第三代RTX?Cores,184個(gè)第四代Tensor?Cores,并且用上了12GB的GDDR6X顯存,相比上代的提升還是很明顯的,大顯存配合性能上的提升更可以為游戲以及創(chuàng)作者帶來(lái)更好的使用體驗(yàn)。
??外觀賞析:影馳 GeForce RTX 4070 星曜 OC
講完了規(guī)格,終于可以一睹顯卡芳容了,有一說(shuō)一,影馳在設(shè)計(jì)上是有一手的,單是包裝盒的吸睛程度已經(jīng)超越一眾競(jìng)品了。彩色鍍膜工藝讓顯卡時(shí)刻光鮮照人,大膽的二次元戰(zhàn)姬形象讓游戲玩家大飽眼福!
正面的影馳Logo在彩色鍍膜的映襯下,從各個(gè)角度看過(guò)去更是熠熠生輝,辨識(shí)度拉滿。
包裝盒上還有另一個(gè)值得關(guān)注的點(diǎn),在右上角還特地標(biāo)注了影馳RTX?4070星曜OC支持三年質(zhì)保以及個(gè)人送保,玩家可以放心購(gòu)買。
包裝盒的背面一樣霞光四射,不過(guò)上面印的是影馳RTX?4070星曜OC的產(chǎn)品特色,如全新升級(jí)的星卓Ⅲ散熱系統(tǒng)、ARGB燈效展示、黑科技DLSS?3以及8K多屏輸出支持等等。
打開包裝,可以說(shuō)是應(yīng)有盡有了,除了顯卡本體外,星曜定制的顯卡支架驚艷亮相,附贈(zèng)的還有5V?ARGB同步線、顯卡支架同步線等,接電感受神光同步的洗禮。
正面外觀延續(xù)了星曜系列一貫的純白設(shè)計(jì),整體設(shè)計(jì)采用鉆石切割工藝,通體透露出寶石般晶瑩的白色,顏值絕對(duì)是一眾顯卡中最出眾的存在。
三把102mm的散熱風(fēng)扇坐鎮(zhèn),搭配四周的鉆切外殼,透明的設(shè)計(jì)在RGB的照耀下帶來(lái)絕佳的視覺(jué)盛宴,完美詮釋了什么叫科技美學(xué)。
放大看,每個(gè)散熱風(fēng)扇都有一圈水晶外殼包邊,視覺(jué)效果尤為明顯,另外這個(gè)透明上蓋是可以卸下的,玩家可以在白色的面板上打造專屬自己的外觀。
當(dāng)然DIY可不止在白色面板上涂鴉,影馳也為極客玩家推出了5套官方定制方案的星曜外殼,樣式豐富,顏值驚人,每天換一款,天天用的都是新顯卡!
這次我們先拿到的是“校園版”的顯卡“皮膚”,一起換上這個(gè)新皮膚看看吧。
換上校園版的皮膚后,影馳RTX?4070星曜OC一下就煥發(fā)新機(jī),正面透明的鉆切外殼配合底下櫻花般的紋理,別有一番韻味。不得不說(shuō),影馳拿捏玩家確實(shí)有一套,光是這個(gè)皮膚就讓人欲罷不能。
背面則是二次元濃度拉滿,正中央則是穿著華麗校服的星曜娘,旁邊巨大的“曜”字與外包裝不謀而合,在鏤空窗口處還有“放肆玩”的Slogan,彰顯了星曜系列一直以來(lái)所說(shuō)的“青春無(wú)極限,就要放肆玩”,同時(shí)也與校園版的顯卡皮膚十分契合。
看回純白設(shè)計(jì)的影馳RTX?4070星曜OC,其背板是高端顯卡常見的金屬背板設(shè)計(jì),白色噴涂搭配絲印工藝提升了整體的質(zhì)感的同時(shí)也詮釋了什么叫做“純白美學(xué)”。
金屬背板的末端是大面積的鏤空,旁邊還有多如繁星的鏤空裝飾,有顏的同時(shí),還能夠增強(qiáng)散熱表現(xiàn)。
顯卡的頂部則是常規(guī)的”GEFORCE?RTX”字樣以及一長(zhǎng)排的鰭片散熱口,用于加速內(nèi)部空氣流動(dòng),降低核心溫度。
顯卡供電用的是全新的12VHPWR供電接口,使用一根12VHPWR的電源線就可達(dá)到供電需求。相比之前的8Pin接口,安裝確實(shí)更加方便快捷。
如果使用的是ATX2.0標(biāo)準(zhǔn)的電源,那可以使用包裝盒內(nèi)隨機(jī)附贈(zèng)的雙8Pin轉(zhuǎn)16Pin的轉(zhuǎn)接線,也能滿足這張影馳RTX?4070星曜?OC的供電要求。
視角切到顯卡底部,還可以看到顯卡的PCIe金手指,標(biāo)準(zhǔn)的PCIe?4.0?x?16速率,它可以為顯卡提供更快的傳輸速度。
最后再介紹一下這張顯卡的視頻輸出接口,影馳給它配備了3個(gè)DP1.4a和1個(gè)HDMI2.1,支持4屏顯示或最高8K@60Hz的超清輸出。
并且從這個(gè)角度可以看到,影馳RTX?4070星曜OC終于不像其他幾款顯卡一樣,開始“瘦身”了,側(cè)面看過(guò)去僅有2槽多的厚度,官方數(shù)據(jù)是56mm厚,終于可以塞進(jìn)小機(jī)箱了。
??RGB燈效展示:影馳 GeForce RTX 4070 星曜 OC
看完外觀設(shè)計(jì),怎能不見識(shí)一下RGB在鉆切外殼下的驚艷效果呢?下面隨筆者的鏡頭一起看看影馳RTX?4070星曜OC那炫酷而又恰如其分的RGB燈效。
通電點(diǎn)亮后,映入眼簾的便是正中間的信仰Logo“BOOMSTAR”,多層折射鏡面設(shè)計(jì),在ARGB燈效下光彩奪目,第一眼就抓住了一眾游戲發(fā)燒友的心。
星曜定制的顯卡支架也是玩燈的一把好手,用上了同款鉆切鏡面設(shè)計(jì),并且還支持RGB同步燈效,一同感受整個(gè)機(jī)箱都為RGB所照亮。
頂部的Logo燈牌除了可以展示炫酷的RGB燈效,還自帶檢測(cè)功能,黃燈表示顯卡外接供電異常,而紅燈則表示主板異常,玩家排障更直觀。
要說(shuō)RGB最出眾的自然是正面的三把散熱風(fēng)扇,鉆切的棱鏡花邊折射RGB燈光,配合半透明磨砂質(zhì)感的扇葉,風(fēng)扇轉(zhuǎn)動(dòng)后,五光十色的燈效讓顯卡顏值更進(jìn)一步,不得不說(shuō)玩燈還得是你影馳。
既然是玩燈,那燈效自然是支持自定義的,在官方配套的魔盤Xtreme?Tuner控制軟件中,玩家可以對(duì)影馳RTX?4070星曜OC上的燈效進(jìn)行客制化,并且它們也支持與其他硬件同步燈效。
極客的顏值配上炫彩的RGB燈效,這絕對(duì)是白色主題裝機(jī)的最佳選擇,即使是對(duì)RGB不感冒的用戶看來(lái),也會(huì)被它璀璨奪目的RGB燈效所吸引,不得不拜倒在它的顏值下。
??顯卡拆解:影馳 GeForce RTX 4070 星曜 OC
顯卡拆解是評(píng)測(cè)不可或缺的一部分,擰下金屬背板上的多顆螺絲后,PCB就可以跟星卓III散熱系統(tǒng)分離了,整體拆解難度不大。
首先看看影馳RTX?4070星曜?OC的PCB,一眼就能看出此次影馳采用的是自研非公版設(shè)計(jì),8層高規(guī)格工藝打造,并且在設(shè)計(jì)上影馳也加入了一些自己的理解和創(chuàng)新,鏤空PCB設(shè)計(jì)既美觀,又能夠幫助顯卡散熱,展現(xiàn)了一線大廠的設(shè)計(jì)實(shí)力。
PCB的背面相比正面密密麻麻的排布就顯得整潔許多,背面基本上是各類控制芯片。不過(guò)從背面依然可以看到核心上安排了POSCAP(導(dǎo)電聚合物鉭電容),有助于提升顯卡的電氣性能。
PCB上的主角永遠(yuǎn)是這顆性能強(qiáng)勁的“心臟”——AD104-250-A1核心,TSMC?4N工藝打造,295mm2的芯片面積內(nèi)塞下了5888個(gè)CUDA?核心,同時(shí)內(nèi)部還有46個(gè)第三代RTX?Cores,184個(gè)第四代Tensor?Cores以及36MB的L2緩存,性能強(qiáng)勁不言而喻。
核心的四周就是NVIDIA與美光獨(dú)家研制的GDDR6X顯存,足足有6顆,型號(hào)是3DU47?D8BZC,單顆顯存容量為2GB,6顆顯存共組成12GB。要知道上代的RTX?3070也只給了8GB,現(xiàn)在給到了12GB,加上21Gbps的顯存等效頻率,讓影馳RTX?4070星曜OC有了更多處理復(fù)雜項(xiàng)目的能力。
供電規(guī)模在一眾RTX?4070顯卡中也是佼佼者,畢竟要驅(qū)動(dòng)的可是AD104這種高端核心,影馳RTX?4070星曜OC采用11相豪華供電配置,核心供電位于PCB左側(cè)。另外在PCB上還可以看到3相顯存供電,位置則安排在PCB右側(cè)。
無(wú)論是核心供電還是顯存供電都采用了獨(dú)立的DrMos芯片,來(lái)自安森美,型號(hào)是NCP302150,單顆持續(xù)輸出電流為50A,足以帶動(dòng)AD104與GDDR6X顯存這兩個(gè)性能大戶。
PWM供電芯片則被安排在PCB背面,型號(hào)為uP9512R,用于同時(shí)管理核心供電金和顯存供電。
正面的uS5650Q則擔(dān)任電壓/電流/功耗監(jiān)控的工作,是不可或缺的芯片之一。
而在uS5650Q隔壁的GM009A?93F150芯片則是顯卡的RGB控制芯片,你所見到的炫酷燈光就是它的功勞。
PCB的底部就是PCIe金手指了,標(biāo)準(zhǔn)的PCIe?4.0?x16速率,使用前務(wù)必確保其接入主板上最高速率的PCIe插槽及開啟主板Resizable?BAR功能,這樣顯卡才能夠滿血釋放。
再看看電源接口,最新的12VHPWR,單口就能提供600W的供電能力,用在最高250W的影馳RTX?4070星曜?OC上屬實(shí)是有些大材小用了,不過(guò)也說(shuō)明影馳給這款顯卡的堆料相當(dāng)豪華。
供電接口的背后還有兩顆LR22電容坐鎮(zhèn),保障顯卡電源的穩(wěn)定輸出,隨時(shí)讓影馳RTX?4070星曜OC火力全開。
看完了堆料配置,該看看這款顯卡的散熱如何了,影馳RTX?4070星曜?OC也用上了星卓III散熱系統(tǒng),這可是自家RTX?4090、RTX?4080的同款,一下子就讓我來(lái)精神了,如此高規(guī)的散熱系統(tǒng),那這款顯卡的散熱一定令人期待。
初見散熱器,其中間就是大面積的均熱板,并且影馳在均熱板上還為顯存、電感、MOS管接觸的地方用上了高系數(shù)的導(dǎo)熱墊輔助散熱。
放大看細(xì)節(jié),在均熱板的中央就是AD104核心的位置,這里也是直觸均熱板設(shè)計(jì),并且在二者之間填充了散熱系數(shù)極高的硅脂,為的就是快速帶走核心熱量,滿血釋放性能。
不僅僅正面的均熱板有散熱,金屬背板上同樣安排了導(dǎo)熱墊,配合金屬導(dǎo)熱性強(qiáng)的特性,影馳RTX?4070星曜?OC的散熱效能可以說(shuō)是拉滿了。
整個(gè)散熱器被分為兩段式設(shè)計(jì),大面積的導(dǎo)流型散熱鰭片遍布全身,散熱鰭片之下藏著5根Φ6mm的鍍鎳復(fù)合熱管,貫穿整個(gè)散熱器,回流焊接工藝加持保證高效導(dǎo)熱。
要說(shuō)細(xì)節(jié)設(shè)計(jì)還得看影馳,在散熱器的一側(cè),我們還可以看到新增了一個(gè)金屬加強(qiáng)件,用于保護(hù)鰭片不變形,畢竟前面幾張顯卡的重量大家也是有目共睹了。并且這個(gè)設(shè)計(jì)還能有效帶動(dòng)熱量傳導(dǎo)至背板,提高散熱性能。
主動(dòng)散熱部分用的是3個(gè)102mm的風(fēng)扇,厚度達(dá)到了驚人的20mm,并且每把風(fēng)扇上帶有11片靜霜葉片,升級(jí)后的扇葉,可實(shí)現(xiàn)更強(qiáng)風(fēng)壓和更大風(fēng)量,并且支持智能啟停,保證顯卡隨時(shí)全力輸出。
最后來(lái)個(gè)全家福,影馳RTX?4070星曜OC的堆料可以用豪華來(lái)形容,都知道RTX?4070?Ti用這款散熱系統(tǒng)時(shí)已經(jīng)有出色的溫控,現(xiàn)在RTX?4070也用這款散熱,完全有充足的余量供玩家發(fā)揮,這也讓筆者對(duì)它的超頻充滿期待。
?測(cè)試平臺(tái)介紹
相信上面的部分已經(jīng)讓大家大飽眼福了,那影馳RTX?4070星曜OC的性能表現(xiàn)究竟如何,下面就讓我們一同探索!
首先介紹一下本次的測(cè)試平臺(tái),我們用上了評(píng)測(cè)室的最強(qiáng)硬件,CPU使用的是目前的旗艦——Intel?i9-13900KS處理器,主板為影馳Z790?金屬大師,搭配同款的影馳星曜32GB?DDR5-6000高規(guī)格內(nèi)存,確保這張顯卡能夠釋放全部性能。
得益于Ada?Lovelace架構(gòu)的革新和TSMC?4N工藝的加持,影馳RTX?4070星曜OC有著不錯(cuò)的能耗比,因此我們也給它配備了一款體積小巧、穩(wěn)定優(yōu)秀的電源——XPG 魔核金牌全模組750W冰雪白。
這款電源可以說(shuō)相當(dāng)亮眼的,內(nèi)部用料以及結(jié)構(gòu)都是相當(dāng)成熟,主動(dòng)PFC+全橋LLC+Dc-dc+同步整流技術(shù),通過(guò)80PLUS?金牌認(rèn)證,采用電線全模組化,加上小巧的體積,14cm長(zhǎng)度設(shè)計(jì)等,不得不說(shuō)它就是你RTX?4070的最佳拍檔。
測(cè)試平臺(tái)方面我們已經(jīng)祭出了目前地表最強(qiáng)的硬件,那拿來(lái)襯這張顯卡的顯示器自然也不能弱,用的依舊是天花板級(jí)別的AGON?PD32M保時(shí)捷聯(lián)名款,4K@144Hz的高刷,絲般順滑暢享市面上的3A游戲。
測(cè)試前還是要驗(yàn)明正身,在GPU-Z中可以看到影馳?RTX?4070星曜?OC的基礎(chǔ)頻率為1920MHz,Boost頻率為2610MHz,比公版足足多了135MHz!可以期待一下它的性能表現(xiàn),另外TGP設(shè)定卻給到了250W,溫度墻也跟RTX?4080為同一水平線的88℃,看來(lái)影馳給極客玩家預(yù)留了充足的超頻空間。
??理論性能測(cè)試
實(shí)測(cè)開始,首先帶大家體驗(yàn)全世界最好玩的游戲《3DMark》,從理論性能來(lái)看,影馳RTX?4070星曜OC相比上代的RTX?3070?Ti有著更為出色的性能表現(xiàn),整體性能是后者的1.3倍以上。已經(jīng)比肩上代的RTX?3080了,不得不說(shuō)這樣的性能表現(xiàn),著實(shí)讓我有些意外。
在注重游戲的Time?Spy和Fire?Strike測(cè)試中,影馳RTX?4070星曜OC也有不俗的表現(xiàn),兩項(xiàng)成績(jī)領(lǐng)先RTX?3070?Ti約20%,這也讓筆者對(duì)這張顯卡的實(shí)際游戲表現(xiàn)充滿期待。而在老黃引以為傲的光追跟DLSS上,這款顯卡也取得了長(zhǎng)足的進(jìn)步,PortRoyal項(xiàng)目中突破1w分大關(guān),領(lǐng)先前代的RTX?3070?Ti?約3000分,提升幅度令人驚喜。DLSS項(xiàng)目中,DLSS?2更上一層樓,4K也能穩(wěn)定60?FPS,還給玩家?guī)?lái)了驚喜連連的DLSS?3黑科技!
而在GPGPU理論性能測(cè)試方面,擁有Ada?Lovalace架構(gòu)的RTX?40系列顯卡在算力上也有出色的性能表現(xiàn),尤其是單精度和雙精度浮點(diǎn)運(yùn)算上,提升幅度是最大的。影馳RTX?4070星曜OC相比RTX?3070?Ti顯卡有著巨幅提升,領(lǐng)先幅度足足有40%以上,整體性能也是RTX?3070的1.5倍左右。
??游戲性能測(cè)試
理論性能的提升令人眼前一亮,游戲性能才是眾多游戲發(fā)燒友關(guān)注的重點(diǎn),因此我們選擇了多款游戲在多種分辨率下進(jìn)行實(shí)測(cè),讓你一睹影馳RTX?4070星曜OC在游戲中的風(fēng)采。
首先是常見的1080P分辨率,這對(duì)于影馳RTX?4070星曜OC來(lái)說(shuō)是小菜一碟,不少游戲都能穩(wěn)定運(yùn)行在150?FPS以上,像《戰(zhàn)爭(zhēng)機(jī)器5》這樣優(yōu)化比較好的游戲,不開任何DLSS加成,它也能接近200?FPS。相比起20系的RTX?2070?Super,幀數(shù)幾乎是翻倍的提升,即便是面對(duì)上一代的RTX?3070或RTX?3070?Ti,影馳RTX?4070星曜OC的游戲性能也是它們的1.3倍左右。
2K分辨率則是影馳RTX?4070星曜OC的主場(chǎng)了,在這個(gè)分辨率下,一眾游戲依舊有120?FPS左右的表現(xiàn),如果你玩的是像《古墓麗影:暗影》這類的老3A大作,優(yōu)化效果更明顯,這張顯卡能在2K分辨率下跑出205?FPS的超高成績(jī),可見RTX?4070的實(shí)習(xí)非同小可!而一些優(yōu)化一般的游戲,影馳RTX?4070星曜OC也有優(yōu)勢(shì),素有“顯卡離去”之稱的《地鐵:離去》,RTX?2070?Super幾乎是不可玩的狀態(tài),30系的兩張卡也是剛好達(dá)到及格線,而影馳的這張卡卻能幾乎維持在90?FPS左右,絲滑體驗(yàn)不言而喻。
總的來(lái)說(shuō),在不開啟DLSS或僅開啟DLSS?2的情況下,影馳RTX?4070星曜OC完全能夠應(yīng)付2K分辨率下的3A大作,不少游戲表現(xiàn)甚至超出預(yù)期,滿足2K高刷玩3A完全不是夢(mèng)。
??DLSS 3性能測(cè)試
要說(shuō)這一代RTX?40系顯卡最大的升級(jí)就是DLSS?3黑科技,DLSS早在RTX?20系顯卡就已經(jīng)發(fā)布了,其主要是讓顯卡在不影響畫面質(zhì)量的情況下提升游戲性能,目前DLSS已經(jīng)更新至3.0版本,相比前代,新增幀生成和NVIDIA?Reflex技術(shù),據(jù)老黃所說(shuō),用上DLSS?3后可以實(shí)現(xiàn)游戲性能的翻倍提升。
3DMark?DLSS?3理論性能測(cè)試
在最新版的3DMark測(cè)試軟件中已經(jīng)加入了DLSS?3相關(guān)的測(cè)試,有了DLSS?3后,影馳RTX?4070星曜OC如虎添翼,2K分辨率下,開關(guān)DLSS?3性能差距能夠達(dá)到2.5倍以上,幀數(shù)穩(wěn)定在135?FPS以上,但從理論測(cè)試來(lái)看影馳RTX?4070星曜OC已經(jīng)能夠很好的滿足2K@120Hz的游戲需求。
4K分辨率我們也測(cè)試了,不得不說(shuō)老黃的刀法還是相當(dāng)精準(zhǔn)的,影馳RTX?4070星曜OC開關(guān)DLSS?3的性能差距足足有4倍之多,但4K分辨率下也只是接近90?FPS,因此影馳RTX?4070星曜OC能夠輕度游玩4K,想要更絲滑的體驗(yàn)就得選擇更高端的顯卡了。
《微軟模擬飛行》游戲?qū)崪y(cè)
光測(cè)試?yán)碚撔阅芸隙ㄊ遣粔虻?,現(xiàn)在支持DLSS?3的游戲已經(jīng)上升至50款,因此我們也選用了一些熱門游戲盡顯詳細(xì)測(cè)試。在對(duì)硬件要求頗高的《微軟模擬飛行》中,影馳RTX?4070?星曜OC開啟DLSS?3后對(duì)RTX?3070?Ti簡(jiǎn)直是降維打擊,1080P分辨率下幾乎是2倍的幀數(shù)提升,2K分辨率下也比RTX?3070?Ti高出60多?FPS,更別提RTX?2070?Super了,它還是勉強(qiáng)能玩的水平。另外影馳RTX?4070星曜OC的功耗僅149W,基本上是用RTX?2070?Super的功耗實(shí)現(xiàn)了2倍以上的性能!
在其他幾款游戲中也是如此,影馳RTX?4070星曜?OC在開啟DLSS?3后,游戲幀數(shù)相比RTX?3070?Ti都有60%-70%左右的提升,不少項(xiàng)目更是有翻倍的幀數(shù)提升,并且功耗都更低,用更低的功耗實(shí)現(xiàn)更強(qiáng)的性能,這才是玩家所樂(lè)見的。
1080P分辨率DLSS性能測(cè)試
在1080P分辨率下,影馳RTX?4070星曜OC開啟DLSS?3后,游戲性能提升非常離譜!性能直接是RTX?2070?Super的2倍有多!大部分游戲都能穩(wěn)定在200+?FPS以上,有人可能會(huì)問(wèn),那跟RTX?3070?Ti相比如何,這張卡的性能在1080P下依舊領(lǐng)先RTX?3070?Ti?70%以上!有這樣的提升幅度,DLSS?3功不可沒(méi)。
2K分辨率DLSS性能測(cè)試
2K分辨率下,以影馳RTX?4070星曜OC的性能也是毫無(wú)壓力,上面測(cè)試時(shí)不少游戲開啟DLSS?2時(shí)就領(lǐng)先RTX?3070?Ti僅20幀,但開啟DLSS?3后,整個(gè)世界都變了!領(lǐng)先幅度來(lái)到了驚人的50-60幀以上;毫無(wú)疑問(wèn)的說(shuō),影馳RTX?4070星曜OC在2K分辨率下的優(yōu)勢(shì)明顯,相比RTX?2070?Super,性能足足是其4倍之多,相比RTX?3070?Ti也絲毫不虛,性能是翻倍的提升。這樣的游戲性能領(lǐng)先讓它穩(wěn)居2K高刷游戲甜品顯卡的寶座。
我們也使用影馳RTX?4070星曜OC在DLSS?2和DLSS?3兩種模式下測(cè)試了多款游戲,從實(shí)測(cè)結(jié)果來(lái)看,DLSS?3確實(shí)有點(diǎn)東西,不少游戲的幀數(shù)都有明顯提升,其中不乏一些游戲有翻倍的性能提升。像《賽博朋克2077》這款游戲,眾所周知它被譽(yù)為“顯卡殺手”,影馳RTX?4070星曜OC在DLSS?2下游戲幀數(shù)為96?FPS,而開啟DLSS?3后,游戲幀數(shù)達(dá)到了驚人的144FPS,這已經(jīng)可以2K@144Hz暢玩電競(jìng)級(jí)的夜之城了!更讓人驚喜的是開啟DLSS?3后,游戲的1%?Low幀也有提升,這也意味著你在玩游戲時(shí)更穩(wěn)定更絲滑。
4K分辨率DLSS性能測(cè)試
雖然說(shuō)這是一張定位2K?100+FPS游戲級(jí)別的顯卡,但影馳RTX?4070星曜OC仍是具備一定的4K游戲能力,只要把DLSS3一開,或者是把游戲畫質(zhì)降低一些,游戲流暢度就直接上來(lái)了,跑個(gè)60+FPS不成問(wèn)題。
??RTX VSR測(cè)試
有些時(shí)候你是不是也會(huì)有這樣的煩惱,那些480P甚至360P的早期視頻清晰度不夠,看起來(lái)不夠清楚?現(xiàn)在這種煩惱將不再困擾你。NVIDIA帶來(lái)了視頻版的DLSS?3!正是前不久發(fā)布的RTX?Video?Super?Resolution?視頻超分辨率技術(shù)(RTX?VSR),通過(guò)AI技術(shù)即可提高瀏覽器內(nèi)的視頻的分辨率,展現(xiàn)前所未有的顯示效果。
今天我們也測(cè)試了這項(xiàng)劃時(shí)代的RTX?VSR技術(shù),在RTX?30系和RTX?40系的NVIDIA控制面板中找到視頻圖像設(shè)置,手動(dòng)開啟RTX?Video?enhancement即可啟用RTX?VSR技術(shù),其中分為1-4檔調(diào)節(jié),數(shù)字越大質(zhì)量越好。
實(shí)測(cè)環(huán)節(jié),可以看到在開啟RTX?VSR技術(shù)之后,原視頻里的人物線條由原本的模糊不清變得十分清晰銳利,并且隨著VSR級(jí)別的提高,清晰度逐級(jí)提升,甚至部分細(xì)節(jié)已經(jīng)接近原生1080P了。
在暗部表現(xiàn)同樣如此,原視頻里地板如同劣質(zhì)貼圖,有VSR加持后每塊磚頭都清晰可見,且立體感滿滿,尤其是旁邊綠色植被的清晰度更高了一個(gè)數(shù)量級(jí)。除此之外,RTX?VSR技術(shù)的AI算法似乎還能夠通過(guò)類似DLSS幀生成的方式計(jì)算出物體的遠(yuǎn)近關(guān)系優(yōu)化景深效果,這一點(diǎn)同樣能夠使得畫面整體觀感得到提升。
這里我們也給大家準(zhǔn)備了對(duì)比視頻,從視頻里就可以看到VSR的效果之明顯,最高級(jí)別的VSR?4跟原生480P相比就是一眼的區(qū)別,在開啟RTX?VSR技術(shù)后,部分圖像質(zhì)量有了顯著提高,不僅鋸齒和噪點(diǎn)幾乎全部消失,顏色過(guò)渡也更為平滑,目前VSR能有這種表現(xiàn)堪稱驚艷。
當(dāng)然你除了在瀏覽器能夠使用這項(xiàng)功能外,本地瀏覽器也能享受黑科技的魅力,VLC是目前首個(gè)支持RTX?VSR技術(shù)的本地播放器,且能夠支持多種視頻格式播放。正式版也隨著RTX?4070顯卡的解禁上線了,你硬盤里的老視頻也能搖身一變成1080P了!
我們將瀏覽器中的視頻與本地的視頻同時(shí)進(jìn)行RTX?VSR?4檔渲染,從畫面上看,右側(cè)本地播放器的效果要弱于左側(cè)瀏覽器的,瀏覽器上的4檔VSR線條更銳利,畫質(zhì)也更清晰,不過(guò)即使是本地播放器的效果也要遠(yuǎn)強(qiáng)于原生480P,筆者猜測(cè)可能是目前本地瀏覽器的優(yōu)化還不到位。
我們也將原生480P與瀏覽器和本地播放器上的VSR渲染視頻進(jìn)行對(duì)比,從視頻畫面中可以看到,本地播放器上4檔VSR渲染過(guò)后,文字或線條都相比原生480P有一定提升,至少以前模糊不清的視頻可以看了,不過(guò)對(duì)比瀏覽器的效果還略有差距,后者的效果已經(jīng)接近原生1080P了。
有用戶可能擔(dān)心功耗的問(wèn)題,在VSR開啟最高檔4檔的情況下,影馳RTX?4070星曜OC的功耗僅有24W左右,顯卡利用率也遠(yuǎn)沒(méi)有網(wǎng)絡(luò)上傳得那么高,在HWINFO64中可以看到顯卡全程利用率不過(guò)25%。
總的來(lái)說(shuō),影馳RTX?4070星曜OC上的RTX?VSR技術(shù)將為玩家和視頻觀看者帶來(lái)革命性的新體驗(yàn)!無(wú)論是性能上還是技術(shù)上的創(chuàng)新,都稱得上是流媒體時(shí)代的革命!
?創(chuàng)作者性能測(cè)試
測(cè)試完游戲后,少不了的就是生產(chǎn)力性能,生產(chǎn)力分為創(chuàng)作生產(chǎn)力與專業(yè)生產(chǎn)力兩部分,這里我們選擇PugetBench、PCMark?10、Blender等多款常見的測(cè)試軟件,來(lái)測(cè)試影馳RTX?4070?星曜OC在日常辦公、視頻內(nèi)容生產(chǎn)、專業(yè)渲染等方面的性能表現(xiàn)。
首先我們來(lái)看看PCMark10?Extended項(xiàng)目上各顯卡的性能表現(xiàn)如何,可以看到影馳RTX?4070?星曜OC在游戲這個(gè)子項(xiàng)目上與前代的RTX?3070?Ti拉開了差距,并且領(lǐng)先幅度約為20%左右,這與我們上面的游戲?qū)崪y(cè)相符,與老大哥RTX?4070?Ti相比,性能差距也在10%以內(nèi)。
而在UL?Procyon與PugetBench測(cè)試中,影馳RTX?4070星曜OC不單止超越了前代的RTX?3070?Ti,甚至在部分項(xiàng)目上還反超了大哥RTX?4070?Ti。另外最新的RTX?40系支持AV1的編解碼,在達(dá)芬奇軟件中優(yōu)勢(shì)相當(dāng)明顯,有了AV1的加持后,影馳RTX?4070星曜OC相比RTX?3070足足領(lǐng)先了38%的性能,這是前代顯卡無(wú)論如何也無(wú)法逾越的一道鴻溝,畢竟這需要RTX?40系顯卡中的雙NVIDIA編碼器的硬件支持。
專業(yè)性能上,影馳RTX?4070星曜OC的提升更是驚人,在N卡常用的Blender渲染軟件中,影馳RTX?4070星曜OC相比RTX?3070有50%的性能提升,就算是RTX?3070?Ti,它依舊領(lǐng)先45%以上。
而在以工業(yè)軟件為主的SPEC?2020中,影馳RTX?4070星曜OC依舊展現(xiàn)出來(lái)強(qiáng)大的實(shí)力,相比RTX?2070?Super,性能領(lǐng)先50%有多,相比RTX?3070?Ti領(lǐng)先25%,反應(yīng)在實(shí)際應(yīng)用中則是同樣的工程文件,使用最新的影馳RTX?4070星曜OC能夠節(jié)約四分之一的時(shí)間,提升你的工作效率。
當(dāng)然這里面提升最大的還要屬OC渲染器,性能足足是RTX?3070的1.6倍!這明顯是ADA架構(gòu)革新所帶來(lái)的算力提升。想要提升專業(yè)性能的用戶不妨考慮一下影馳RTX?4070星曜?OC,相對(duì)低的售價(jià)但卻帶來(lái)強(qiáng)悍的性能表現(xiàn),不得不說(shuō)真香!
??NVIDIA編碼器專項(xiàng)測(cè)試
通過(guò)上面的測(cè)試,我們也知道現(xiàn)在的RTX?40系顯卡不僅有游戲版DLSS,還有視頻版DLSS,不過(guò)你以為RTX?40系顯卡對(duì)視頻的提升僅僅如此嗎?其實(shí)它還隱藏了一項(xiàng)特殊技能,影馳RTX?4070星曜OC內(nèi)置了NVIDIA編碼器,它支持時(shí)下熱門的AV1編碼,作為下一代主流的視頻編碼技術(shù)有著自己獨(dú)特的優(yōu)勢(shì),更快的編碼速度和更高質(zhì)量的流媒體傳輸性能,讓越來(lái)越多的剪輯軟件和
視頻網(wǎng)站青睞于它,像我們熟悉的達(dá)芬奇、剪映、B站等已經(jīng)支持AV1編解碼,未來(lái)AV1將會(huì)成為一個(gè)新趨勢(shì)。
我們使用NVIDIA提供的8K片源與工程文件分別測(cè)試AV1格式和H.265格式下的編碼時(shí)間。實(shí)測(cè)同一段素材下,同樣使用H.265編碼,有雙編碼器的加持下,影馳RTX?4070星曜OC的效率比RTX?3070快40%以上,如果使用AV1編碼,那效率會(huì)比H.264快50%。
當(dāng)然我們上面也提到AV1編碼不止導(dǎo)出速度更快,它的文件占用空間也比H.265要小,無(wú)論是4K分辨率還是8K分辨率,使用AV1編碼后,文件整體大小能夠降低25%以上,并且肉眼下幾乎沒(méi)有畫質(zhì)區(qū)別,單憑AV1的這些優(yōu)點(diǎn),未來(lái)將會(huì)是AV1的天下,現(xiàn)在裝備一張影馳RTX?4070星曜OC即可感受最新技術(shù)帶來(lái)的優(yōu)勢(shì)。
??AI運(yùn)算能力測(cè)試
接下來(lái)的測(cè)試更是重量級(jí),最近一段時(shí)間,AI繪圖、ChatGPT等AI工具如雨后春筍般冒了出來(lái),老黃甚至在前段時(shí)間的GTC大會(huì)上重點(diǎn)介紹了AI技術(shù),還指出“現(xiàn)在AI行業(yè)已經(jīng)到達(dá)了像iPhone橫空出世時(shí)為手機(jī)行業(yè)帶來(lái)的革命性顛覆的時(shí)間點(diǎn)?!?/span>
借這個(gè)機(jī)會(huì),我們也對(duì)影馳RTX?4070星曜OC顯卡進(jìn)行AI運(yùn)算能力測(cè)試,在使用達(dá)芬奇AI?ACCELERATED?MAGIC?MASK測(cè)試時(shí),可以看到影馳的完成時(shí)間為14秒,而前代的RTX?3070則是21秒,你可能覺(jué)得時(shí)間差距不大,但項(xiàng)目一旦復(fù)雜起來(lái),選用影馳RTX?4070星曜OC會(huì)讓你的效率快33%以上。
再看看最近大火的AI作畫,AI作畫近期取得如此巨大進(jìn)展的原因個(gè)人認(rèn)為有很大的功勞歸屬于Stable?Diffusion的開源。因此我們也用Stable?Diffusion生成50張768?x?768的圖片進(jìn)行測(cè)試,從生成時(shí)間上就可以看到影馳RTX?4070星曜OC的強(qiáng)勢(shì),前代的RTX?3070?Ti生成50張圖需要接近3分鐘的時(shí)間,而影馳只需要2分11秒,相比大哥RTX?4070?Ti也差距不大,僅差20秒,如果是跟RTX?2070?Super相比,影馳的效率已經(jīng)接近2倍了!
另外在測(cè)試中還有一個(gè)值得關(guān)注的地方就是顯存占用,基本上RTX?20系跟RTX?30系的幾張顯卡在測(cè)試時(shí)顯存占用都達(dá)到了7.6G以上,雖然影馳RTX?4070星曜OC的顯存占用也有7G以上,不過(guò)得益于影馳RTX?4070星曜OC的12GB大顯存,因此在生成速度上有明顯優(yōu)勢(shì),可見這個(gè)軟件還是很吃顯存的,所以大家在玩這個(gè)軟件的時(shí)候應(yīng)該是顯卡顯存越高越好,選擇影馳RTX?4070星曜OC就是你高性價(jià)比兼高性能的選擇。
??功耗與發(fā)熱
星卓III散熱系統(tǒng)的配置大家都有目共睹,雖然影馳RTX?4070星曜?OC只是一款定位250W,但它的散熱系統(tǒng)跟RTX?4070?Ti幾乎是同一規(guī)格的,這也讓我對(duì)這款顯卡的功耗和發(fā)熱情況充滿好奇。
在室溫25℃的情況下,使用Furmark單烤15分鐘后,影馳RTX?4070?星曜?OC的GPU核心運(yùn)行在2700MHz以上的高頻,但此時(shí)核心溫度僅有57.8℃,顯存更是僅有50℃出頭,50多℃意味著什么?意味著它可能比你使用的CPU還要低溫!如果是待機(jī)溫度,那這代顯卡的溫度更是驚人,GPU在待機(jī)下30℃不大,現(xiàn)在知道星卓III散熱系統(tǒng)的強(qiáng)勢(shì)之處了吧。
真正優(yōu)秀的還不止于此,采用TSMC?4N工藝后的影馳RTX?4070星曜?OC的功耗和噪音控制也相當(dāng)優(yōu)秀,烤機(jī)15分鐘,最高功耗僅有215W,這個(gè)水平約等于RTX?2070?Super,意思就是影馳RTX?4070星曜OC用相同的規(guī)格實(shí)現(xiàn)了性能的飛躍!這也是最讓筆者驚喜的地方之一。
我們還利用HWINFO64軟件與FrameView軟件雙重記錄多款顯卡的功耗表現(xiàn)情況,從圖中可以看到影馳RTX?4070星曜OC整體功耗控制相當(dāng)出色,在所有測(cè)試場(chǎng)景內(nèi)近乎都是維持在200W左右,用RTX?2070?Super一樣的功耗,但性能卻已經(jīng)實(shí)現(xiàn)全方位的領(lǐng)先!
不禁感慨老黃的Ada?Lovelace架構(gòu)和TSMC的4N工藝確實(shí)有點(diǎn)東西,影馳RTX?4070星曜OC無(wú)論是性能表現(xiàn)、溫度控制甚至是能耗比都可以說(shuō)是N卡的新高度,相比前代的RTX?30系還是初代光追顯卡20系都是一次降維打擊。
??超頻能力測(cè)試
前面在GPU-Z中可以看到影馳?RTX?4070星曜?OC的TGP最高去到了250W,這比公版RTX?4070還要高出不少,顯然這是給超頻預(yù)留了充足的空間,那筆者自然是不可能錯(cuò)過(guò)這個(gè)絕佳的機(jī)會(huì),下面一同看看這款顯卡的超頻潛力究竟有多大吧。
這里我們使用影馳官方提供的XTREME?TUNER魔盤工具對(duì)顯卡進(jìn)行超頻,這款工具不僅可以解鎖GPU核心的電壓限制、功耗限制等,還可以自由調(diào)節(jié)風(fēng)扇轉(zhuǎn)速,實(shí)測(cè)這款顯卡的散熱配置明顯是超規(guī)格的,因此風(fēng)扇轉(zhuǎn)速還可以進(jìn)一步下探,超低的風(fēng)扇噪音還你舒適的使用體驗(yàn)。
先對(duì)這張顯卡的基本性能有個(gè)基本的了解,默頻狀態(tài)下Time Spy得分18671分。
小試牛刀,核心與顯存均先超頻200MHz,沒(méi)想到僅僅超頻200MHz后,Time?Spy得分就已經(jīng)接近2W分大關(guān)了,此時(shí)影馳RTX?4070星曜OC在測(cè)試中的核心頻率就已經(jīng)有3060MHz了,相比默頻時(shí)最高的2865MHz剛好提升了200MHz左右。
核心頻率加碼到250MHz,顯存頻率也超頻500MHz,此時(shí)Time?Spy測(cè)試得分穩(wěn)步上升至19649分,核心頻率也再創(chuàng)新高,達(dá)到了3105MHz,搭配地表最強(qiáng)的13900KS,影馳RTX?4070星曜OC超頻性能盡顯。
萬(wàn)萬(wàn)沒(méi)想到影馳RTX?4070星曜OC的潛力遠(yuǎn)不止于此,最后我們將核心和顯存分別提升了250MHz和750MHz,此時(shí)在Time?Spy測(cè)試中,顯卡的核心頻率已經(jīng)上到了3120MHz,可見它的超頻能力還是相當(dāng)可觀的。頻率甚至比RTX?4070?Ti還要再?gòu)?qiáng)一些,總分也來(lái)到了19710,相比默頻的18671分,提升近1000分,能力可見一斑。
??評(píng)測(cè)總結(jié)
RTX?40系列自發(fā)布以來(lái)就給廣大用戶帶來(lái)不少驚喜,這次更是再添一位大將!全新的Ada?Lovelace架構(gòu)、黑科技DLSS?3、RTX?VSR等創(chuàng)新技術(shù)的出現(xiàn)讓RTX?40系顯卡相比前代有著無(wú)可比擬的競(jìng)爭(zhēng)力。實(shí)測(cè)下來(lái)也不得不贊嘆老黃真的有點(diǎn)東西,因此GeForce?RTX?4070顯卡有著超乎預(yù)期的性能表現(xiàn),不僅專業(yè)性能有質(zhì)的飛躍,游戲性能也讓人眼前一亮,驚喜連連。
這次上手體驗(yàn)影馳?GeForce?RTX?4070?星曜?OC,最深刻的印象那一定是它的純白美學(xué)與鉆切時(shí)尚。作為星曜系列的新選手,延續(xù)了自家旗艦的設(shè)計(jì)水準(zhǔn),白色戰(zhàn)甲配上晶瑩剔透的外殼,精致亮眼。高度可DIY的特性讓游戲發(fā)燒友可以盡情發(fā)揮創(chuàng)意,異想天開,設(shè)計(jì)獨(dú)一無(wú)二的星曜顯卡。
光有驚艷眾人的顏值還不夠,影馳GeForce?RTX?4070?星曜?OC的性能才是重頭戲!AD104核心在性能釋放上已經(jīng)完勝RTX?3080,更別提RTX?3070,性能領(lǐng)先更是接近翻倍,并且功耗保持在RTX?2070?Super的水平!花小錢辦大事的典范了屬于是,這才是高端顯卡應(yīng)有的表現(xiàn)。玩家最關(guān)心的游戲性能也是當(dāng)仁不讓,2K分辨率下依舊可以保持100?FPS以上的超高幀率,4K下搭配DLSS?3也可一戰(zhàn)。如此性能,是多少玩家心心念念的夢(mèng)中情卡
總的來(lái)說(shuō),影馳?GeForce?RTX?4070?星曜?OC更像是集美貌與才華于一身的高端顯卡,如果你注重游戲性能體驗(yàn),想要體驗(yàn)超頻的樂(lè)趣,同時(shí)希望兼顧絕美的顏值,那這款顯卡一定是你的不二之選。目前影馳?GeForce?RTX?4070?星曜?OC已經(jīng)上市,售價(jià)5299元,性價(jià)比真不錯(cuò),現(xiàn)在各大??電商平臺(tái)均已開售??,感興趣的話可以去了解一下。
?Ada Lovelace架構(gòu)講解
Turing、Ampere上兩代架構(gòu)核心均以人物來(lái)命名,前者是計(jì)算機(jī)科學(xué)之父——艾倫·麥席森·圖靈;后者則是“電學(xué)中的牛頓”——安德烈·瑪麗·安培,電流的國(guó)際單位安培就是以其姓氏命名。那Ada?Lovelace定非凡人,度娘一下果然,這是 人稱“數(shù)字女王”的阿達(dá)·洛芙萊斯,編寫了歷史上首款電腦程序,是被世界公認(rèn)的第一位計(jì)算機(jī)程序員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩(shī)人拜倫。
從Turing架構(gòu)開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RT?Core單元,以及面向AI推理的Tensor?Core單元,這革命性的創(chuàng)新使實(shí)時(shí)光線追蹤成為可能。而Ampere架構(gòu)則是全面的架構(gòu)改進(jìn),在加入新一代的二代RT?Core和三代Tensor?Core基礎(chǔ)上,還有著更先進(jìn)的SM單元設(shè)計(jì),這樣顯卡工作效率那是翻倍的提升。而來(lái)到Ada?Lovelace架構(gòu),同時(shí)是以效率提升為大前提,自然是引入了最新的第三代?RT?Cores與第四代?Tensor?Cores單元,同時(shí)加入眾多新穎的黑科技,從執(zhí)行效率來(lái)說(shuō)Ada?Lovelace架構(gòu)是上代Ampere架構(gòu)的2
倍以上,甚至光線追蹤能力更是達(dá)到了恐怖的4倍性能。
??全新的SM流式多處理器
Ada?Lovelace架構(gòu)中最大的亮點(diǎn)之一:全新的SM流式多處理器,每個(gè)SM包含了128個(gè)CUDA核心、1個(gè)第三代的RT?Cores,4個(gè)第四代?Tensor?Cores(張量核心)、4個(gè)Texture?Units(紋理單元)、256?KB?Register?File(寄存器堆),以及128?KB?L1?數(shù)據(jù)緩存/共享內(nèi)存子系統(tǒng),于是這一個(gè)全新的SM單元有著超過(guò)上一代2倍之的性能表現(xiàn)。
過(guò)去的Turing架構(gòu)INT32?計(jì)算單元與FP32數(shù)量是一致的,而兩者相加才組成了64個(gè)CUDA核心。但是Ampere架構(gòu)開始,左側(cè)的計(jì)算單元實(shí)現(xiàn)了FP32+INT32的計(jì)算單元并發(fā)執(zhí)行,也就是說(shuō)CUDA核心數(shù)量翻倍到了128個(gè)。
再來(lái)看看Ada?Lovelace架構(gòu)的SM,F(xiàn)P32/INT32的計(jì)算單元組合,同樣實(shí)現(xiàn)了每個(gè)SM內(nèi)含128個(gè)CUDA的設(shè)計(jì),看似提升不大,但是當(dāng)你了解到GeForce?RTX?4070擁有46個(gè)SM,5888個(gè)CUDA核心,那你也就應(yīng)該明白它的著色器能力進(jìn)一步加強(qiáng),跟上一代的RTX?3070相比,雖然是同樣的CUDA核心,但得益于新架構(gòu)的優(yōu)勢(shì),完全可以說(shuō)是遙遙領(lǐng)先。
另外緩存方面Ada?Lovelace架構(gòu)也進(jìn)行了大規(guī)格的提升,首先每個(gè)SM單元中單獨(dú)配上了128?KB的緩存,其次核心的二級(jí)緩存進(jìn)行進(jìn)行了重新的設(shè)計(jì),使得RTX?4070配備了36MB二級(jí)緩存,相比RTX?3070可以說(shuō)是質(zhì)的飛躍,足足提升了9倍之多。?
??技術(shù)講解:第三代 RTX Cores 與 第四代 Tensor Cores
以為剛才的CUDA數(shù)量與超大L2緩存就已經(jīng)很猛了,實(shí)現(xiàn)上Ada?Lovelace架構(gòu)最大的提升還是在第三代?RTX?Cores與第四代?Tensor?Cores身上。
第三代?RTX?Cores
RTX?Cores用于光線追蹤加速,第三代?RTX?Cores?的有效光線追蹤計(jì)算能力達(dá)到?191?TFLOPS,是上一代產(chǎn)品?2.8?倍。
在Ampere架構(gòu)中,第二代RT?Cores支持邊界交叉測(cè)試(Box?Intersection?testing)和三角形交叉測(cè)試(Triangle?Intersection?testing),用于加速BVH遍歷和執(zhí)行射線三角交叉測(cè)
試計(jì)算,雖然光線追蹤處理能力已經(jīng)比初代的Turing架構(gòu)核心更高效,但是隨著環(huán)境和物體的幾何復(fù)雜性持續(xù)增加,傳統(tǒng)的處理方式很難再以更高效率、正確反應(yīng)出的現(xiàn)實(shí)世界中的光線,尤其是光的運(yùn)動(dòng)準(zhǔn)確性。
所以在第三代?RTX?Cores增加了兩個(gè)重要硬件單元:Opacity?Micromap?Engine與Displaced?Micro-Meshes?Engine引擎。Opacity?Micromap?Engine,主要是用于alpha通道的加速,可以將?alpha?測(cè)試幾何體的光線追蹤速度提高2倍。
在傳統(tǒng)光柵渲染中,開發(fā)人員使用一些?Alpha?通道的素材來(lái)實(shí)現(xiàn)更高效的畫面渲染,例如?Alpha?通道的葉子或火焰等復(fù)雜形狀的物體。但在光線追蹤時(shí)代,這傳統(tǒng)的做法會(huì)為光線追蹤帶為不少無(wú)效的計(jì)算,例如運(yùn)動(dòng)性的光線多次通過(guò)一塊葉子,光線每擊中一次葉子,都會(huì)調(diào)用一次著色器來(lái)確定如何處理相交,這時(shí)就會(huì)做成嚴(yán)重的執(zhí)行成本與時(shí)間等待成本。
而Opacity?Micromap?Engine用于直接解析具有非不透明度光線交集的不透明度狀態(tài)
三角形。根據(jù)Alpha?通道的不透明,透明與未知等三個(gè)不同的塊狀態(tài)進(jìn)行處理:透明則直接忽略繼續(xù)找下一個(gè),不透明塊則記錄并告之命中,而未知的則交給著色器來(lái)確定如何處理,這樣GPU很大部分都不需要進(jìn)行著色器的調(diào)試處理,能夠?qū)崿F(xiàn)更為高效的性能。
Displaced?Micro-Meshes?Engine
如果說(shuō)Opacity?Micromap?Engine加速的是面處理,那么Displaced?Micro-Meshes?Engine就是幾何曲面細(xì)節(jié)的加速器。如上圖所示,在Ada?Lovelace架構(gòu)中,通過(guò)1個(gè)基底三角形+位移地圖,就可以創(chuàng)建出一個(gè)高度詳細(xì)的幾何網(wǎng)格,所需要資源占用比二代RTX?Cores更低,效率也更高。
通過(guò)NVIDIA給出的創(chuàng)建14:1珊瑚蟹例子來(lái)說(shuō)事,這里我們需要需要1.7萬(wàn)個(gè)微網(wǎng)格、160萬(wàn)個(gè)微三角形,在Ada?Lovelace架構(gòu)中BVH創(chuàng)建速度可加快7.6倍,存儲(chǔ)空間縮小8.1倍。Displaced?Micro-Meshes?Engine起到了關(guān)鍵性的作用,其將一個(gè)幾何物體根據(jù)不同細(xì)節(jié)分成密度不一的微網(wǎng)絡(luò)處理,紅色密度超高,細(xì)節(jié)處理越為復(fù)雜?。相應(yīng)的低密度微網(wǎng)絡(luò)區(qū)域則可以釋放更多的資源與存儲(chǔ)空間,這樣Displaced?Micro-Meshes?Engine就可以幫助BVH加速過(guò)程,減少構(gòu)建時(shí)間和存儲(chǔ)成本。
同時(shí)Ada?Lovelace架構(gòu)SM中新增了著色器執(zhí)行重排序(Shader?Execution?Reordering,SER),這是由于光線追蹤不再只有強(qiáng)光或者陰影渲染處理,未來(lái)將會(huì)更多的是在光線的運(yùn)動(dòng)性,這樣光線就會(huì)變得越來(lái)越復(fù)雜,想要第三代?RTX?Cores與第四代?Tensor?Cores有著更高的執(zhí)行效率,那就得為他們來(lái)安排一位管家。而著色器執(zhí)行重排序(SER)就是為了能夠即時(shí)重新安排著色器負(fù)載來(lái)提高執(zhí)行效率,為光線追蹤提供2倍的加速,也能更好地利用?GPU?資源。不過(guò)目前仍未有實(shí)例,想實(shí)現(xiàn)這個(gè)功能,還得游戲與開發(fā)工具的支持才行。
第四代?Tensor?Cores
Tensor?Cores是專門為執(zhí)行張量/矩陣運(yùn)算而設(shè)計(jì)的專用執(zhí)行單元,這些運(yùn)算是深度學(xué)習(xí)中使用的核心計(jì)算功能。第四代Tensor?Cores新增FP8引擎,具有高達(dá)1.32?petaflops?的張量處理性能,超過(guò)上一代的5倍。
??技術(shù)講解:DLSS 3
或者說(shuō)第四代Tensor?Cores太硬核你不會(huì)知道是啥?提升意義在哪?但是Tensor?Cores最經(jīng)典的應(yīng)用DLSS你肯定會(huì)知道,這一次Ada?Lovelace架構(gòu)支持NVIDIA最新的DLSS?3技術(shù)。
之前我們也聊過(guò)DLSS技術(shù),其設(shè)計(jì)之初是為了彌補(bǔ)光線追蹤技術(shù)后的性能損失,具體的表現(xiàn)為開啟光線追蹤技術(shù)后游戲幀數(shù)大幅度的下降,甚至很難保證游戲流暢的運(yùn)行。于是DLSS使用低分辨率內(nèi)容作為輸入并運(yùn)用AI技術(shù)輸出高分辨率幀,從而提升光線追蹤的性能。
在DLSS?3中包含了三項(xiàng)技術(shù):DLSS幀生成、DLSS超分辨率(也稱為DLSS?2)和NVIDIA?Reflex。你可以理解為DLSS?3是在DLSS?2的基礎(chǔ)上,新增了DLSS幀生成技術(shù);而后兩技術(shù)中,DLSS超分辨率只需要GeForce?RTX顯卡都能使用上,NVIDIA?Reflex則是GeForce?900?系列以后的顯卡都用使用上。
想實(shí)現(xiàn)DLSS幀生成可不簡(jiǎn)單,這需要配合上Ada?Lovelace架構(gòu)的GeForce?RTX?40系列顯卡才行。DLSS幀生成技術(shù)原理是:利用AI技術(shù)生成更多幀,以此提升性能。DLSS會(huì)借助?GeForce?RTX?40系列GPU所搭載的全新光流加速器分析連續(xù)幀和運(yùn)動(dòng)數(shù)據(jù),進(jìn)而創(chuàng)建其他高質(zhì)量幀,同時(shí)不會(huì)影響圖像質(zhì)量和響應(yīng)速度。
從Ampere架構(gòu)開始,NVIDIA顯卡就已經(jīng)支持了光流加速器,而Ada?Lovelace架構(gòu)的光流加速器升級(jí)到了第二代,其提供了高達(dá)300?TeraOPS?(TOPS)?,比安培架構(gòu)的初代光流加速器(Optical?Flow?Acceleration,OFA)快2倍以上。為了實(shí)現(xiàn)DLSS幀生成,OFA扮演了重要的角色,其配合上新的運(yùn)行矢量分析算法在DLSS?3技術(shù)框架內(nèi)實(shí)現(xiàn)精確和高性能的幀生成能力。?
另外,由于DLSS幀生成是在GPU上作為后處理執(zhí)行的,那么即使在游戲受到CPU性能限制的時(shí)候,我們同樣能夠從中獲得更好的游戲性能提升。尤其是那種物理計(jì)算密集型的游戲或大型場(chǎng)景游戲,DLSS?2均可以讓
GeForce?RTX?40系列顯卡以高達(dá)兩倍于CPU可計(jì)算的性能來(lái)渲染游戲。
最后由于DLSS?3是建立在DLSS?2基礎(chǔ)之上的,游戲開發(fā)者可以在已支持DLSS?2或NVIDIA?Streamline的現(xiàn)有游戲中快速集成該功能,所以DLSS?3已在游戲生態(tài)得到廣泛應(yīng)用,目前已有超過(guò)35款游戲和應(yīng)用即將支持該技術(shù)。
閱讀小亮點(diǎn):NVIDIA?Reflex
NVIDIA?Reflex也是DLSS?3其中的一環(huán),它可以使GPU和CPU同步,確保最佳響應(yīng)速度和低系統(tǒng)延遲。
想要實(shí)現(xiàn)端對(duì)端的最低延遲,你需要確保游戲、顯示器以及鼠標(biāo)三者都同時(shí)支持并開啟了Reflex?技術(shù)。
當(dāng)GeForce?RTX?40系列顯卡和NVIDIA?Reflex搭配上后,直接達(dá)到1440p分辨率360?FPS的體驗(yàn),這著實(shí)是性能有點(diǎn)強(qiáng)勁了。
在GTC2022大會(huì)時(shí)已經(jīng)透露將會(huì)還有4?款?1440p?分辨率的新型?G-
SYNC?電競(jìng)顯示器將要發(fā)布,包括采用mini-LED技術(shù)的AOC?AG274QGM?–?AGON?PRO?Mini?LED、MSI?MEG?271Q?Mini?LED?和?ViewSonic?XG272G-2K?Mini?LED三款顯示器刷新率均為300Hz,而最猛的是ASUS?ROG?Swift?360?Hz?PG27AQN?,刷新率直接來(lái)到了360Hz。
但唯一一個(gè)問(wèn)題就在于,部分顯示器廠商認(rèn)為此類產(chǎn)品受眾人群較少,會(huì)降低此類顯示器的產(chǎn)能,甚至產(chǎn)品就已經(jīng)被內(nèi)部PASS掉,所以1440p?360Hz是很美好,但現(xiàn)實(shí)也是相當(dāng)?shù)墓歉小?/span>
??技術(shù)講解:NVIDIA編碼器
GeForce?RTX?40系列顯卡還有一個(gè)全新的升級(jí),那就是編碼器NVENC。第八代的NVENC編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式?AV1。
而由于AV1是一種免版稅的視頻編碼格式,上游軟件廠商與下游戲的配套端都在大力推廣此編碼格式,我們也會(huì)看到越來(lái)越多的硬件與軟件支持AV1格式,包括剪映專業(yè)版、DaVinci?Resolve、以及Adobe?Premiere?Pro較為流行的Voukoder插件均支持,且均可通過(guò)編碼預(yù)設(shè)使用雙編碼器,這樣我們等待視頻導(dǎo)出的時(shí)間縮短將近一半。
不單是視頻制作軟件,AV1格式也將會(huì)是主播、游戲直播UP主們的新寵兒,在保證畫面最高質(zhì)量的情況下,AV1?編碼器可將效率提高?40%,同時(shí)顯卡的占用也更低。包括OBS?Studio一代軟件中也會(huì)增加AV1格式的支持。另外我們還能通過(guò)?GeForce?Experience?和?OBS?Studio?錄制高達(dá)?8K60?的內(nèi)容,這樣我們做游戲錄制也會(huì)變得更為輕松。
包括我們之后測(cè)試時(shí)使用的游戲內(nèi)錄視頻都是支持AV1格式,同時(shí)編碼器NVENC在資源占用和適配上做得越來(lái)越好。