RTX3090 性能極致炸裂的超級怪獸

嗨,大家好,我是Seaway,我們又見面了,再次受到BlenderCN社區(qū)邀請讓我來測評本年度的超級核彈RTX3090。
前提聲明
? ? ? ?我不是顯卡專業(yè)人士,也不是科學(xué)家更不是數(shù)學(xué)家,我只是一個民間草根,以下測評的數(shù)據(jù)只是基于自己的作品測試而得。一些非常細微的感覺,我無法通過具體專業(yè)的數(shù)據(jù)描述,只能使用一些形容詞來表述,還望見諒。
? ? ? ?還是和上次測試RTX2080一樣,測試的方向是RTX3090在3D藝術(shù)創(chuàng)作中的生產(chǎn)能力。以下的測評雖然場景文件都是極端的設(shè)置,但渲染參數(shù)方面我并沒有一味的開高某個參數(shù),來得到一些不實際的測試結(jié)果,因為我的測試是基于自己實際創(chuàng)作流程為基準,是要把它運用到自己實際創(chuàng)作中的。
RTX3090為誰而戰(zhàn)
? ? ? ?在2013年NVIDIA推出了泰坦顯卡,主要運用于人工智能以及深度學(xué)習(xí)研究人員和開發(fā)人員,這些創(chuàng)造性的應(yīng)用需要泰坦顯卡提供額外更多的顯存,以滿足高端創(chuàng)意所需的大顯存需求,NVIDIA在聽取反饋意見后,為我們帶來了RTX3090。
? ? ? ?RTX3090是為高性能的內(nèi)容創(chuàng)作、高負荷的數(shù)據(jù)科學(xué)研究,想要體驗8K游戲的人們量身定制。無論是專業(yè)數(shù)字藝術(shù)家還是追求極致品質(zhì)游戲和視頻創(chuàng)作的愛好者,RTX3090都能為你提供強大、穩(wěn)定、高效的核彈級性能。
? ? ? ?在創(chuàng)作領(lǐng)域RTX3090具有24GB快速GDDR6X的超大顯存,為你追求極致性能,用于大型模型、詳細場景和高分辨率紋理的藝術(shù)創(chuàng)作保駕護航。在專業(yè)圖像軟件運用中RTX?3090提供的性能比RTX?2080?Ti和TITAN?RTX高出33%-105%。而且由于RTX?3090具有24?GB的超大顯存,它可以處理的數(shù)據(jù)集的大小是RTX?3080的兩倍。并且RTX3090仍然支持NVLink,這讓你可以掛接更多RTX3090來進一步提升更強勁的性能。
? ? ? ? 另外,作為全球首款8K?HDR游戲GPU,RTX?3090支持你在絢麗的8K?HDR中進行游戲、捕捉和觀看游戲,擁有用于8K游戲的全新DLSS超性能模式(DLSS?Ultra?Performance)、配備可單線連接8K電視的HDMI?2.1、支持能夠進行8K?HDR游戲捕捉的GeForce?Experience,以及用于高效播放8K?HDR流媒體視頻的AV1解碼。RTX?30系列GPU是首批支持硬件加速的AV1解碼以實現(xiàn)流暢8K?60?FPS播放的GPU,與現(xiàn)有的H.264、H.265(HEVC)、VP9解碼器相比,效率更高。AV1將播放高分辨率視頻所需的帶寬降低了多達50%,使其成為下一代4K和8K?HDR?Youtube視頻的理想選擇。
NVIDIA?Studio?驅(qū)動
你可能會奇怪,我為何在這里要說驅(qū)動??
硬件之上需要軟件適配,硬件的功能得以施展必須配備最優(yōu)化的驅(qū)動,不然硬件雖然參數(shù)強大,但是實際上跑起來坑太多,根本沒法投入生產(chǎn),那時候后悔就晚了,不過有了NVIDIA的studio驅(qū)動就完全不擔心這些問題。
????NVIDIA在今年8月推出了NVIDIA?Studio?驅(qū)動,此驅(qū)動程序?qū)閯?chuàng)作者構(gòu)建,它服務(wù)于數(shù)字藝術(shù)創(chuàng)作軟件,包括Adobe?Premiere?Rush、Premiere?Pro、Blender?Cycles、V-Ray?5?for?Maya、Flicker?Free和BorisFX?Optics等等。所以,你使用RTX顯卡(包括GTX10系列)作為生產(chǎn)力硬件的話,強烈推薦安裝NVIDIA?Studio?驅(qū)動,這樣顯卡會以最佳性能為你服務(wù)。可以訪問這里了解更多詳細內(nèi)容:https://www.blendercn.org/9659.html
*使用RTX顯卡的Blender用戶就更加-必須-馬上更新了,因為NVIDIA?OptiX渲染引擎與Blender的Cycles緊密聯(lián)系在一起,
這會讓Cycles享受到RTX強大的加速buff:RT?Core加速光線追蹤和Tensor?Core加速的AI降噪功能。
*使用RTX30系列的小伙伴請務(wù)必更新最新的10?月?Studio?驅(qū)動。不然Cycles的動態(tài)模糊無法使用OptiX加速。RTX30系列顯卡也無法提供最佳性能。
注意!順序可別搞錯了,先安裝RTX顯卡,然后再安裝NVIDIA?Studio?驅(qū)動。
可以通過?GeForce?Experience或?NVIDIA?驅(qū)動下載頁面下載最新的?10?月?Studio?驅(qū)動?(456.71)。https://www.nvidia.cn/geforce/drivers/
在分享測試之前,我需要更正一個內(nèi)容:
在上次分享RTX2080測評時,我文中提到OpenImageDenoise的降噪不是很好這個事情,在這里給大家道個歉。
由于測試時間比較緊,所以有很多疏忽,等測評寫完發(fā)布的三天后再測試時發(fā)現(xiàn):
OpenImageDenoise降噪對小幅渲染尺寸(2K~3K左右)是沒有細節(jié)的,也就是說你的渲染尺寸在2K~3K以下的話,不推薦使用OpenImageDenoise方式降噪,因為它是后期使用CPU來降噪,如果你的CPU不強勁的話,會白白增加許多渲染時間。直接推薦OptiX降噪是最佳選擇。如果你的渲染尺寸在3.5K~4K以上時,使用OpenImageDenoise方式降噪才有真正的意義,此時它會很好的把細節(jié)處理出來。

測試平臺:
測試軟件:Blender?2.90?正式版??(對比RTX2080會比較公平。)??
測試主機:(由BlenderCN社區(qū)?裴雪珂老師提供)
顯卡?Nvidia?RTX3090?24GB?(顯卡驅(qū)動更新到官方推薦的?256.71)
AMD?Ryzen?3900X?CPU
96GB DDR4內(nèi)存
BIOSTAR?512GB?M.2硬盤
顯示器X2??分辨率:1920X1080
操作系統(tǒng):Win10?64位教育版
機箱:愛國者黑曼巴?F1?風(fēng)冷散熱
電源:750W
好,說完前面這些,我們正式開始本文。請出今天的主角RTX3090!

在收到顯卡后我并沒有急著測試,而是特意到官方查詢了RTX3090的參數(shù),把我關(guān)注的技術(shù)參數(shù)列在下面。
NVIDIA?架構(gòu):Ampere
GA102-300-A1核心
CUDA核心數(shù)量:82組SM單元共計10496個流處理器
第2代RT?Core?82個??提供20Giga?Rays/s
全新第3代Tensor?Core?328個
顯存配置:24?GB?GDDR6X
顯存位寬:384Bit
最高?GPU?溫度:93℃
顯卡功率:350w(電腦電源最低要求750W)
?雖然我在沒有拿到顯卡前就梯子到油管上看了人家的測評,讓自己心里有個準備,但是實際測試還是讓我吃驚不小。




這次官方的造型設(shè)計,個人非常喜歡,整體造型非???,做工精細,非常有感覺。
當然這新老婆分量也很十足,大概有6公斤重?。。“阉M機箱我折騰出一身的汗,哈哈。
再來兩張微距細節(jié)


在散熱方面我在這里就直接說自己測試后的感受了:
(?注:全部測試都是機箱閉蓋環(huán)境下完成,沒有任何開蓋的情況!)
昆明這幾天陰雨,房間溫度20攝氏度左右(看來天公作美,給予這顯卡自然降溫buff,哈哈)。RTX3090使用了雙風(fēng)扇導(dǎo)流設(shè)計,一個在正面,一個在背面,并且在尾部(DP接口面)也有自己的散熱口,這樣能很好的給顯卡散熱,不光如此,還能對機箱整體內(nèi)部做散熱,在測試的這段時間中,RTX3090溫度控制非常好,觀察到最高溫度77度,但也只是一瞬間,平均在68~74度之間,渲染速度沒有非常明顯的影響,這個比起RTX2080要優(yōu)秀很多。
?
好,我們進入實際測評:
*以下測試全部為極端數(shù)據(jù),且為個人作品測試數(shù)據(jù)和對比,故只作為娛樂參考,不能作為權(quán)威測評。
*測得的渲染時間我都按四舍五入的方式統(tǒng)計。
*注:與RTX2080做對比有些不公平,沒辦法只有RTX2080的測試數(shù)據(jù),只好委屈下2080了,哈哈
?
關(guān)于渲染分布塊大小與渲染速度:
我分別測試了256x256、512x512、1024x1024、2048x2048
最佳還是推薦512x512,1024塊要慢幾秒,256塊和512差不多,但渲染畫幅尺寸過大,256還是不-推-薦。
?

測評第一個作品:凱普巨人殖裝胸像
關(guān)于凱普裝甲文件在上篇RTX2080有詳細介紹,這里就不再重復(fù)了,可以訪問RTX2080測評了解。
視口顯示,雕刻細節(jié)全開9級,面數(shù)3600萬,文件起始內(nèi)存占用9.6G,顯存占用4.9G?
Blender2.90正式版,Cycles渲染器?
采用塊分布式渲染,塊大小:512X512,開啟OptiX???后期降噪:Color+Albedo+Normal

視口實時渲染:
首次Cycles渲染加載場景耗時1分20秒,3600萬面數(shù),大概0.5秒成像,2秒不到細節(jié)全出,4~5秒細節(jié)進一步精進,8秒基本已經(jīng)完事了,后面就是按照你指定給Cycles的采樣再更加精細而已。這個作品對于擁有24G顯存的RTX3090來說輕松應(yīng)對,在Cycles開啟后,快速切換全屏,反應(yīng)速度非???,RTX2080要慢一些。具體可以看我后面的參數(shù)對比圖。
推薦觀看操作視頻,這個最直觀讓你感受RTX3090的強大能力。
RTX3090-凱普胸像-Cycles視口實時預(yù)覽:播放列表第一個視頻


RTX3090??VS??RTX2080??視口實時Cycles渲染對比圖

EEVEE視口實時:
這個其實沒有啥測試的必要,因為RTX2080就已經(jīng)毫無壓力了,RTX3090更是輕松應(yīng)對。加載不到1分鐘,拖動視口和編輯Mesh都毫無壓力,EEVEE視口實時能力我在后面準備了一個更加對胃口的案例,所以不在這多說。

接下來是重頭戲,成品渲染測試:
這次我一上來就直接測試8K的:
尺寸:8640X4800? ? 170塊? ?采樣:200? ? 渲染時間:6分13秒??(RTX2080渲染時間:47分25秒)
瓦特!瓦特!? 6分13秒!????..............
你不信是吧,連我都不信,時間出來我都懵了,RTX2080用了47分鐘,這家伙6分鐘就完事啦???于是我連續(xù)重渲了三遍,分別為:06分12秒、06分14秒、06分13秒。測到這里,老實說心里真是有些激動,這渲染速度實在讓人不要太舒服。

好,來看下其他幾個尺寸的時間:
沒有開啟OptiX加速的CUDA渲染成圖的時間:
圖片尺寸:3600X2000? ? 32塊? ? 采樣:350????渲染時間:4分34秒?(RTX2080渲染時間:17分13秒)
開啟OptiX加速渲染成圖的時間:
圖片尺寸:3600X2000? ? 32塊? ? 采樣:350????渲染時間:2分01秒?(RTX2080渲染時間:5分43秒)
圖片尺寸:5040X2800? ? 60塊? ? 采樣:300????渲染時間:3分06秒?(RTX2080渲染時間:10分39秒)
?
別急,后面才是主菜:
10800X6000???264個分布塊,?采樣:200???渲染時間:9分35秒(RTX2080渲染時間:1小時42分09秒)
1萬像素只需要9分半鐘,渲染了3次,都是9分30秒~9分35秒。這個實在是太香了啦,哈哈



來看看渲染時間對比圖,沒有對比就沒有傷害,一下子RTX2080就真的不香啦,哈哈

測評第二個作品:春蝶入芳夏(素模版)

文件介紹:
燈光22個,一部分是動態(tài)雕刻,一部分是精雕后減面的模型,還有曲線模型總共300多個部件,600萬面數(shù),模型大部分是沒有UVmap的,全部材質(zhì)是用程序紋理和紋理貼圖混合得到的材質(zhì),運用了大量的程序節(jié)點完成,還有運用了VertexColors。
這個案例側(cè)重于Cycles成品渲染和動態(tài)模糊的測試。
先來看看成品渲染:
6480X6480??169個分布塊???采樣:300??渲染時間:5分38秒(RTX2080時間:14分09秒)(RTX2070s時間:41分57秒)
(注:這里的RTX2070s的渲染時間不是很準確,渲染后期降頻很嚴重,渲染時間過長,這里列出來也只是一個參考。)
8640X8640??289個分布塊???采樣:200??渲染時間:6分24秒
10800x10800??484個分布塊???采樣:200??渲染時間:13分02秒



OptiX加速?Cycles?運動模糊:
這次顯卡驅(qū)動更新中有一個重要的更新,就是OptiX對運動模糊渲染的支持。這個能力不是只有30系列有,20系列也支持,快去更新顯卡驅(qū)動吧。(GTX10系列不知道是否支持,如果有小伙伴知道可以告訴我。)
需要注意的是:?
1?運動模糊無法再視口中預(yù)覽,必須成品渲染才可看到。
2?在首次渲染時,會出現(xiàn)一個編譯過程【Loading?render?kernels?(may?take?a?few?minutes?the?first?time)】,耐心等待它的完成,之后你就可以在運動模糊渲染中使用OptiX加速了。
這里放上自己的動態(tài)模糊測試對比圖。

測評第三個作品:熾天使?跑車場景

文件介紹:
原來參加Substance?Painter比賽作品,擁有32張貼圖,其中8K的有12張左右(具體記不清了,都是從Substance中輸出的。)這個作品非常適合HDR環(huán)境照明下的實時光照渲染。這場景雖然對象不多,面數(shù)也不復(fù)雜,但地面是細分置換修改器得到的高精細地面,還有非常復(fù)雜的多張8KMask貼圖混合而成的材質(zhì)結(jié)構(gòu)。

這場景在RTX2080上渲染前加載數(shù)據(jù)使用了1分34秒,然而在RTX3090下只需要41秒左右,差不多快了50多秒的時間。因為RTX3090的位寬是384bit的,對數(shù)據(jù)加載的速度要優(yōu)于RTX2080許多。
好我們來看測試截圖,(注:截圖左上角文件名稱帶有RTX2080字樣請無視,絕對沒有造假)
Cycles的實時視口渲染:
HDR全環(huán)境光照效果,視口移動毫無壓力,車體質(zhì)感非常好。
這個在RTX2080就完全沒有任何壓力,RTX3090就更是輕松至極了。反應(yīng)速度和成像速度都極為迅速。
在切換加載環(huán)境HDR貼圖到成像的速度上,RTX3090要比RTX2080快一些,RTX2080大概在1秒,RTX3090大概在0.5秒。
還是推薦看視頻演示吧,無法碼字描述,原諒我墨水已干。(先聲明:視頻沒有任何加速)
RTX3090-熾天使-Cycles視口實時預(yù)覽:播放列表第二個視頻



EEVEE視口實時顯示:
場景加載和貼圖加載只需要41秒左右,比RTX2080快很多,2080大概在1分15秒才能加載完成。
大家自己看視頻吧,反正我也只能用牛!來形容,或者噼咔噼咔,咔嚓咔嚓(看不懂吧!異鄉(xiāng)人!去找派蒙給你翻譯下)
RTX3090-熾天使-EEVEE視口實時預(yù)覽:播放列表第三個視頻


最后和小伙伴們分享下自己對Bender的EEVEE引擎和Cycles渲染器的一點看法:
EEVEE的優(yōu)點不必說,這里說說我遇到的一個問題:
在模型很多,面數(shù)超高,材質(zhì)節(jié)點結(jié)構(gòu)也非常復(fù)雜的情況下,EEVEE視口更新是有明顯延遲的,視圖拖拽和材質(zhì)編輯視口都會有明顯的卡頓。一旦場景中材質(zhì)和模型發(fā)生“結(jié)構(gòu)編輯性”改變,它必須重新計算場景和材質(zhì),而根據(jù)場景對象和材質(zhì)復(fù)雜程度,重新計算加載的時間也會變長(Cycles也會重新計算,但相比之下速度超快)。當然更新速度在RTX3090中有很明顯的提升,但卡頓,延遲還是存在。所以EEVEE引擎適用于游戲級模型、單體復(fù)雜的模型展示和成套的PBR材質(zhì)流程場景,一次完成加載,沒有修改直接展示。而成品渲染方面,品質(zhì)和速度面對擁有OptiX的Cycles來說幾乎沒有優(yōu)勢。(以上只是提出一種觀點,希望EEVEE能更好的解決復(fù)雜情況的能力?,F(xiàn)在EEVEE其實是沒有得到顯卡很好的加速支持的,不過也許在不遠的未來...我很期待)。
再來看看現(xiàn)在的Cycles渲染器,精確的全局渲染,精準的光線追蹤,細膩的光影,豐富的通道和matte,隨著NVIDIA帶來的RTX加速技術(shù),Cycles最致命的缺陷“渲染慢”的短板徹底解決了,基本上成像預(yù)覽都像開了掛一樣秒出,所以如果你對畫面有很高的要求,大場景,超高面數(shù)對象和復(fù)雜光影和材質(zhì)編輯的話,Cycles+OptiX是你的最佳首選。當然不光是Cycles,Vray、Keyshot、OctaneRender等等也同樣享受RTX的加速技術(shù)。
?
最最后分享幾張截圖結(jié)束我們這次的測評吧~~~~~
以下均為視口實時截圖,猜猜看,他們是cycles還是EEVEE所為。




總結(jié)
RTX3090說實話已經(jīng)非常接近自己心里的完美了,個人測試下來總的感覺就是穩(wěn)定,快速高效,溫度控制很好,而且渲染時風(fēng)扇噪音也不大,24G大顯存讓RTX3090可以勝任超多對象面數(shù)的復(fù)雜場景,比如城市,森林,戰(zhàn)場這些都能很好的發(fā)揮它強大的性能。對于Blender而言,RTX3090是一個極其強勁的戰(zhàn)力伙伴,而這只是起點,因為NVIDIA和Blender基金會的合作仍然在繼續(xù),再未來將會帶來更多驚喜。
如果說RTX2080是飛機的話,RTX3090就是火箭了,你想體驗極致游戲的同時又想擁有超強的創(chuàng)造性能,那RTX3090是本年度最佳選擇,它是極致游戲體驗與超高效生產(chǎn)力完美并存的超級怪獸,無語倫比的性能實在無法用言語和文字來表達,RTX20系列完成了質(zhì)的一次轉(zhuǎn)變,而RTX30系列在此基礎(chǔ)上又飛躍到了一個讓人驚嘆的高度。RTX30系列開啟了一個全新圖形生產(chǎn)階段。無論在游戲娛樂,藝術(shù)創(chuàng)作,shader編寫,逼真的視覺開發(fā)都帶來了前所未有的效率和品質(zhì)。所以,這不是一款普通的顯卡,而是會帶來革命性開啟新紀元的超級怪獸。
?
朋友!
歡迎來到新數(shù)字視覺紀元
RTX3090?
BlenderCN社區(qū)的混混大大測評了RTX3080,感興趣的小伙伴可以這里觀看:
RTX3080 數(shù)碼創(chuàng)作中堅力量完美搭檔
https://www.blendercn.org/11262.html
?
最后小聲說一句:
請別問3090是自個的嗎,噓~~~ 讓我的夢再飛一會兒。
-------黑坊主(Seaway)---------
(>_<)