NVIDIA RTX 4070 Ti 在 Octanebench 中以大致相同的 TFLOPs 擊敗 RTX 3090 Ti
可以最大限度地發(fā)揮 GPU 潛力的基準(zhǔn)測(cè)試之一是Octanebench。它用于渲染目的,可以最大化圖形卡的吞吐量,幾乎不需要驅(qū)動(dòng)程序優(yōu)化。換句話說(shuō),您可以將其視為任何給定 GPU 的最佳案例場(chǎng)景。NVIDIA RTX 4070 Ti最近在 Octanebench 數(shù)據(jù)庫(kù)中被發(fā)現(xiàn)(通過(guò)LaptopVideo2Go通過(guò)Videocardz),并且以 5% 的優(yōu)勢(shì)擊敗了舊的 RTX 3090 Ti。
現(xiàn)在,由于我們正在處理最大化 GPU 理論吞吐量的基準(zhǔn)測(cè)試,因此讓我們首先看一下理論數(shù)字。RTX 3090 Ti 擁有 10,752 個(gè)主頻為 1860 MHz 的 CUDA 內(nèi)核,可產(chǎn)生 39.99 TFLOPs 的 FP32 性能。另一方面,RTX 4070 Ti 有 7680 個(gè)時(shí)鐘頻率為 2610 MHz 的 CUDA 內(nèi)核,可產(chǎn)生 40.09 TFLOPs 的 FP32 性能。

現(xiàn)在 Octanebench 也可以考慮卡上的 RT 內(nèi)核,其中 NVIDIA RTX 4070 Ti 有 60 個(gè),而 3090 Ti 有 84 個(gè)??偠灾琑TX 3090 Ti 在紙面上非常接近 RTX 4070 Ti,有趣的是至少有一個(gè)基準(zhǔn)可以充分利用這一點(diǎn)。
RTX 4070 Ti 得分為 725.3 分,而 RTX 3090 Ti 得分為 688.17 分(或快 5%)。然而,值得注意的是,這個(gè)分?jǐn)?shù)是一個(gè)組合分?jǐn)?shù),結(jié)果經(jīng)過(guò)大量匯總和加權(quán)。我注意到 RTX 4070 Ti 在信息通道測(cè)試中非常強(qiáng)大(可能是因?yàn)樯?jí)了 VRAM),與 RTX 3090 Ti 的 697 相比,它的得分為 953。然而,在直接閃電和路徑追蹤方面,它的得分大致相同與 RTX 3090 Ti 的 687 和 687 相比,得分分別為 705 和 696。
這看起來(lái)像是 NVIDIA 的一次相當(dāng)不錯(cuò)的性能升級(jí),并且從表面上看是 RTX 3090 Ti 的可靠替代品。然而,這就是比較失敗的地方。有很多與此相關(guān)的警告。1) 這是渲染測(cè)試,不是游戲測(cè)試。游戲在很大程度上受驅(qū)動(dòng)程序優(yōu)化的影響,并且與峰值理論 FP32 性能僅具有部分相關(guān)性。2) 我們不知道這里使用的卡片是重度 OC 版還是原版。在得出任何結(jié)論之前,最好有一個(gè)更大的樣本量。
所有這一切都意味著,在現(xiàn)實(shí)世界中,RTX 3090 Ti 在可預(yù)見(jiàn)的未來(lái)應(yīng)繼續(xù)保持比 RTX 4070 Ti 更快的總體游戲速度。然而,增加的時(shí)鐘速度和架構(gòu)改進(jìn)可能使它成為渲染愛(ài)好者和視頻專業(yè)人士的理想卡。