麗臺開箱評測 | Quadro RTX 8000
高端顯卡的各項指標都很高,具備更多的 CUDA 核心,具備更大的顯存空間,具備更高的顯存帶寬,使用的領域更廣。下面我們對 Quadro RTX 8000 做一個整體的開箱評測。
開箱

和其他 Quadro RTX 顯卡包裝一樣, 使用綠白灰搭配,正面的灰色格子采用漸變的顏色很有現(xiàn)代感和立體感,包裝的正面和頂部、側(cè)面都有顯卡型號的標識。整體拿在手里分量感十足,包裝的材質(zhì)很結實。
RTX 幾個字有金屬反光效果,凸顯了這代顯卡重要的功能之一——實時光線追蹤。
拆開包裝

內(nèi)部包裝也和麗臺以往的包裝不一樣,外殼和防震泡沫是一體的,顯卡安放其中。給人的感覺是堅固、牢靠。

顯卡外面還有一層透明防靜電袋,配線盒里面有用戶手冊、支持手冊、8 pin 轉(zhuǎn)雙6 pin 電源線、DP 轉(zhuǎn) DVI 轉(zhuǎn)接頭、DP 轉(zhuǎn) HDMI 轉(zhuǎn)接頭等,這是眾多使用 DVI 顯示器或 HDMI 顯示器的福音,再也不用另外單獨購買轉(zhuǎn)接頭了。

顯卡外觀主要采用綠 、反光銀色和黑色搭配,與包裝風格一致。面板反光應該是為了突出 RTX 這個主題了。在顯卡正面和脊背上都能看到顯卡型號的標識。
Quadro RTX 8000 是雙插槽,1個渦輪風扇,顯卡采用 8 pin 加 6 pin 的供電接口,對于功耗為 295W 的 RTX8000 來講是足夠用了。
顯卡頂部總共有 3 個接口:NVLink、SYNC、Stereo。
NVLink 技術取代了 SLI 技術,可以配合 Quadro NVLink 2-Slot 或者 3-Slot 使用。NVLink 技術不但具備多卡同步輸出的功能,在應用支持的情況下,還能實現(xiàn)顯存疊加的功能,使兩塊卡疊加成一個更大的顯存,那就有96GB?超大的顯存可用。
SYNC 接口要配合 Quadro SYNC II 卡來使用,實現(xiàn)多卡的顯示信號同步輸出。多余大屏拼接的用戶來講可以延續(xù)之前的使用方法。
Stereo 接口要配合 3D 立體檔板來輸出 3D 立體信號的。
總線接口是 PCIE 3.0 接口,向下兼容 PCIE 2.0。目前市場上主板大都是使用這種接口的。

顯示接口有了新的變化,不是 4xDP + 1xDVI 的配置,改成了4xDP + 1xVirtuallink的配置。
DP 接口都支持 DP 1.4 的協(xié)議,分辨率可以達到 7680x4320。而 Virtuallink接口則是下一代 VR 設備使用的標準接口,一個接口可完成供電、顯示傳輸、控制信號多個功能。

性能測試
測試平臺詳細設置

測試顯卡詳細參數(shù)

測試軟件

1. SPECviewperf 13
SPECviewperf 13 是基于專業(yè)應用上衡量圖形性能被廣泛應用的測試軟件。該軟件對基于 OpenGL 和 Direct X 的專業(yè)繪圖軟件進行基準評測,SPECviewperf 13帶來了全新的 9 個專業(yè)圖形測試場景,SPECviewperf 13 測試更加貼近真實的工作應用, 其中一些測試場景甚至包含有超過 6,000 萬個定點數(shù)據(jù),能夠充分反映出顯卡的專業(yè)圖形性能,此次測試我們使用軟件默認配置進行評測。

從測試結果來看,RTX 8000看來Turing架構增加的不僅僅是光線追蹤的效率和深度學習的效率。在專業(yè)應用的性能也非常不錯。
2. SuperPosition Benchmark
這款軟件更像是在一個復雜的游戲環(huán)境,在不同的光場效果中對顯卡 DX 和OpenGL 渲染性能及穩(wěn)定性的評測,這次評測使用的 4K 分辨率進行測試。


3. vRay Benchmark
Chaos Group 的 VRay 在渲染領域早已被廣大用戶認可了, 由于 GPU 渲染性能的提升,Chaos Group 在 VRay Next 上推出了 VRay GPU NEXT版本,支持調(diào)用Nvidia CUDA 核心進行渲染,隨著技術的不斷更新 GPU 渲染的質(zhì)量上幾乎和CPU 沒有區(qū)別。GPU 算力強勁渲染時間成本會更低,并且支持多卡加速渲染,本次評估僅測試單卡的渲染性能。

從測試結果看使用?RTX 8000 只用了 44 秒,對于單卡的渲染速度來講,已經(jīng)是超快了。
4. CUDA-Z
就像我們熟知的 CPU-z 、GPU-z 一樣,CUDA-z 是對 NVIDIA GPU 處理器的一些基本信息的采集, Geforce、Quadro、Tesla 卡都可以配合使用。

CUDA 計算能力:
在 CUDA-z 的測試項目中,我們實際用到的是單精度浮點運算,如果有使用到雙精度科學計算的,推薦使用 GV100 或者 GP100 雙精計算能力高的 GPU。
RTX 8000 單精計算的能力達到了 11.7T。這么強的單晶浮點數(shù)是 CPU 不能匹敵的,越來越多的應用把計算從 CPU 轉(zhuǎn)向了 GPU,48GB 的大顯存可以加載更多計算數(shù)據(jù),在顯存中進行交互,加快計算速度。
5. 3Dmark Port Royal


目前 NVIDIA 的 RTX 渲染的 Benchmark功能, 3Dmark 的 Port Royal 可以支持。測試場景里帶了大量金屬的材質(zhì),反射效果驚艷。RTX8000 渲染 FPS 達到了38 左右?guī)?,還算流暢。目前游戲行業(yè)已經(jīng)有 BF5 使用這種技術,相信未來在工業(yè)制造領域、影視后期領域也會被廣泛的使用。
6. NVIDIA Tensorflow example
我們選擇 NVIDIA Tensorflow 的一個示例來測試顯卡的性能。在相同參數(shù)設置的情況下,哪塊卡在一秒內(nèi)訓練的圖片數(shù)越多,說明顯卡在示例學習方面的性能越好。

可以看到,RTX 8000 在滿載額時候每秒處理的數(shù)量至多為 643 張。
Quadro RTX 高端卡都具有 Tensor Core,可以實現(xiàn)圖像加 AI 的一些應用。例如在渲染的同時可以實現(xiàn)去 AI 噪點,或者其他 AI 推理的一些工作。
總結
具有 RTCores 支持 RTX 實時光線追蹤渲染,能渲染出具有流光溢彩真實感的畫面。渲染速度非???,在諸多行業(yè)可視化的工業(yè)設計流程上會有很好的推動作用。
相較 RTX 6000,Quadro RTX 8000的顯存達到了 48GB。大顯存的意義在于能加載更大的 3D 場景而不至于顯存溢出,導致渲染失敗。有了 NVLink 的加持在很多應用上可以實現(xiàn) 96GB 的巨大顯存。
?具有 Tensor Cores,可以加速深度學習和 AI 推理。在人工智能大力發(fā)展的今天,有了 Tensor Cores 的加持,很多應用會變得如虎添翼。此時大顯存又能顯示出優(yōu)勢,能多的數(shù)據(jù)加載到顯存里,能在很大程度上加快計算速度。減少數(shù)據(jù) COPY 的時間。