NVIDIA RTX GPU x 3DCAT實(shí)時(shí)渲染云,提供強(qiáng)大的圖形實(shí)時(shí)渲染計(jì)算服務(wù)
就在大家被虛幻引擎5的渲染技術(shù)Nanite和動(dòng)態(tài)全局光照技術(shù)Lumen震驚得還沒(méi)回過(guò)神兒的時(shí)候,NVIDIA創(chuàng)始人兼CEO黃仁勛在自家廚房開(kāi)始了GTC 2020主題演講,端出了“新鮮出爐”的“核彈基地”——NVIDIA A100,全球最大的GPU,具備全新安培(Ampere)架構(gòu),7nm工藝,540億晶體管,20倍AI算力提升。
就在大家被虛幻引擎5的渲染技術(shù)Nanite和動(dòng)態(tài)全局光照技術(shù)Lumen震驚得還沒(méi)回過(guò)神兒的時(shí)候,NVIDIA創(chuàng)始人兼CEO黃仁勛在自家廚房開(kāi)始了GTC 2020主題演講,端出了“新鮮出爐”的“核彈基地”——NVIDIA A100,全球最大的GPU,具備全新安培(Ampere)架構(gòu),7nm工藝,540億晶體管,20倍AI算力提升。



基于Ampere(安培)架構(gòu)的GPU——NVIDIA A100
首款基于Ampere架構(gòu)的GPU —— NVIDIA A100,目前已全面投產(chǎn)并已向全球客戶交付。NVIDIA Ampere 架構(gòu)實(shí)現(xiàn)了革命性的數(shù)據(jù)分析、訓(xùn)練和推理性能。
A100采用了NVIDIA Ampere架構(gòu)的突破性設(shè)計(jì),該設(shè)計(jì)為NVIDIA第八代GPU提供了迄今為止最大的性能飛躍,首個(gè)彈性、多實(shí)例GPU,集數(shù)據(jù)分析、AI訓(xùn)練和推理于一身,并且其性能相比于前代產(chǎn)品提升了高達(dá)20倍。作為一款通用型工作負(fù)載加速器,A100還被設(shè)計(jì)用于數(shù)據(jù)分析、科學(xué)計(jì)算和云圖形,被全球頂級(jí)云供應(yīng)商和服務(wù)器制造商所采用。

NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“云計(jì)算和AI的強(qiáng)大趨勢(shì)正在推動(dòng)數(shù)據(jù)中心設(shè)計(jì)的結(jié)構(gòu)性轉(zhuǎn)變,過(guò)去的純CPU服務(wù)器正在被高效的加速計(jì)算基礎(chǔ)架構(gòu)所取代。NVIDIA A100 GPU作為一個(gè)端到端的機(jī)器學(xué)習(xí)加速器,其實(shí)現(xiàn)了從數(shù)據(jù)分析到訓(xùn)練再到推理20倍的AI性能飛躍。這是有史以來(lái)首次,可以在一個(gè)平臺(tái)上實(shí)現(xiàn)對(duì)橫向擴(kuò)展以及縱向擴(kuò)展的負(fù)載的加速。NVIDIA A100將在提高吞吐量的同時(shí),降低數(shù)據(jù)中心的成本。”

A100所采用的全新彈性計(jì)算技術(shù)能夠?yàn)槊宽?xiàng)工作分配適量的計(jì)算能力。多實(shí)例GPU技術(shù)可將每個(gè)A100GPU分割為多達(dá)七個(gè)獨(dú)立實(shí)例來(lái)執(zhí)行推理任務(wù),而第三代NVIDIA NVLink互聯(lián)技術(shù)能夠?qū)⒍鄠€(gè)A100GPU合并成一個(gè)巨大的GPU來(lái)執(zhí)行更大規(guī)模的訓(xùn)練任務(wù)。
A100的五大突破
NVIDIAA100 GPU的突破性技術(shù)設(shè)計(jì)來(lái)源于五大關(guān)鍵性創(chuàng)新:
A100的核心是NVIDIA Ampere GPU架構(gòu):
該架構(gòu)包含超過(guò)540億個(gè)晶體管,這使其成為全球最大的7納米處理器。
具有TF32的第三代Tensor Core核心:
NVIDIA廣泛采用的Tensor Core核心現(xiàn)在已變得更加靈活、快速且易于使用。其功能經(jīng)過(guò)擴(kuò)展后加入了專為AI開(kāi)發(fā)的全新TF32,它能在無(wú)需更改任何代碼的情況下,使FP32精度下的AI性能提高多達(dá)20倍。此外,Tensor Core核心現(xiàn)在支持FP64精度,相比于前代,其為HPC應(yīng)用所提供的計(jì)算力比之前提高了多達(dá)2.5倍。

多實(shí)例GPU:
MIG,一種全新技術(shù)功能,可將單個(gè)A100 GPU分割為多達(dá)七個(gè)獨(dú)立的GPU,為不同規(guī)模的工作提供不同的計(jì)算力,以此實(shí)現(xiàn)最佳利用率和投資回報(bào)率的最大化。
第三代NVIDIA NVLink:
使GPU之間的高速聯(lián)接增加至原來(lái)的兩倍,實(shí)現(xiàn)服務(wù)器的高效性能擴(kuò)展。
結(jié)構(gòu)化稀疏:
這種全新效率技術(shù)利用AI數(shù)學(xué)固有的稀疏性,使性能提升了一倍。
憑借這些新功能,NVIDIA A100成為了AI訓(xùn)練和推理以及科學(xué)模擬、對(duì)話式AI、推薦系統(tǒng)、基因組學(xué)、高性能數(shù)據(jù)分析、地震建模和金融預(yù)測(cè)等各種高要求工作負(fù)載的理想選擇。
這些特性促成了A100性能的提升:與NVIDIA上一代的Volta架構(gòu)相比,訓(xùn)練性能提高了6倍,推理性能提高了7倍。
新系統(tǒng)已搭載NVIDIA A100,很快將登陸云端

新發(fā)布的還有NVIDIA DGX? A100 系統(tǒng),其內(nèi)置8個(gè)由NVIDIA NVLink互聯(lián)的NVIDIA A100 GPU。


NVIDIA還宣布了下一代DGX SuperPOD。它由140臺(tái)DGX A100系統(tǒng)和Mellanox網(wǎng)絡(luò)技術(shù)搭建而成,可提供700 petaflops的AI性能,堪比全球20臺(tái)最快的計(jì)算機(jī)中的任何一臺(tái)。

為幫助合作伙伴加快服務(wù)器的開(kāi)發(fā),NVIDIA開(kāi)發(fā)了HGX A100服務(wù)器構(gòu)建模塊,該模塊采用了多GPU配置的集成基板形式。

HGX A100 4-GPU通過(guò)NVLink實(shí)現(xiàn)GPU之間的完整互聯(lián),8-GPU配置的HGX A100通過(guò)NVIDIA NVSwitch實(shí)現(xiàn)GPU之間的全帶寬通信。采用全新MIG技術(shù)的HGXA100能夠被分割為56個(gè)小型GPU,每個(gè)GPU的速度都比NVIDIA T4更快;或者也可以將其用作一臺(tái)擁有10petaflopsAI性能的巨型8-GPU服務(wù)器。
A100軟件優(yōu)化
NVIDIA還發(fā)布了多個(gè)軟件堆棧更新,使應(yīng)用程序開(kāi)發(fā)者能夠充分發(fā)揮A100 GPU創(chuàng)新技術(shù)的性能。這些更新包括了50多個(gè)新版本CUDA-X? 庫(kù),可用于加速圖形、模擬和AI;CUDA11;多模態(tài)對(duì)話式AI服務(wù)框架NVIDIA Jarvis;深度推薦應(yīng)用框架 NVIDIA Merlin;以及NVIDIA HPC SDK,其中包括能夠幫助HPC開(kāi)發(fā)者調(diào)試和優(yōu)化A100代碼的編譯器、庫(kù)和工具。
在全球范圍內(nèi)被迅速采用
Microsoft(微軟)是首批采用NVIDIAA100 GPU的用戶之一,計(jì)劃充分利用其性能和可擴(kuò)展性。
Microsoft公司副總裁MikhailParakhin表示:
“Microsoft大規(guī)模應(yīng)用前代NVIDIA GPU訓(xùn)練了全球最大的語(yǔ)言模型——TuringNatural Language Generation。Azure將使用NVIDIA 新一代A100 GPU訓(xùn)練更大型的AI模型,以推動(dòng)語(yǔ)言、語(yǔ)音、視覺(jué)和多模態(tài)技術(shù)領(lǐng)域的最新發(fā)展?!?/p>
DoorDash是一個(gè)按需提供的食品平臺(tái),在大流行期間作為餐館的生命線,它指出了擁有靈活的人工智能基礎(chǔ)設(shè)施的重要性。
DoorDash的機(jī)器學(xué)習(xí)工程師Gary Ren表示:
“現(xiàn)代復(fù)雜AI訓(xùn)練和推理工作負(fù)載需要處理大量的數(shù)據(jù),像NVIDIA A100 GPU這樣最先進(jìn)的技術(shù),可以幫助縮短模型訓(xùn)練時(shí)間,加快機(jī)器學(xué)習(xí)開(kāi)發(fā)進(jìn)程。此外,采用基于云的GPU集群還能夠?yàn)槲覀兲峁└叩撵`活性,可以根據(jù)需要擴(kuò)容或縮容,將有助于提高效率、簡(jiǎn)化操作并節(jié)約成本?!?/p>
NVIDIA RTX 服務(wù)器
兩年NVIDIA前在SIGGRAPH 2018發(fā)布了RTX,開(kāi)啟了計(jì)算機(jī)圖形的新紀(jì)元。

NVIDIA RTX 服務(wù)器采用高度靈活的服務(wù)器參考設(shè)計(jì),結(jié)合了 NVIDIA Quadro RTX? 6000和8000 GPU 與 NVIDIA 虛擬 GPU (vGPU)軟件和行業(yè)領(lǐng)先的第三方應(yīng)用程序,以提供卓越的計(jì)算能力。
RTX服務(wù)器提供了一系列經(jīng)過(guò)驗(yàn)證的解決方案,從虛擬工作站和渲染到可擴(kuò)展視覺(jué)系統(tǒng)和邊緣計(jì)算,借助NVIDIA RTX服務(wù)器,用戶能以遠(yuǎn)低于傳統(tǒng)CPU解決方案的成本、空間和功耗,獲得前所未有的性能。

NVIDIA RTX 服務(wù)器適用場(chǎng)景包括:虛擬工作站、渲染、計(jì)算機(jī)輔助工程(CAE)、協(xié)同設(shè)計(jì)、AR/VR、可擴(kuò)展可視化解決方案。

RTX賦力Omniverse View:新型渲染器兼顧實(shí)時(shí)速度與離線質(zhì)量
NVIDIA Omniverse是一個(gè)計(jì)算機(jī)圖形和仿真模擬平臺(tái),能夠讓藝術(shù)家實(shí)現(xiàn)實(shí)時(shí)無(wú)縫協(xié)作,無(wú)論是跨本地部署的軟件應(yīng)用還是通過(guò)云端的全球協(xié)作。該平臺(tái)現(xiàn)已向建筑、工程和施工(AEC)市場(chǎng)的早期體驗(yàn)客戶開(kāi)放。
Omniverse View可集中顯示Omniverse內(nèi)部不同應(yīng)用中的3D內(nèi)容,或者直接顯示使用中的3D應(yīng)用中的內(nèi)容。它還支持商業(yè)游戲引擎,如Unreal Engine和Unity,以及離線渲染器。
目前,市面上有兩種類型的渲染器。實(shí)時(shí)渲染一般在以每秒30或60幀的速度生成圖像,并始終根據(jù)目標(biāo)用途使用最低配置的設(shè)備。離線渲染側(cè)重于提供逼真的最終圖像或場(chǎng)景,每幀都需要使用CPU花費(fèi)數(shù)小時(shí)進(jìn)行渲染。為了達(dá)到最佳速度,許多角落通常會(huì)被截掉(從簡(jiǎn)化幾何圖形到烘焙照明和法線貼圖),這也導(dǎo)致了圖像質(zhì)量的降低。

為了解決這個(gè)問(wèn)題,Omniverse通過(guò)Omniverse View引入了一種新型渲染。該模塊由多個(gè)NVIDIA RTX GPU加速并且可以在GPU陣列上實(shí)現(xiàn)極高的可擴(kuò)展性,即便是在超大型場(chǎng)景中也能提供高質(zhì)量的實(shí)時(shí)輸出。
黃仁勛還展示了“Marbles”這一具有動(dòng)態(tài)照明實(shí)時(shí)物理特性和豐富物理材質(zhì)的娛樂(lè)游戲環(huán)境,以及該平臺(tái)最新的“AEC Experience”功能集。該功能集通過(guò)實(shí)時(shí)可視化實(shí)現(xiàn)CAD應(yīng)用之間的無(wú)縫連接。
NVIDIA DLSS 2.0
DLSS 2.0 由 GeForce RTX GPU 上的專用 AI 處理器(稱為 Tensor Core)提供支持,是一個(gè)經(jīng)過(guò)改進(jìn)的全新深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),能夠提高幀速率,同時(shí)生成精美、清晰的游戲圖像。DLSS 2.0 為玩家提供了充足的性能,有助于最大化光線追蹤設(shè)置,并提高輸出分辨率。
在主題演講中,NVIDIA為《我的世界》RTX版發(fā)布5個(gè)全新地圖,通過(guò)RTX技術(shù)為這款全球最暢銷的游戲之一提供了令人驚嘆的畫(huà)面質(zhì)量,在這個(gè)新地圖中玩家們可以盡情探索美麗的世界。



NVIDIA RTX GPU x 3DCAT實(shí)時(shí)渲染云
瑞云科技旗下3DCAT實(shí)時(shí)渲染云是一個(gè)三維應(yīng)用的托管運(yùn)行平臺(tái),在云端部署了NVIDIA RTX GPU,提供強(qiáng)大的圖形實(shí)時(shí)渲染計(jì)算服務(wù),支持能在Windows平臺(tái)渲染的包括虛幻引擎在內(nèi)的幾乎所有引擎,支持自動(dòng)負(fù)載均衡和伸縮擴(kuò)容,支持海量用戶同時(shí)安全訪問(wèn)應(yīng)用。

黃教主的廚房演講還包括很多重磅黑科技,包括:NVIDIA CloudXR、NVIDIA HPC SDK、CUDA 11等,感興趣的小伙伴可以去NVIDIA官網(wǎng)深入了解,或者在公眾號(hào)后臺(tái)回復(fù)“GTC2020”即可獲取《NVIDIA GTC 2020 Keynote》演講視頻及字幕。

瑞云科技專注于為視覺(jué)行業(yè)提供垂直云計(jì)算SaaS服務(wù),同時(shí)作為英偉達(dá)深度合作伙伴,聚焦行業(yè)領(lǐng)域先進(jìn)技術(shù),將不斷優(yōu)化提升,帶來(lái)更優(yōu)質(zhì)的服務(wù)與體驗(yàn) ,竭誠(chéng)為各位用戶提供高效優(yōu)質(zhì)的技術(shù)與服務(wù)。
注:素材源自NVIDIA