
新智元報(bào)道
編輯:編輯部【新智元導(dǎo)讀】英偉達(dá)又放大招了,這次直接用超級(jí)GPU GH200燃爆了市場。
今日的COMPUTEX大會(huì)上,英偉達(dá)CEO黃仁勛向全世界宣布——我們已經(jīng)到達(dá)了生成式AI的引爆點(diǎn)。從此,全世界的每個(gè)角落,都會(huì)有計(jì)算需求。股價(jià)剛剛暴漲2000億美元的英偉達(dá),為這一刻早已做好準(zhǔn)備。一開場,身著黑皮衣的老黃慷慨激昂地走上舞臺(tái),「大家好!We’re back!」隨后,便祭出大殺器——「超級(jí)GPU」 GH200,并宣布谷歌云、Meta和微軟將率先獲得GH200。
據(jù)稱,有超過3500人親臨現(xiàn)場,體驗(yàn)了這個(gè)長達(dá)2個(gè)小時(shí)的激情演講。時(shí)隔4年,闊別已久的老黃也是狂飆中文。
「超級(jí)芯片」GH200
要說,這次演講中,重頭戲還是在GPU上。畢竟AI的iPhone已經(jīng)來臨。老黃左右手分別端了一個(gè)芯片,重磅宣布,「GH200超級(jí)芯片」已經(jīng)全面投產(chǎn)。
這一「超級(jí)GPU」使用NVLink-c2c互連技術(shù),將基于ARM節(jié)能的GraceCPU和高性能NVIDIA H100 Tensor Core GPU結(jié)合在一起,提供了高達(dá)900GB/s的總帶寬。目前,由GH200加持的系統(tǒng)加入了400多種系統(tǒng)配置。這些系統(tǒng)配置由英偉達(dá)最新的CPU、 GPU和DPU架構(gòu)的不同組合提供動(dòng)力。其中包括Grace、Hopper、Ada Lovelace和BlueField,這些架構(gòu)的創(chuàng)建是為了滿足對(duì)生成式AI不斷增長的需求。
此外,老黃還宣布了一個(gè)更重磅的:256個(gè)GH200組成的超算來了。超算DGX GH200,今年上市
英偉達(dá)表示,全新DGX GH200人工智能超級(jí)計(jì)算平臺(tái),是專為大規(guī)模生成式AI的負(fù)載而設(shè)計(jì)。這臺(tái)由256塊Grace Hopper超級(jí)芯片組成的超算,將擁有高達(dá)1 exaflop的超凡AI性能,以及144TB的共享內(nèi)存(比上一代DGX A100多了近500倍)。舉個(gè)例子,在GPT-3訓(xùn)練中,它能比上一代DGX H100集群快2.2倍。此外,這個(gè)龐然大物還包含了150英里的光纖和2,000多個(gè)風(fēng)扇。目前,英偉達(dá)已經(jīng)與三大巨頭進(jìn)行了合作,谷歌、 Meta和微軟。
由于生成式人工智能的爆炸式增長,微軟、谷歌等巨頭希望擁有更強(qiáng)大、性能更好的系統(tǒng)。而DGX H200的設(shè)計(jì)目的是,通過使用英偉達(dá)定制的NVLink Switch芯片,繞開InfiniBand和以太網(wǎng)等標(biāo)準(zhǔn)集群連接的局限性,為最大工作負(fù)載的大規(guī)模可擴(kuò)展性提供最大的吞吐量。
另外,英偉達(dá)表示正在建造自己的大型AI超級(jí)計(jì)算機(jī)NVIDIA Helios,預(yù)計(jì)在今年上線。它將使用4個(gè)與NVIDIA Quantum-2 InfiniBand網(wǎng)絡(luò)連接的DGX GH200系統(tǒng),以提高數(shù)據(jù)吞吐量,以訓(xùn)練大型AI模型。以往的數(shù)據(jù)中心都非常龐大,而且是基于CPU的,算法的迭代要花很長時(shí)間,大部分算法,也都是CPU中心的。而現(xiàn)在,有了Grace Hopper,只需要幾天甚至幾個(gè)小時(shí),就能完成這個(gè)過程。簡直要把整個(gè)行業(yè)都革命掉了!
(等等,PaLM的參數(shù)不是540B么?)老黃:買越多,越省錢!
作為現(xiàn)在的扛把子,這樣一個(gè)重65磅,價(jià)值200000美元的H100計(jì)算機(jī),是世界上第一個(gè)搭載了Transformer Engine,也是目前全世界最昂貴的計(jì)算機(jī)。
老黃表示,可以說,像這樣的產(chǎn)品,你買得越多,就省得越多。
接下來,老黃提到1964年的IBM 360,強(qiáng)調(diào)了CPU的重要性。老黃自信地重復(fù)表示,「而60年后,我們現(xiàn)在有數(shù)據(jù)中心。今天,數(shù)據(jù)中心就是一個(gè)計(jì)算機(jī)?!?/span>
正如老黃所說,一種新的計(jì)算模式正在被創(chuàng)造。
為什么使用GPU勝過使用CPU?老黃從配置上給出了分析:花費(fèi)1000萬美金成本,你可以建置一個(gè)有960顆CPU的數(shù)據(jù)中心,但這個(gè)數(shù)據(jù)中心要11GWh的功率,處理1X LMM(大語言模型)的數(shù)據(jù)量。
但一樣的錢,你可以建置一個(gè)配備有48個(gè)GPU的數(shù)據(jù)中心,但只要3.2GWh的功耗,而且可以處理44X LLM的數(shù)據(jù)量。
要知道,如此配置已經(jīng)足夠驚人。然而,這還不夠。為了獲得極致性能,你可以在功耗不變的情況下,把GPU數(shù)量直接拉到172個(gè)。此時(shí)的算力,可以高達(dá)CPU數(shù)據(jù)中心的150倍。當(dāng)然,預(yù)算也提高到了3400萬美元。
此外,如果你就只是單純地想完成手頭的工作(1X LLM),老黃也幫你把成本打下來了——只需花40萬美金,就能買一個(gè)搭載了2個(gè)GPU的數(shù)據(jù)中心,功耗僅0.13GWh。
臺(tái)下響起一片掌聲,老黃又拿出了口頭禪「The more you buy,The more you save」,甚至重復(fù)了三遍。這背后的策略,究竟是什么?老黃給了一個(gè)公式。
MGX:模塊化架構(gòu)
與此同時(shí),老黃還推出了NVIDIA MGXTM,一個(gè)供系統(tǒng)制造商快速、低成本地構(gòu)建100多個(gè)服務(wù)器變體的參考架構(gòu)。據(jù)稱,這個(gè)規(guī)范可以將開發(fā)成本削減多達(dá)四分之三,并將開發(fā)時(shí)間縮短三分之二,僅需要6個(gè)月。有了MGX,科技公司可以為他們的服務(wù)器優(yōu)化加速計(jì)算的基本系統(tǒng)架構(gòu),然后選擇自己的GPU,DPU和CPU。MGX還可以很容易地集成到云和企業(yè)數(shù)據(jù)中心。
除了硬件之外,MGX還得到了英偉達(dá)完整軟件棧的支持,這使得開發(fā)者和企業(yè)能夠構(gòu)建和加速 AI、 HPC 和其他應(yīng)用程序。這包括NVIDIA AI Enterprise,NVIDIA AI平臺(tái)的軟件層,其特點(diǎn)是有100多個(gè)框架、預(yù)訓(xùn)練的模型和開發(fā)工具,以加速人工智能和數(shù)據(jù)科學(xué),為企業(yè)人工智能開發(fā)和部署提供充分支持。將AI引入游戲,實(shí)時(shí)語音聊天的NPC角色來了
這次演講的亮點(diǎn),還有全新的定制AI模型代工服務(wù) ——Avatar Cloud Engine (ACE) for Game。現(xiàn)場,老黃右手手持一塊RTX 4060 Ti,左手手持一臺(tái)電腦,展示了運(yùn)行實(shí)時(shí)光線追蹤的Cyberpunk 2077。在一個(gè)充滿「賽博朋克」風(fēng)格的拉面店場景中,玩家按下一個(gè)按鈕,可以用自己的聲音說話,然后店主Jin會(huì)進(jìn)行回答。Jin是一個(gè)NPC角色,但他的回答是由生成式AI根據(jù)玩家的語音輸入實(shí)時(shí)生成的。Jin還有著逼真的面部動(dòng)畫和聲音,與玩家的語氣和背景故事相符。
這個(gè)逼真人物角色的生成,使用了一個(gè)實(shí)時(shí)人工智能模型渲染工具Nvidia Ace。老黃表示,這個(gè)游戲中的角色并沒有預(yù)先設(shè)定。他們有一個(gè)典型的任務(wù)提供者NPC類型。
但是從視頻中,可以看到,虛擬角色的談話有點(diǎn)生硬,但還不算太糟。那些沒有AI專業(yè)知識(shí)的人,將被拋棄
40年來,我們創(chuàng)造了PC、互聯(lián)網(wǎng)、移動(dòng)、云,現(xiàn)在是人工智能時(shí)代。你會(huì)創(chuàng)造什么?不管是什么,都要像我們一樣追趕它。要奔跑,不要走。要么是你為食物而奔跑,要么就是你任自己逃避,成為食物。

5月27日,黃仁勛在臺(tái)灣大學(xué)發(fā)表了畢業(yè)典禮演講。此刻,他正為全世界所矚目。瞬間變身萬億掌門人,讓他的話更有底氣。黃仁勛表示,每個(gè)公司和個(gè)人都應(yīng)該熟悉人工智能,否則,就有失敗的危險(xiǎn)。
他強(qiáng)調(diào):敏捷的公司會(huì)利用人工智能提高自己的地位,這樣的公司不會(huì)倒閉。很多人擔(dān)心,AI會(huì)搶走自己的工作,但真正會(huì)搶走你飯碗的,掌握了AI技術(shù)的人。當(dāng)時(shí),他在演講中預(yù)言:從各方面來看,AI的興盛是計(jì)算機(jī)產(chǎn)業(yè)的再生契機(jī)。在下個(gè)十年,我們的產(chǎn)業(yè)將使用新型的AI電腦,取代價(jià)值萬億美元的傳統(tǒng)電腦。而從今天的演講中,我們仿佛已經(jīng)窺見了這種未來的雛形。
標(biāo)簽: