關(guān)注兔英偉達(dá)H100至尊版速度提10倍
關(guān)注兔靠著滿屏的「生成式 AI」,手握一塊支撐 ChatGPT 算力、提速 10 倍的 H100 NVLINK 芯片,老黃就差把這幾個(gè)字寫在臉上 ——「我是贏家」。
AI 的 iPhone 時(shí)刻已經(jīng)到來,第四次科技革命就要開啟,而手握 A100 和 H100 的英偉達(dá),或成最大贏家。
在 GTC 大會(huì)上,老黃宣布了英偉達(dá)在 GPU、加速庫(kù)、計(jì)算光刻、云平臺(tái)上的亮眼進(jìn)步,更是放出豪言 —— 英偉達(dá)就是要做 AI 圈的臺(tái)積電!
現(xiàn)在已經(jīng)有人猜測(cè),今天的演講都是在 H100 上用 AIGC 模型生成的。
ChatGPT 專用 GPU 已來
這次大會(huì)上最重磅的發(fā)布,就是針對(duì) ChatGPT 打造的 NVIDIA H100 NVLINK。
因?yàn)樗懔π枨缶薮螅槍?duì) ChatGPT 等 LLM 的推理,英偉達(dá)推出了新款 Hopper GPU,配備雙 GPU NVLINK 的 PCIE H100,具有 94B 內(nèi)存。

事實(shí)上,深度學(xué)習(xí)的歷史從 2012 年之后,就一直與英偉達(dá)息息相關(guān)。
老黃表示,2012 年深度學(xué)習(xí)元老 Hinton 和學(xué)生 Alex Kerchevsky、Ilya Suskever 在訓(xùn)練 AlexNet 時(shí),用的正是 GeForce GTX 580。
隨后,AlexNet 一舉奪得 ImageNet 圖像分類競(jìng)賽冠軍,成為了深度學(xué)習(xí)大爆炸的奇點(diǎn)。
而時(shí)隔 10 年,在 OpenAI 的 Ilya Suskever 也是用著英偉達(dá)的 DGX,訓(xùn)練出了 ChatGPT 背后的 GPT3,及 GPT3.5。

老黃自豪地說,目前在云上唯一可以實(shí)際處理 ChatGPT 的 GPU,就是 HGX A100。
但與 A100 相比,一臺(tái)搭載四對(duì) H100 和雙 GPU NVLINK 的服務(wù)器速度還要快上 10 倍!因?yàn)?H100 可以將 LLM 的處理成本降低一個(gè)數(shù)量級(jí)。
隨著生成式 AI 掀起一波機(jī)遇浪潮,AI 正處于轉(zhuǎn)折點(diǎn),使得推理工作負(fù)載呈階梯函數(shù)式增長(zhǎng)。

在以前,設(shè)計(jì)一個(gè)云數(shù)據(jù)中心來處理生成式 AI,是巨大的挑戰(zhàn)。
一方面,理想情況下最好使用一種加速器,使數(shù)據(jù)中心具有彈性;但另一方面,沒有一個(gè)加速器能以最優(yōu)的方式處理在算法、模型、數(shù)據(jù)類型和大小方面的多樣性。英偉達(dá)的 One Architecture 平臺(tái)就兼具加速功能和彈性。
而今天,英偉達(dá)宣布,推出全新的推理平臺(tái)。每種配置都對(duì)某類工作負(fù)載進(jìn)行了優(yōu)化。

比如針對(duì) AI 視頻工作負(fù)載,英偉達(dá)就推出了 L4,在視頻解碼和轉(zhuǎn)碼、視頻內(nèi)容審核、視頻通話功能上做了優(yōu)化。

關(guān)注兔