關(guān)注兔英偉達(dá)H100至尊版速度提10倍

2023-03-22 18:54 作者:靛酊嬭翊 0人讀過 | 我要投稿

關(guān)注兔靠著滿屏的「生成式 AI」，手握一塊支撐 ChatGPT 算力、提速 10 倍的 H100 NVLINK 芯片，老黃就差把這幾個(gè)字寫在臉上 ——「我是贏家」。

AI 的 iPhone 時(shí)刻已經(jīng)到來，第四次科技革命就要開啟，而手握 A100 和 H100 的英偉達(dá)，或成最大贏家。

在 GTC 大會(huì)上，老黃宣布了英偉達(dá)在 GPU、加速庫(kù)、計(jì)算光刻、云平臺(tái)上的亮眼進(jìn)步，更是放出豪言 —— 英偉達(dá)就是要做 AI 圈的臺(tái)積電！

現(xiàn)在已經(jīng)有人猜測(cè)，今天的演講都是在 H100 上用 AIGC 模型生成的。

ChatGPT 專用 GPU 已來

這次大會(huì)上最重磅的發(fā)布，就是針對(duì) ChatGPT 打造的 NVIDIA H100 NVLINK。

因?yàn)樗懔π枨缶薮螅槍?duì) ChatGPT 等 LLM 的推理，英偉達(dá)推出了新款 Hopper GPU，配備雙 GPU NVLINK 的 PCIE H100，具有 94B 內(nèi)存。

事實(shí)上，深度學(xué)習(xí)的歷史從 2012 年之后，就一直與英偉達(dá)息息相關(guān)。

老黃表示，2012 年深度學(xué)習(xí)元老 Hinton 和學(xué)生 Alex Kerchevsky、Ilya Suskever 在訓(xùn)練 AlexNet 時(shí)，用的正是 GeForce GTX 580。

隨后，AlexNet 一舉奪得 ImageNet 圖像分類競(jìng)賽冠軍，成為了深度學(xué)習(xí)大爆炸的奇點(diǎn)。

而時(shí)隔 10 年，在 OpenAI 的 Ilya Suskever 也是用著英偉達(dá)的 DGX，訓(xùn)練出了 ChatGPT 背后的 GPT3，及 GPT3.5。

老黃自豪地說，目前在云上唯一可以實(shí)際處理 ChatGPT 的 GPU，就是 HGX A100。

但與 A100 相比，一臺(tái)搭載四對(duì) H100 和雙 GPU NVLINK 的服務(wù)器速度還要快上 10 倍！因?yàn)?H100 可以將 LLM 的處理成本降低一個(gè)數(shù)量級(jí)。

隨著生成式 AI 掀起一波機(jī)遇浪潮，AI 正處于轉(zhuǎn)折點(diǎn)，使得推理工作負(fù)載呈階梯函數(shù)式增長(zhǎng)。

在以前，設(shè)計(jì)一個(gè)云數(shù)據(jù)中心來處理生成式 AI，是巨大的挑戰(zhàn)。

一方面，理想情況下最好使用一種加速器，使數(shù)據(jù)中心具有彈性；但另一方面，沒有一個(gè)加速器能以最優(yōu)的方式處理在算法、模型、數(shù)據(jù)類型和大小方面的多樣性。英偉達(dá)的 One Architecture 平臺(tái)就兼具加速功能和彈性。

而今天，英偉達(dá)宣布，推出全新的推理平臺(tái)。每種配置都對(duì)某類工作負(fù)載進(jìn)行了優(yōu)化。

比如針對(duì) AI 視頻工作負(fù)載，英偉達(dá)就推出了 L4，在視頻解碼和轉(zhuǎn)碼、視頻內(nèi)容審核、視頻通話功能上做了優(yōu)化。

關(guān)注兔

標(biāo)簽：

關(guān)注兔英偉達(dá)H100至尊版速度提10倍的評(píng)論 (共條)