新的ROCm 5.6版本為AI和HPC工作負(fù)載帶來(lái)增強(qiáng)和優(yōu)化
AMD將于今年秋季在部分RDNA? 3 GPU上添加ROCm的支持

人工智能是塑造下一代計(jì)算的決定性技術(shù)。近幾個(gè)月來(lái),我們都看到了生成式人工智能和大語(yǔ)言模型的爆炸式增長(zhǎng)正在徹底改變我們與技術(shù)交互的方式,并推動(dòng)以GPU為中心的數(shù)據(jù)中心對(duì)高性能計(jì)算的需求顯著增加。

ROCm是一個(gè)開(kāi)放軟件平臺(tái),允許研究人員利用AMD Instinct加速器的強(qiáng)大功能,促進(jìn)HPC和AI創(chuàng)新跨平臺(tái)的可移植性。ROCm 5具有針對(duì)AI和HPC工作負(fù)載的全面優(yōu)化套件。其中包括針對(duì)大型語(yǔ)言模型精細(xì)調(diào)整的內(nèi)核、對(duì)新數(shù)據(jù)類型的支持以及對(duì)像OpenAI Triton類編程語(yǔ)言等新技術(shù)的支持。
ROCm驗(yàn)證現(xiàn)在包括每晚進(jìn)行數(shù)十萬(wàn)次框架測(cè)試,以及跨數(shù)千個(gè)模型和運(yùn)算符的驗(yàn)證。這包括對(duì)PyTorch、TensorFlow、ONNX和JAX等領(lǐng)先框架的支持,為基于這些框架構(gòu)建的所有AI模型提供更佳的開(kāi)箱即用的開(kāi)發(fā)者體驗(yàn)。
我很高興地宣布ROCm 5.6的最新版本。
ROCm 5.6通過(guò)針對(duì)大語(yǔ)言(和其他)模型的新型AI軟件附加組件增強(qiáng)了功能,包括跨ROCm?庫(kù)組合的許多性能優(yōu)化。它還反映了支持人工智能社區(qū)的持續(xù)改進(jìn),包括:
· 將Hugging Face單元測(cè)試套件集成到ROCm QA中?
· 在PyTorch 2.0感應(yīng)器模式下對(duì)OpenAI Triton的增量支持
· 通過(guò)ROCm對(duì)PyTorch、TensorFlow和JAX啟用OpenXLA支持,從而支持更廣泛的社區(qū)
ROCm 5.6還引入了對(duì)FFT、BLAS和求解器等多個(gè)數(shù)學(xué)庫(kù)的改進(jìn),這些數(shù)學(xué)庫(kù)構(gòu)成了HPC應(yīng)用程序的基礎(chǔ),并增強(qiáng)了ROCm開(kāi)發(fā)和部署工具,包括安裝、ROCgdb(CPU-GPU集成調(diào)試器)、ROCm分析器和文檔。
隨著行業(yè)朝著支持廣泛加速器的開(kāi)放生態(tài)系統(tǒng)發(fā)展,我們將繼續(xù)努力進(jìn)一步優(yōu)化框架和后端編譯器,以實(shí)現(xiàn)更佳性能,包括MLIR基礎(chǔ)設(shè)施改進(jìn),鞏固AMD對(duì)OpenAI Triton和OpenXLA編譯器的支持。 我們還將繼續(xù)在Hugging Face的AMD hub中添加針對(duì)AMD解決方案優(yōu)化的其他開(kāi)源AI模型。?
對(duì)于HPC用戶,我們最近在AMD Infinity Hub上發(fā)布了許多發(fā)布方法,使客戶能夠構(gòu)建HPC應(yīng)用程序容器,未來(lái)的ROCm版本將增加AMD Instinct解決方案支持的HPC應(yīng)用程序數(shù)量。
我們還看到開(kāi)發(fā)人員對(duì)在Radeon?消費(fèi)級(jí)和?Radeon? Pro工作站級(jí)GPU上運(yùn)行用于AI和ML的ROCm開(kāi)放軟件平臺(tái)表現(xiàn)出了極大的興趣,并聽(tīng)到了社區(qū)對(duì)不受支持的GPU上的特定驅(qū)動(dòng)程序問(wèn)題提出的挑戰(zhàn)。我可以很高興地說(shuō),我們已經(jīng)修復(fù)了ROCm 5.6中報(bào)告的問(wèn)題,并且我們致力于今后擴(kuò)大我們的支持。
我們計(jì)劃將ROCm支持從當(dāng)前支持的AMD RDNA 2工作站GPU:Radeon Pro v620和w6800?擴(kuò)展到特定的AMD RDNA 3工作站和消費(fèi)級(jí)GPU。Linux上對(duì)基于RDNA 3的GPU的正式支持計(jì)劃于今年秋季開(kāi)始推出,首先是48GB Radeon PRO W7900和24GB Radeon RX 7900 XTX,隨著時(shí)間的推移,還會(huì)發(fā)布更多卡和擴(kuò)展功能。
更多關(guān)于ROCm 5.6的信息,請(qǐng)?jiān)L問(wèn):https://www.amd.com/zh-hans/graphics/servers-solutions-rocm

原文:https://community.amd.com/t5/rocm/new-rocm-5-6-release-brings-enhancements-and-optimizations-for/ba-p/614745/jump-to/first-unread-message