思騰合力深度學(xué)習(xí)實(shí)驗(yàn)室解決方案
未來絕大多數(shù)企業(yè)將部署人工智能產(chǎn)業(yè)鏈,國(guó)家和企業(yè)都需要大量的人才補(bǔ)充,而我們的高校和職校目前還沒有建立完整的教育課程和實(shí)踐環(huán)境,并且 GPU 資源相對(duì)集中,個(gè)人無法承受,校級(jí) GPU 平臺(tái)資源浪費(fèi)、管理困難。
本方案思騰合力提供從底層基礎(chǔ)設(shè)施,GPU 算力資源到上層統(tǒng)一管理調(diào)度平臺(tái)的整體解決方案,管理調(diào)度平臺(tái)采用思騰合力 SCM 人工智能云平臺(tái)軟件,為 B/S 架構(gòu),配置一定數(shù)量的終端,學(xué)生可以在教室通過 Web 訪問后端的集群計(jì)算資源,并在 Web 界面上開展深度學(xué)習(xí)相關(guān)的模型訓(xùn)練、調(diào)優(yōu)等任務(wù)。

針對(duì) GPU 資源緊缺的團(tuán)隊(duì),方案可提供強(qiáng)大的平臺(tái)管理系統(tǒng),對(duì) GPU 資源進(jìn)行統(tǒng)一管理,提高 GPU 資源利用率,讓每位學(xué)生或老師可用到 GPU 資源;平臺(tái)集成 Tensorflow、Caffe 等眾多的計(jì)算框架,CUDNN 等 SDK;同時(shí)具備多級(jí)用戶功能:多層組織架構(gòu),多種用戶模式,資源配額最大化利用。
案例:中科院自動(dòng)化所智能決策算力平臺(tái)建設(shè)
本次需要強(qiáng)大算力支持強(qiáng)化學(xué)習(xí)以滿足兵棋智能推演,基本算法是所謂的策略網(wǎng)絡(luò),用來訓(xùn)練模仿人類行為,看過數(shù)百萬計(jì)的對(duì)局后,目標(biāo)學(xué)會(huì)提取特征、原則和經(jīng)驗(yàn)法則。

人機(jī)對(duì)抗首頁 (ia.ac.cn)
|?解決方案
4節(jié)點(diǎn)DGX?A100
200G?IB組網(wǎng)
千兆以太網(wǎng)管理
AI?SDK
NGC
|?客戶收益
DGX A100 發(fā)揮出了最新 A100 GPU 的全部潛力,采用了最新的NVLINK3.0,而且單臺(tái)設(shè)備中有 6 個(gè) NVSWITCH,使得 8 塊卡實(shí)現(xiàn)全互聯(lián),卡與卡之間帶寬高達(dá) 600GB/s,相比其他基于 GPU 的系統(tǒng),DGX A100 對(duì)于主流的 AI 框架做了優(yōu)化,并且依托于最新的 Tensorcore,單臺(tái)可實(shí)現(xiàn) 5P 的 AI 算力。
案例:武漢紡織大學(xué)人工智能實(shí)驗(yàn)室建設(shè)
隨著學(xué)校對(duì)教學(xué)、科研的不斷深入,廣大師生對(duì)網(wǎng)絡(luò)、計(jì)算資源等的需求也在逐步提升。已有的基礎(chǔ)資源環(huán)境已經(jīng)逐步顯現(xiàn)瓶頸效應(yīng),學(xué)校發(fā)展更新的信息化系統(tǒng)建設(shè)發(fā)展的要求,需要不斷增加計(jì)算資源,擴(kuò)展存儲(chǔ)容量,以及統(tǒng)一資源協(xié)調(diào)、管理,運(yùn)行維護(hù)的平臺(tái)。

SCM人工智能云平臺(tái)(點(diǎn)擊圖片了解更多)
|?解決方案
3節(jié)點(diǎn)思騰合力IW4203-4G計(jì)算服務(wù)器(V100)
1節(jié)點(diǎn)管理服務(wù)器
1節(jié)點(diǎn)思騰24盤位高性能存儲(chǔ)
計(jì)算網(wǎng)絡(luò):100G IB組網(wǎng)
云平臺(tái)軟件:SCM人工智能云平臺(tái)
|?客戶收益
集群資源由傳統(tǒng)物理形態(tài)轉(zhuǎn)變?yōu)樘摂M資源后,調(diào)配更加靈活。管理員為每個(gè)應(yīng)用系統(tǒng)、每個(gè)平臺(tái)用戶靈活分配資源配額,并且可以隨時(shí)根據(jù)實(shí)際使用情況進(jìn)行調(diào)整。云平臺(tái)提供的彈性功能保證應(yīng)用系統(tǒng)能夠根據(jù)實(shí)際的負(fù)載情況自動(dòng)調(diào)整資源占用量,提高資源利用率,簡(jiǎn)化 IT 運(yùn)維。
案例:青海大學(xué)深度學(xué)習(xí)計(jì)算平臺(tái)建設(shè)
本項(xiàng)目需要 GPU 算力來針對(duì)深度神經(jīng)網(wǎng)絡(luò)模型的教學(xué)研究,需要大量的并行的重復(fù)計(jì)算,來提高計(jì)算速度,及通過擴(kuò)大問題求解規(guī)模,解決大型而復(fù)雜的計(jì)算問題。
|?解決方案
2節(jié)點(diǎn)思騰合力IW4211-8Gs計(jì)算服務(wù)器(V100跟P100 SXM)
1節(jié)點(diǎn)管理服務(wù)器
1節(jié)點(diǎn)思騰24盤位高性能存儲(chǔ)
計(jì)算網(wǎng)絡(luò):100G IB組網(wǎng)
云平臺(tái)軟件:SCM人工智能云平臺(tái)
|?客戶收益
用戶通過使用 SCM 人工智能云平臺(tái)集成的 Tensorflow 框架進(jìn)行深度神經(jīng)網(wǎng)絡(luò)模型的研究,實(shí)現(xiàn)資源的劃分,用戶層級(jí)劃分,有總管理員,組管理員和普通用戶,每個(gè)用戶可以使用特定的資源進(jìn)行模型訓(xùn)練,調(diào)試優(yōu)化,簡(jiǎn)化流程,提高教學(xué)和科研效率。
思騰合力專注人工智能領(lǐng)域,擁有自主品牌 AI 服務(wù)器及通用 X86 服務(wù)器,為?NVIDIA 精英級(jí)別的合作伙伴,公司扎根高性能計(jì)算領(lǐng)域多年,已經(jīng)打造出了一套完全自主的軟硬件結(jié)合的產(chǎn)品生態(tài)。能提供深度學(xué)習(xí),GPU 高性能計(jì)算、虛擬化、分布式儲(chǔ)存、集群管理等產(chǎn)品和整體解決方案,致力于成為行業(yè)領(lǐng)先的人工智能基礎(chǔ)架構(gòu)解決方案商。
目前,思騰擁有完善的研發(fā)、生產(chǎn)、制造基地,已形成以天津?yàn)樯a(chǎn)基地、以北京為營(yíng)銷及研發(fā)中心、以南京、深圳、成都、武漢、西安、包頭覆蓋全國(guó)主要區(qū)域的營(yíng)銷和售后服務(wù)機(jī)構(gòu),為更高效地服務(wù)客戶提供了有力保障。