思騰云計(jì)算
去年世界人工智能大會(huì)(WAIC 2022)上,只有屈指可數(shù)的幾家大廠推出大模型,但在科技部新一代人工智能發(fā)展研究中心5月底發(fā)布的《中國人工智能大模型地圖研究報(bào)告》顯示,我國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),幾乎進(jìn)入“百模大戰(zhàn)”。
而中國有一半左右的大模型創(chuàng)新,都是由昇騰AI來支持的,開發(fā)者數(shù)量從90萬到180多萬,原生孵化和適配30多個(gè)大模型,已發(fā)展1200多家ISV(獨(dú)立軟件開發(fā)商),聯(lián)合推出2500多個(gè)行業(yè)AI解決方案。昇騰AI正是國內(nèi)唯一一個(gè)完成千億參數(shù)大模型訓(xùn)練并商用的系統(tǒng)。
此外,華為推出“昇騰伙伴網(wǎng)絡(luò)”(簡稱APN)合作伙伴計(jì)劃,將通過總經(jīng)銷商供貨的銷售支持、華為與總銷售商雙方的技術(shù)支持模式,思騰合力憑借多年在AI行業(yè)的積累和自身的實(shí)力成為首家簽署APN合作協(xié)議的公司,共同打造基于昇騰的軟硬件AI基礎(chǔ)架構(gòu)解決方案,推進(jìn)人工智能國產(chǎn)算力替代的進(jìn)步和發(fā)展。昇騰產(chǎn)品應(yīng)用覆蓋比較全面,產(chǎn)品型號(hào)也比較豐富,接下來我們就逐一介紹一下:
Atlas 300T pro

T代表training,訓(xùn)練卡,pro是升級(jí)版,其性能特點(diǎn)是:
1. 高度集成:AI算力、通用算力、I/O能力三合一,處理器集成30個(gè)華為達(dá)芬奇AI Core +16個(gè)TaiShan核 + 1 * 100GE RoCE v2網(wǎng)卡。
2. 超強(qiáng)算力:提供業(yè)界領(lǐng)先的280 TFLOPS FP16算力。
3. 高速帶寬:支持PCIe 4.0和 1*100G RoCE高速接口,出口總帶寬56.5 Gb/s;無需外置網(wǎng)卡,訓(xùn)練數(shù)據(jù)和梯度同步效率提升10%~70%。
4. 32GB HBM內(nèi)存支持ECC,專為訓(xùn)練設(shè)計(jì),訓(xùn)練一個(gè)好的模型,需要使用大量數(shù)據(jù),內(nèi)存帶寬要夠大,內(nèi)存容量要足夠大,相比傳統(tǒng)的DDR4內(nèi)存,HBM內(nèi)存的帶寬可以提高10倍以上,功耗也更低。
?Atlas 300V pro

V代表Video,視頻解析卡,pro是升級(jí)版,其性能特點(diǎn)是:
1. 內(nèi)置DVPP預(yù)處理單元,它是昇騰AI處理器內(nèi)置的圖像處理單元,提供強(qiáng)大的媒體處理硬加速能力,主要功能包括縮放、摳圖、色域轉(zhuǎn)換、圖片編解碼、視頻編解碼等。具有超大視頻解析路數(shù)、高性能特征檢索、安全啟動(dòng)等優(yōu)勢(shì),支持128路高清視頻實(shí)時(shí)分析。
2. 48G LPDDR4X 內(nèi)存容量,LPDDR4X的特點(diǎn)是低功耗、高帶寬、高頻率,專為視頻解析這種高帶寬、多路數(shù)、視頻解析流暢度高的應(yīng)用場景而設(shè)計(jì)。
3. 強(qiáng)大的視頻編解碼能力可廣泛應(yīng)用于智慧城市、智慧交通、智慧園區(qū)、智慧金融、智慧制造等諸多AI行業(yè)場景。
?Atlas 300I Pro

I代表 Inference, 推理卡,Pro升級(jí)款,基于昇騰310 芯片開發(fā)最高功耗72W,被動(dòng)散熱,半高半長單寬,達(dá)芬奇架構(gòu)。性能特點(diǎn):
1.擁有超強(qiáng)算力:單卡最大提供140 TOPS INT8算力,為數(shù)據(jù)中心推理提供更強(qiáng)大支持。
2. 超高能效:提供 2 TOPS/W 超高能效比,達(dá)到業(yè)界2.1倍。
3. 算力與顯存平衡,搭載24G LPDDR4X內(nèi)存,且支持ECC,保證推理的及時(shí)性。
4. 強(qiáng)大的AI 推理性能,可用于:內(nèi)容審核、搜索推薦、票據(jù)識(shí)別、信息錄入、資料對(duì)比、身份證實(shí)名認(rèn)證、電子簽名識(shí)別、語音識(shí)別等應(yīng)用場景。