華為盤古大模型3.0,重塑千行百業(yè)

(一)分層解耦:盤古大模型 3.0 是一個(gè)面向行業(yè)的大模型系列,包括“5+N+X”三層架構(gòu)。盤古大模型采用完全的分層解耦設(shè)計(jì),可以快速適配、快速滿足行業(yè)的多變需求。
(二)全棧自主:盤古大模型實(shí)現(xiàn)了以鯤鵬和昇騰為基礎(chǔ)的 AI算力云平臺(tái),以及異構(gòu)計(jì)算架構(gòu) CANN、全場(chǎng)景 AI 框架昇思 MindSpore、AI 開發(fā)生產(chǎn)線 ModelArts 的全棧自主創(chuàng)新,盤古大模型訓(xùn)練效率達(dá)到業(yè)界主流 GPU的 1.1 倍。
(三)國際領(lǐng)先:根據(jù)華為云官網(wǎng),國際頂級(jí)學(xué)術(shù)期刊《自然》(Nature)雜志正刊發(fā)表了華為云盤古大模型研發(fā)團(tuán)隊(duì)研究成果——《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報(bào)》。

H800、A800、RTX6000 Ada 等1`10卡GPU服務(wù)器,
量化計(jì)算單臺(tái)雙路192核心服務(wù)器,大模型訓(xùn)練平臺(tái)

(一)分層解耦
未來盤古大模型能成為每個(gè)行業(yè)、企業(yè)和個(gè)人都有自己的專家助手,讓工作更輕松。盤古大模型 3.0 是一個(gè)面向行業(yè)的大模型系列,包括“5+N+X”三層架構(gòu):

?L0 層包括自然語言、視覺、多模態(tài)、預(yù)測(cè)、科學(xué)計(jì)算五個(gè)基礎(chǔ)大模型,提供滿足行業(yè)場(chǎng)景中的多種技能需求。盤古 3.0 為客戶提供 100 億參數(shù)、380 億參數(shù)、710 參數(shù)和 1000 億參數(shù)的系列化基礎(chǔ)大模型,匹配客戶不同場(chǎng)景、不同時(shí)延、不同響應(yīng)速度的行業(yè)多樣化需求。同時(shí)提供全新能力集,包括 NLP 大模型的知識(shí)問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業(yè)直接調(diào)用。無論多大參數(shù)規(guī)模的大模型,盤古提供一致的能力集。
?L1 層是 N 個(gè)行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù)、金融、制造、礦山、氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的 L0 和 L1 層上,為客戶訓(xùn)練自己的專有大模型。
?L2 層為客戶提供了更多細(xì)化場(chǎng)景的模型,更加專注于政務(wù)熱線、網(wǎng)點(diǎn)助手、先導(dǎo)藥物篩選、傳送帶異物檢測(cè)、臺(tái)風(fēng)路徑預(yù)測(cè)等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場(chǎng)景,為客戶提供“開箱即用”的模型服務(wù)。
盤古大模型采用完全的分層解耦設(shè)計(jì),可以快速適配、快速滿足行業(yè)的多變需求。客戶既可以為自己的大模型加載獨(dú)立的數(shù)據(jù)集,也可以單獨(dú)升級(jí)基礎(chǔ)模型,也可以單獨(dú)升級(jí)能力集。在 L0 和 L1 大模型的基礎(chǔ)上,華為云還為客戶提供了大模型行業(yè)開發(fā)套件,通過對(duì)客戶自有數(shù)據(jù)的二次訓(xùn)練,客戶就可以擁有自己的專屬行業(yè)大模型。
(二)全棧自主
大模型的創(chuàng)新不僅僅是模型自身的創(chuàng)新,而是需要全棧的創(chuàng)新,對(duì)算力,算子,計(jì)算框架及平臺(tái)進(jìn)行全面優(yōu)化。根據(jù)中國經(jīng)濟(jì)網(wǎng)報(bào)道,通過持續(xù)研發(fā),目前盤古大模型在性能、深度、架構(gòu)及數(shù)據(jù)增強(qiáng)方面均進(jìn)行了升級(jí)。盤古大模型實(shí)現(xiàn)了以鯤鵬和昇騰為基礎(chǔ)的 AI 算力云平臺(tái),以及異構(gòu)計(jì)算架構(gòu) CANN、全場(chǎng)景 AI 框架昇思MindSpore、AI 開發(fā)生產(chǎn)線 ModelArts 的全棧自主創(chuàng)新,實(shí)現(xiàn)極致效能,打造世界 AI另一極。

此外,端到端的技術(shù)優(yōu)化為大模型開發(fā)和運(yùn)行提供分布式并行加速,算子和編譯優(yōu)化、集群級(jí)通信優(yōu)化等關(guān)鍵能力,使盤古大模型訓(xùn)練效率達(dá)到業(yè)界主流 GPU 的 1.1倍。
同時(shí),昇騰 AI 云服務(wù)除了支持華為全場(chǎng)景 AI 框架昇思 MindSpore 外,還支持Pytorch、Tensorflow 等主流 AI 框架。這些框架中 90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺(tái)。
盤古大模型要幫助每個(gè)企業(yè)、每個(gè)人都擁有自己的專家助手。華為云提供易用可靠的大模型工具套件、匯聚海量多行業(yè)場(chǎng)景 API 的開天 aPaaS,以及包含豐富優(yōu)質(zhì)課程和技術(shù)認(rèn)證的大模型專屬社區(qū),將與開發(fā)者及伙伴一起,共同探索盤古大模型與行業(yè)結(jié)合的創(chuàng)新路徑。
(三)國際領(lǐng)先
根據(jù)華為云官網(wǎng),近日國際頂級(jí)學(xué)術(shù)期刊《自然》(Nature)雜志正刊發(fā)表了華為云盤古大模型研發(fā)團(tuán)隊(duì)研究成果——《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報(bào)》。根據(jù)華為云官網(wǎng),這是近年來中國科技公司首篇作為唯一署名單位發(fā)表的《自然》正刊論文?!蹲匀弧穼徃迦藢?duì)該成果給予高度評(píng)價(jià):“華為云盤古氣象大模型讓人們重新審視氣象預(yù)報(bào)模型的未來,模型的開放將推動(dòng)該領(lǐng)域的發(fā)展。”
華為云盤古氣象大模型是首個(gè)精度超過傳統(tǒng)數(shù)值預(yù)報(bào)方法的 AI 模型,速度相比傳統(tǒng)數(shù)值預(yù)報(bào)提速 10000 倍以上。目前,盤古氣象大模型能夠提供全球氣象秒級(jí)預(yù)報(bào),其氣象預(yù)測(cè)結(jié)果包括位勢(shì)、濕度、風(fēng)速、溫度、海平面氣壓等,可以直接應(yīng)用于多個(gè)氣象研究細(xì)分場(chǎng)景,歐洲中期預(yù)報(bào)中心和中央氣象臺(tái)等都在實(shí)測(cè)中發(fā)現(xiàn)盤古預(yù)測(cè)的優(yōu)越性。
來源:智能計(jì)算芯世界


華為盤古大模型3.0,重塑千行百業(yè)的評(píng)論 (共 條)
