最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

一文講清后摩爾時(shí)代國(guó)產(chǎn)高性能并行應(yīng)用軟件生態(tài)建設(shè)

2023-06-13 12:02 作者:猿代碼科技  | 我要投稿

摘自《后摩爾時(shí)代國(guó)產(chǎn)高性能并行應(yīng)用軟件生態(tài)建設(shè)綜述》

作者:

龔春葉1,劉杰1,包為民2,潘冬梅1,甘新標(biāo)1,李勝?lài)?guó)1

陳旭光1,肖調(diào)杰1,楊博1,王睿伯1

(1.國(guó)防科技大學(xué) 并行與分布處理國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410073: 2.中國(guó)航天科技集團(tuán)有限公司 科技委,北京 100048)

摩爾時(shí)代已經(jīng)終結(jié),后摩爾時(shí)代的大門(mén)徐徐開(kāi)啟。摩爾定律作為經(jīng)驗(yàn)性預(yù)判,預(yù)測(cè)了集成電

路芯片密度/性能約每 18 個(gè)月提高一倍,在 20 世紀(jì)80-90年代成為業(yè)界認(rèn)可的規(guī)律,體現(xiàn)了摩爾對(duì)信息產(chǎn)業(yè)發(fā)展的深刻洞見(jiàn)。Kim等對(duì)晶體管漏電效應(yīng)進(jìn)行了深入探討,認(rèn)為能耗已經(jīng)成為芯片設(shè)計(jì)的主要限制。Nature認(rèn)為摩爾定律在走向終結(jié)。摩爾定律終結(jié)來(lái)自物理規(guī)律的限制。2021年最先進(jìn)的流片工藝約為5 nm,硅原子的直徑大概0.23 nm。假設(shè)工藝能夠提升到1nm,那么只能放下 4 個(gè)硅原子,即使不考慮成本,物理規(guī)律上也不可能進(jìn)行如此精確的電路控制。

高性能計(jì)算系統(tǒng)是大國(guó)競(jìng)爭(zhēng)的一個(gè)戰(zhàn)略制高點(diǎn),國(guó)產(chǎn)高性能計(jì)算系統(tǒng)發(fā)展迅速,我國(guó)自主系統(tǒng)

已經(jīng)取得了以天河、神威為代表的重大技術(shù)突破。2011年國(guó)防科技大學(xué)研制的天河一號(hào)2.566 Pflops實(shí)測(cè)雙精度浮點(diǎn)計(jì)算性能首次排名TOP 500第一,開(kāi)創(chuàng)CPU/GPU 異構(gòu)計(jì)算潮流。隨后,天河二號(hào)、太湖之光等國(guó)產(chǎn)HPC系統(tǒng)也連續(xù)多次排名世界第一。2018年美國(guó)排名TOP 500第一的summit超算系統(tǒng)采用的也是與天河一號(hào)相同的CPU/GPU異構(gòu)架構(gòu),體現(xiàn)了中國(guó)首創(chuàng)體系架構(gòu)得到認(rèn)可。

高性能計(jì)算主要應(yīng)用于大科學(xué)、大工程以及產(chǎn)業(yè)升級(jí)和信息化建設(shè)等領(lǐng)域,是“理論、實(shí)驗(yàn)、計(jì)算”三大科研手段之一,是建設(shè)創(chuàng)新型國(guó)家、提高科技創(chuàng)新能力的重大基礎(chǔ)設(shè)施,是解決大工程挑戰(zhàn)性問(wèn)題的重大支撐平臺(tái),直接帶動(dòng)微電子、光通信、軟件研發(fā)等相關(guān)產(chǎn)業(yè)的發(fā)展,是引領(lǐng)高端信息產(chǎn)業(yè)發(fā)展的輻射源,將為推進(jìn)科技強(qiáng)國(guó)戰(zhàn)略,建設(shè)創(chuàng)新型國(guó)家作出重大貢獻(xiàn)。

應(yīng)用需求是信息科技發(fā)展的第一推動(dòng)力。近幾十年信息技術(shù)的發(fā)展都是由應(yīng)用需求直接推動(dòng),

尤其是傳統(tǒng)圖像和視頻交換處理需求。圖像和視頻交換處理需求一方面推動(dòng)了網(wǎng)絡(luò)性能的提高,如千兆到萬(wàn)兆網(wǎng)絡(luò),2G、3G到4G、5G技術(shù)的發(fā)展,核心路由器交換機(jī)能力的提升;另一方面推動(dòng)了圖形圖像處理芯片GPU的誕生和發(fā)展,助推了基于GPU的HPC、虛擬貨幣挖礦和人工智能三波技術(shù)浪潮。由于人眼的物理限制,傳統(tǒng)圖像和視頻交換處理需求對(duì)信息技術(shù)的需求和摩爾定律一樣趨于終結(jié),高性能并行應(yīng)用需求將在未來(lái)扮演更加重要的角色。高性能并行應(yīng)用軟件是連接超算系統(tǒng)和客觀物理世界的橋梁,是最終與人直接交互的對(duì)象。國(guó)產(chǎn)高性能并行應(yīng)用軟件滯后的現(xiàn)實(shí)成為制約我國(guó)HPC和信息技術(shù)發(fā)展,乃至整個(gè)人類(lèi)文明發(fā)展的關(guān)鍵因素,亟需大力發(fā)展和建設(shè)好國(guó)產(chǎn)高性能并行應(yīng)用軟件生態(tài)。

1 國(guó)產(chǎn)高性能計(jì)算系統(tǒng)發(fā)展現(xiàn)狀

1.1 系統(tǒng)研制世界領(lǐng)先

我國(guó)HPC系統(tǒng)經(jīng)過(guò)40余年的發(fā)展,逐步走在世界前列,顯著成果包括天河一號(hào)、天河二號(hào)、

天河E級(jí)原型機(jī)及神威太湖之光等系統(tǒng)。天河一號(hào)采用如圖所示的CPU/GPU異構(gòu)體系架構(gòu),

包含 CPU/GPU 計(jì)算節(jié)點(diǎn) 7 168 個(gè),F(xiàn)T1000計(jì)算節(jié)點(diǎn)2048個(gè),自主高速網(wǎng)絡(luò),內(nèi)存容量

為262 TB,存儲(chǔ)容量為2 PB,主要應(yīng)用于材料計(jì)算、石油勘探、天氣預(yù)報(bào)和生物醫(yī)藥等領(lǐng)域。每個(gè)CPU/GPU 計(jì) 算 節(jié) 點(diǎn) 包 含 2 個(gè) Intel Xeon X5670CPU,1個(gè)NVIDIA M2050 GPU。天河一號(hào)系統(tǒng)峰值性能 4.700 Pflops,實(shí)測(cè)性能達(dá)到 2.566 Pflops,位居2010年11月TOP500排行榜第一位,是我國(guó)首臺(tái)排名世界第一的HPC系統(tǒng),開(kāi)創(chuàng)了我國(guó)超算的新歷史。天河一號(hào)主要挑戰(zhàn)來(lái)自 2 個(gè)方面:一個(gè)方面是技術(shù)上的挑戰(zhàn),開(kāi)創(chuàng)性提出CPU/GPU異構(gòu)融合架構(gòu),技術(shù)風(fēng)險(xiǎn)極大;另一方面來(lái)自應(yīng)用需求方面的挑戰(zhàn),至今,含有 7 168 塊 GPU 的超算系統(tǒng)仍是獨(dú)樹(shù)一幟的存在。

天河二號(hào)連續(xù)6次排名TOP500排行榜第一,5次位居HPCG排行榜榜首。天河二號(hào)包含125個(gè)

計(jì)算機(jī)柜,合計(jì)16 000個(gè)計(jì)算節(jié)點(diǎn),實(shí)測(cè)性能達(dá)到 33.86 Pflops。每個(gè)計(jì)算節(jié)點(diǎn)有 2 個(gè) Intel XeonE5-2600 CPU 和一個(gè) Intel Xeon Phi(MIC)加速器。在應(yīng)用軟件方面,Graph500 BFS算法取得非常好的可擴(kuò)展性,gyrokinetic toroidal code(GTC)核聚變、并行分子對(duì)接和全球氣象模擬取得了較好的加速和并行效果。天河E級(jí)原型機(jī)采用全國(guó)產(chǎn)的Matrix-2000+芯片,512節(jié)點(diǎn)達(dá)到3.15 Pflops的峰值性能,內(nèi)存容量98.3 TB,存儲(chǔ)容量1.4 PB。應(yīng)用軟件方面,流體計(jì)算、多尺度湍流燃燒、電磁仿真等近20個(gè)應(yīng)用擴(kuò)展到全系統(tǒng)。在一個(gè)多月內(nèi)移植了100余款應(yīng)用,包 括 VASP、 Octopus、 Gromacs、 Lammps、NAMD、ROMS、Wannier90、QE、WRF、Geant 4、OpenFoam等,同時(shí)支撐了20世紀(jì)十大算法中8個(gè)算法、九大領(lǐng)域、75%的國(guó)家重大專(zhuān)項(xiàng)、數(shù)十個(gè)重點(diǎn)研發(fā)計(jì)劃項(xiàng)目,在應(yīng)用生態(tài)建議方面提供了極好的示范。

神威太湖之光采用sw26010芯片,內(nèi)存容量1.31 PB,存儲(chǔ)容量20 PB,峰值性能達(dá)到125 Pflops,實(shí)測(cè)性能達(dá)到 93 Pflops。應(yīng)用軟件方面,社區(qū)大氣模型、非靜力氣象模擬、全球表面波模擬和硅納米線原子模擬等應(yīng)用擴(kuò)展到大規(guī)模。

1.2 芯片體系架構(gòu)百花齊放

國(guó)產(chǎn)芯片從兼容ARM到完全自主內(nèi)核,體現(xiàn)了國(guó)產(chǎn)芯片架構(gòu)蓬勃發(fā)展的良好局面?;?ARM 的飛騰處理器和鯤鵬處理器在應(yīng)用生態(tài)方面占有優(yōu)勢(shì)。FT2000+采用64 ARMV8小米核,雙精度峰值性能達(dá)到 588.8 Gflops,功耗為 96 W,頻率 2.3 GHz。每個(gè)核有 32 kB 私有L1緩存,4核共享2 MB L2緩存。鯤鵬920最高支持 64 核,兼容 ARMV8-A 架構(gòu)的 Taishan 核 ,每個(gè)核有64 kB L1指令緩存和64 kB L1數(shù)據(jù)緩存512 kB L2 緩存,8 個(gè) DDR 控制器。因?yàn)榧嫒軦RM 生態(tài),所以在工具鏈、算法庫(kù)及應(yīng)用方面占有優(yōu)勢(shì)。

國(guó)防科技大學(xué)研制的天河新一代超算系統(tǒng)采用自主設(shè)計(jì)的CPU+GPDSP異構(gòu)融合架構(gòu),由多核

CPU和4個(gè)GPDSP簇組成,在高性能、高效能和高可編程性方面取得突破,如圖2所示。

多核CPU采用兼容ARM指令集的FT-C662 CPU內(nèi)核。每個(gè)GPDSP簇包含24個(gè)自定義指令集FT-M64DSP核。FT-M64DSP 核 采 用 超 長(zhǎng) 指 令 字 (very longinstruction word,VLIW)技術(shù)和標(biāo)向量融合結(jié)構(gòu),其中向量部件由16個(gè)同構(gòu)的VPE陣列組成,每個(gè)VPE 內(nèi)部包含 3 個(gè)乘加單元。芯片峰值性能在10 Tflops以上,能效達(dá)到50 Gflops/W。在訪存帶寬方面,GPDSP 核內(nèi)私有存儲(chǔ)峰值帶寬達(dá)到98 TB/s,全局共享存儲(chǔ)峰值帶寬達(dá)到 1.2 TB/s,


HBM存儲(chǔ)峰值帶寬達(dá)到1.2 TB/s。GPDSP的私有存儲(chǔ)和GPU上的共享存儲(chǔ)均屬于可編程緩存,是發(fā)揮應(yīng)用程序性能的關(guān)鍵,也可以預(yù)測(cè)是未來(lái)芯片體系架構(gòu)的重要研究方向。DGEMM實(shí)測(cè)效率約為94%,在深度卷積神經(jīng)網(wǎng)絡(luò)推理計(jì)算方面性能能夠達(dá)到15 108 fps,接近NVIDIA V100的2倍。sw26010 異構(gòu)眾核處理器

通過(guò)片上網(wǎng)絡(luò)互連4個(gè)核組,每個(gè)核組包含一個(gè)主核MPE、64個(gè)從核 CPE,頻度 1.45 GHz,雙精度峰值性能達(dá)到3 Tflops。主核的 L1 指令和數(shù)據(jù)緩存均為 32 KB,L2 緩存大小為 256 KB。從核陣列按照 8×8 的結(jié)構(gòu)排列,可以直接理解成 64 核,每個(gè)從核擁有16 KB 的 L1 指令緩存 和一個(gè) 64 KB 的可編程局部存儲(chǔ)空間(scratch-pad memory,SPM)。核組的概念和 GPDSP 簇的概念類(lèi)似,主要針對(duì)數(shù)據(jù)一致性。

1.3 國(guó)家超算中心形成良性可持續(xù)發(fā)展動(dòng)力

國(guó)家超算中心,尤其是天津中心、廣州中心和長(zhǎng)沙中心,在商業(yè)化運(yùn)營(yíng)方面走出了中國(guó)特色道路。國(guó)家超算天津中心的天河一號(hào)于2011 年上線運(yùn)行,3 年內(nèi)實(shí)現(xiàn)自負(fù)盈虧,略有盈余。在此基礎(chǔ)上,團(tuán)隊(duì)得到數(shù)倍的擴(kuò)充,技術(shù)實(shí)力得到極大增強(qiáng)。天河一號(hào)目前仍在運(yùn)營(yíng),根據(jù)TOP500歷年統(tǒng)計(jì)數(shù)據(jù),它是運(yùn)營(yíng)時(shí)間最久的曾在TOP500排名第一的系統(tǒng),這體現(xiàn)了系統(tǒng)研制方的技術(shù)實(shí)力及運(yùn)營(yíng)方的維護(hù)保障能力。國(guó)家超算廣州中心基于天河二號(hào),支撐了數(shù)千家用戶,是目前世界用戶量、資源使用量排名前列的超算中心,具有全球范圍運(yùn)營(yíng)示范效應(yīng)。國(guó)家超算長(zhǎng)沙中心走出了與地方產(chǎn)業(yè)深度融合的產(chǎn)業(yè)化道路,助推中南地區(qū)智能裝備制造、有色金屬研制、局部極端天氣預(yù)報(bào)等優(yōu)勢(shì)行業(yè)快速向前發(fā)展。


2 國(guó)產(chǎn)高性能并行應(yīng)用軟件生態(tài)

現(xiàn)狀

2.1 關(guān)鍵技術(shù)點(diǎn)世界領(lǐng)先

國(guó)內(nèi)在可擴(kuò)展并行算法及并行應(yīng)用方面取得世界領(lǐng)先成果。在面向異構(gòu)體系結(jié)構(gòu)相適應(yīng)的并行算法及優(yōu)化方法方面,取得了較多的創(chuàng)新成果,把我國(guó)高性能并行應(yīng)用軟件在極大規(guī)??蓴U(kuò)展并行計(jì)算方面推向了一個(gè)新的高度。在天河一號(hào)粒子輸運(yùn)方面開(kāi)展了基于GPU的三維結(jié)構(gòu)化網(wǎng)格、二維非結(jié)構(gòu)化網(wǎng)格及非確定性蒙特卡羅異構(gòu)并行算法研究,獲得到3倍左右的加速效果。三維結(jié)構(gòu)化網(wǎng)格粒子輸運(yùn)和高精 度 計(jì) 算 流 體 動(dòng) 力 學(xué) (computational fluiddynamics,CFD)模擬擴(kuò)展到 1 024 節(jié)點(diǎn)仍然可以獲得非常好的并行效率。在天河二號(hào)上,德國(guó)慕尼黑工業(yè)大學(xué)等合作團(tuán)隊(duì)開(kāi)展的真實(shí)地震波傳播模擬獲得了國(guó)際應(yīng)用領(lǐng)域的最高獎(jiǎng)項(xiàng)——戈登·貝爾獎(jiǎng)提名。該研究在IntelXeon Phi上移植并優(yōu)化了基于高階間斷有限元的地震波模擬程序,該應(yīng)用程序能夠較好地模擬1992年美國(guó)加州蘭德斯地震的地震波傳播,并在8 192節(jié)點(diǎn)上實(shí)現(xiàn)了8.6 Pflops的持續(xù)性能。

在天河新一代高性能計(jì)算機(jī)系統(tǒng)上,中山大學(xué)、國(guó)防科技大學(xué)等合作團(tuán)隊(duì)開(kāi)展的“基于自由能

微擾-絕對(duì)結(jié)合自由能方法的大規(guī)模新冠藥物虛擬篩選”工作獲得2021年度戈登貝爾新冠特別獎(jiǎng)

提名。該研究在天河新一代高性能計(jì)算機(jī)系統(tǒng)上實(shí)現(xiàn)了FEP-ABFE程序的大規(guī)模并行計(jì)算,并用于新冠應(yīng)急藥物的篩選,如圖3所示。該應(yīng)用針對(duì)2個(gè)新冠相關(guān)的重要靶點(diǎn),在75 000節(jié)點(diǎn)上一周內(nèi)完成了12 000個(gè)藥物-靶標(biāo)體系的精準(zhǔn)評(píng)價(jià)計(jì)算,藥物篩選整體效能較前期工作提升了200倍。

面向國(guó)產(chǎn)飛騰處理器和天河超級(jí)計(jì)算機(jī)系統(tǒng)設(shè)計(jì)優(yōu)化的天圖系統(tǒng)連續(xù) 2 次蟬聯(lián) Graph500

SSSP 世界第一,GreenGraph BIG Data 世界第一,GreenGraph Small Data 世界第二,Graph500 國(guó)內(nèi)第一,實(shí)現(xiàn)了國(guó)產(chǎn)超算圖計(jì)算優(yōu)化的跨越式發(fā)展,如圖4所示。在太湖之光等系統(tǒng)上,千萬(wàn)核可擴(kuò)展全球大氣動(dòng)力學(xué)全隱式模擬、高可擴(kuò)展性的非線性大地震模擬和超大規(guī)模量子隨機(jī)電路實(shí)時(shí)模擬先后獲得戈登·貝爾獎(jiǎng)。

2.2 應(yīng)用支撐環(huán)境發(fā)展迅速

應(yīng)用支撐環(huán)境主要包括前處理、后處理和共性算法庫(kù)。前處理軟件主要包括CAD建模及網(wǎng)格生成軟件。Open Cascade 是一套開(kāi)源 CAD/CAM/CAE 幾何模型核心代碼,可以應(yīng)用于構(gòu)建復(fù)雜的幾何模型及其布爾運(yùn)算。國(guó)家數(shù)值風(fēng)洞網(wǎng)格生成軟件網(wǎng)格之星 NNW-Gridstar,基于網(wǎng)格拓?fù)淇蚣軜?gòu)造技術(shù)實(shí)現(xiàn)了復(fù)雜外形結(jié)構(gòu)網(wǎng)格附面層的自動(dòng)生成,具備良好的人機(jī)交互功能和模塊設(shè)計(jì),定位于CFD網(wǎng)格生成領(lǐng)域,目前支持結(jié)構(gòu)網(wǎng)格和非結(jié)構(gòu)化網(wǎng)格生成。中國(guó)工程物理研究院高性能數(shù)值模擬軟件中心開(kāi)發(fā)的SuperMesh是一款面向大規(guī)模復(fù)雜數(shù)值模擬的前處理軟件,具備強(qiáng)大的并行網(wǎng)格生成功能,支持基于復(fù)雜幾何構(gòu)型的結(jié)構(gòu)網(wǎng)格、非結(jié)構(gòu)網(wǎng)格和組合幾何體的高度自動(dòng)化生成。

SuperMesh 已成功應(yīng)用于復(fù)雜電磁環(huán)境、粒子輸運(yùn)、結(jié)構(gòu)強(qiáng)度、CFD計(jì)算等領(lǐng)域。面向全國(guó)產(chǎn)超算系統(tǒng)研發(fā)的銀河網(wǎng)格生成(YHGRID)網(wǎng)格生成軟件

在一定程度上具備國(guó)外商業(yè)軟件國(guó)產(chǎn)化替代能力,如圖5所示。YHGRID支持飛騰芯片和麒麟操作系統(tǒng),提供流暢的界面可視化操作、比較完善的幾何模型處理及網(wǎng)格格式轉(zhuǎn)換、高質(zhì)量結(jié)構(gòu)和非結(jié)構(gòu)網(wǎng)格生成及優(yōu)化功能,支持三角形、四邊形、四面體和六面體等單元類(lèi)型,支持全局和局部的網(wǎng)格尺寸設(shè)置,提供網(wǎng)格局部編輯功能、網(wǎng)格優(yōu)化功能和多尺度質(zhì)量評(píng)價(jià)功能。后處理軟件主要指可視化和數(shù)據(jù)分析軟件。

目前,ParaView是一款常用、功能強(qiáng)大的開(kāi)源、跨平臺(tái)數(shù)據(jù)分析和可視化軟件,具備豐富的可視化功能,支持常見(jiàn)的文件格式,同時(shí)穩(wěn)定性和實(shí)用性也在實(shí)踐中得到證明。共性算法庫(kù)是連接底層硬件體系架構(gòu)和上層應(yīng)用軟件的橋梁。我們承擔(dān)的國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目《E級(jí)計(jì)算可擴(kuò)展高效能并行算法及算法庫(kù)》

針對(duì)百億億次可擴(kuò)展并行計(jì)算問(wèn)題,研究了超大規(guī)模網(wǎng)格高效生成方法、可擴(kuò)展并行求解器和共性基礎(chǔ)算法,研制了能夠高效使用百萬(wàn)核量級(jí)的高效能并行算法庫(kù),如圖 6 所示。在重大行業(yè)和基礎(chǔ)研究領(lǐng)域開(kāi)展了 E 級(jí)計(jì)算典型應(yīng)用示范,突破了科學(xué)計(jì)算應(yīng)用軟件可擴(kuò)展性差和計(jì)算效率低的瓶頸,促進(jìn)了高性能計(jì)算機(jī)和大規(guī)??茖W(xué)計(jì)算的協(xié)調(diào)發(fā)展,實(shí)現(xiàn)了我國(guó)高性能科學(xué)計(jì)算的跨越式發(fā)展。共性算法庫(kù)的研制對(duì)人力資源消耗巨大,完善非一日之功。以 NVIDIA GPU 加速庫(kù)

為例,分成 6 個(gè)類(lèi)別,包括數(shù)學(xué)庫(kù)、并行算法庫(kù)、圖像和視頻庫(kù)、通信庫(kù)、深度學(xué)習(xí)庫(kù)和第三方庫(kù)。數(shù)學(xué)庫(kù)包括基本數(shù)學(xué)函數(shù)庫(kù)、BLAS、FFT、稀疏BLAS、稠密稀疏線性系統(tǒng)直接求解和代數(shù)多重網(wǎng)格等。并行算法庫(kù)主要指C++版的并行算法和數(shù)據(jù)結(jié)構(gòu)的 Thrust,用于排序、前輟求和和歸約等操作。圖像和視頻庫(kù)主要包括JPEG、編碼和解碼SDK和光流DSK等,有數(shù)千個(gè)優(yōu)化函數(shù)。通信庫(kù)主 要 包 括 滿 足 OpenSHMEM 存 儲(chǔ) 模 型 標(biāo) 準(zhǔn) 的NVSHMEM,多節(jié)點(diǎn)和多 GPU 通信的 NCCL。深度學(xué)習(xí)庫(kù)主要包括大家常用的 DNN 加速庫(kù) 、DeepStream SDK 和圖像處理的 DALI 等。第三方庫(kù)主要指常用特定領(lǐng)域算法庫(kù)的GPU加速,包括圖像處理OpenCV、多媒體處理FFmpeg、矩陣及信息處理ArrayFire和線性代數(shù)庫(kù)MAGMA等。國(guó)產(chǎn)架構(gòu)上的共性算法庫(kù)可以參照GPU的加速庫(kù)進(jìn)行總體設(shè)計(jì)和對(duì)標(biāo)。

稠密線性系統(tǒng)求解庫(kù) SCALAPACK、稀疏線性系統(tǒng)求解庫(kù) PETSc 和快速傅里葉變換 FFTW 在

HPC 領(lǐng)域應(yīng)用廣泛。OpenBLAS 是目前應(yīng)用廣泛的開(kāi)源 BLAS 庫(kù),也是為數(shù)不多的具有世界級(jí)影響力的中國(guó)開(kāi)源項(xiàng)目。

2.3 工業(yè)軟件是先進(jìn)制造業(yè)的“靈魂”,已成為中國(guó)制造“軟肋”工業(yè)軟件,尤其是研發(fā)設(shè)計(jì)類(lèi)工業(yè)軟件是我國(guó)工業(yè)化信息化、智能裝備制造、電子裝備設(shè)計(jì)和科學(xué)基礎(chǔ)研究的基礎(chǔ),是智能制造產(chǎn)業(yè)鏈的核心環(huán)節(jié),是先進(jìn)制造業(yè)的“靈魂”。當(dāng)前我國(guó)工業(yè)軟件已經(jīng)成為制造業(yè)向高端制造轉(zhuǎn)型升級(jí)中的關(guān)鍵短板,其發(fā)展持續(xù)受到國(guó)家關(guān)注。實(shí)現(xiàn)工業(yè)軟件的自主可控,是提升科研自主創(chuàng)新能力的關(guān)鍵環(huán)節(jié)。

國(guó)外工業(yè)軟件在商業(yè)化和開(kāi)源 2 個(gè)方面對(duì)國(guó)內(nèi)形成碾壓態(tài)勢(shì)。商業(yè)軟件主要包括美國(guó)Ansys、

德國(guó)西門(mén)子和法國(guó)達(dá)索公司的各種商業(yè)化軟件。Ansys 軟件系統(tǒng)包括 Fluent 計(jì)算流體力學(xué)軟件、Mechanical高級(jí)結(jié)構(gòu)力學(xué)分析、HFSS 高頻電磁場(chǎng)仿真、Maxwell 低頻電磁場(chǎng)仿真/Simplorer 系統(tǒng)設(shè)計(jì)仿真技術(shù)、Discovery Live 即時(shí)仿真、CFX專(zhuān)業(yè)的流體力學(xué)分析、TURBO SYSTEM 旋轉(zhuǎn)機(jī)械分析系統(tǒng)、Additive Suit 增材制造工藝仿真套件、Multiphysics多物理場(chǎng)仿真、Professional專(zhuān)業(yè)結(jié)構(gòu)分析及熱分析、Structural通用結(jié)構(gòu)力學(xué)分析、LSDYNA

高 度 非 線 性 顯 式 動(dòng) 力 學(xué) 分 析 、 RigidDynamics 剛體動(dòng)力學(xué)分析、ICEPAK 專(zhuān)業(yè)電子熱

設(shè)計(jì)和 Workbench 仿真工具應(yīng)用集成環(huán)境等數(shù)十個(gè)軟件。在開(kāi)源軟件方面,VASP、Gromacs、WRF、 LAMPPS、 OpenFoam、 NAMD、 Amber、Salome等在業(yè)內(nèi)外得到廣泛認(rèn)同。國(guó)內(nèi)在若干方向上有國(guó)產(chǎn)化替代軟件,但是從功能全面性的角度看差距非常大。

國(guó)內(nèi)在工業(yè)軟件方面做出了有益的探索。國(guó)家數(shù)值風(fēng)洞(NNW)工程是由中國(guó)空氣動(dòng)力研究與

發(fā)展中心聯(lián)合國(guó)內(nèi)優(yōu)勢(shì)單位共同論證和規(guī)劃,服務(wù)國(guó)內(nèi)裝備研發(fā)自主創(chuàng)新需求,支撐制造工業(yè)數(shù)字化轉(zhuǎn)型,解決戰(zhàn)略產(chǎn)業(yè)的大型國(guó)產(chǎn)自主空氣動(dòng)力數(shù)值模擬軟件建設(shè)項(xiàng)目,軟件包括 NNWGridStar、NNW-FlowStar、NNW-Topviz和開(kāi)源的NNW-PHengLEI??臻g物理重點(diǎn)實(shí)驗(yàn)室研發(fā)的MuSCLE 實(shí)現(xiàn)了高精度多尺度湍流燃燒模擬,如圖7所示?!缎聲r(shí)期促進(jìn)集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策》


要求“聚焦集成電路設(shè)計(jì)工具、基礎(chǔ)軟件、工業(yè)軟件、應(yīng)用軟件的關(guān)鍵核心技術(shù)研發(fā),不斷探索構(gòu)建社會(huì)主義市場(chǎng)經(jīng)濟(jì)條件下關(guān)鍵核心技術(shù)攻關(guān)新型舉國(guó)體制??萍疾俊?guó)家發(fā)展改革委、工業(yè)和信息化部等部門(mén)做好有關(guān)工作的組織實(shí)施,積極利用國(guó)家重點(diǎn)研發(fā)計(jì)劃、

國(guó)家科技重大專(zhuān)項(xiàng)等給予支持”。這為工業(yè)軟件等發(fā)展指明了方向。

2.4 人才隊(duì)伍及制度建設(shè)挑戰(zhàn)巨大

高性能并行應(yīng)用軟件人才隊(duì)伍建設(shè)方面的挑戰(zhàn)來(lái)自人員素質(zhì)和待遇 2 個(gè)方面。人員素質(zhì)主要

指研發(fā)人員通常需要跨學(xué)科背景,團(tuán)隊(duì)成員需要對(duì)物理模型、數(shù)學(xué)方法、程序?qū)崿F(xiàn)和并行優(yōu)化等多方面都有深入了解。而從事傳統(tǒng)高性能并行應(yīng)用軟件開(kāi)發(fā)的待遇無(wú)法跟從事互聯(lián)網(wǎng)開(kāi)發(fā)、游戲開(kāi)發(fā)、人工智能和新興領(lǐng)域的研發(fā)待遇相提并論,導(dǎo)致從業(yè)人員流失嚴(yán)重。同時(shí)在高??蒲蟹较蛞部梢钥闯?,選擇熱門(mén)人工智能等方向的多,愿意從事傳統(tǒng)HPC方向的研究生很少。


一文講清后摩爾時(shí)代國(guó)產(chǎn)高性能并行應(yīng)用軟件生態(tài)建設(shè)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
普定县| 汉阴县| 洛扎县| 始兴县| 临汾市| 黄龙县| 托克逊县| 庆城县| 行唐县| 广州市| 广德县| 阿克苏市| 靖安县| 甘洛县| 兖州市| 益阳市| 个旧市| 绍兴县| 兴安盟| 仪陇县| 洪泽县| 翁牛特旗| 吴桥县| 越西县| 兰西县| 绥棱县| 来凤县| 祁阳县| 垣曲县| 页游| 临武县| 五莲县| 通州区| 天津市| 锦州市| 海原县| 福鼎市| 昌乐县| 丘北县| 澄迈县| 潜山县|