最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

GPU并行算法 N-S方程高性能計算

2023-07-31 08:06 作者:取個名字吧一個就好  | 我要投稿

鏈接:https://pan.baidu.com/s/1oqbmLlOC26FHQOGmvyTW5g?pwd=lxm0?

提取碼:lxm0

《GPU并行算法——N-S方程高性能計算》共九章,重點通過基礎知識講解、算例剖析和技巧提示,引導讀者熟悉GPU并行算法、CUDA Fortran基礎知識,進而掌握基于CUDA Fortran的GPU高性能計算應用軟件設計方法。其中,第1章介紹相關研究背景;第2~6章介紹基于CUDA Fortran的GPU通用計算基本概念、編程方法與化原則;第7~9章介紹基于MPI+CUDA的N-S方程數(shù)值求解?!禛PU并行算法——N-S方程高性能計算》的示例的構(gòu)思以及分析過程是《GPU并行算法——N-S方程高性能計算》*具值的分,讀者通過閱讀這些內(nèi)容,對GPGPU技術做到融會貫通、舉一反三,只要掌握了這些簡單的示例,更復雜的問題也能迎刃而解。在《GPU并行算法——N-S方程高性能計算》的幫助下,讀者不需熟悉GPU硬件或者CUDAC(雖然熟悉這兩者有助于使用《GPU并行算法——N-S方程高性能計算》)就可完成GPU的學和使用。



第1章 緒論 1
1.1 一個故事:為什么需要并行 1
1.2 并行計算簡介 3
1.2.1 機群系統(tǒng) 3
1.2.2 并行計算與多核技術 4
1.2.3 異構(gòu)計算機 6
1.3 GPU計算與CUDA 9
1.4 CUDA Fortran 14
1.5 GPU并行計算技術與高聲速流動模擬 15
參考文獻 19
第2章 CUDA Fortran編譯器 24
2.1 PGI Fortran編譯器簡介 24
2.2 編譯CUDA Fortran程序 35
2.2.1 可視化版PGI編譯器的使用 35
2.2.2 使用命令行編譯程序 43
2.3 Fortran程序驅(qū)動GPU 44
2.3.1 GPU算法的CUDA Fortran程序?qū)崿F(xiàn) 44
2.3.2 在主機與CUDA卡之間傳輸數(shù)據(jù) 47
2.3.3 GPU端的計算 48
2.4 錯誤信息獲取 51
參考文獻 52
第3章 CUDA線程模型 54
3.1 CUDA并行計算思維 54
3.1.1 并行算法設計 54
3.1.2 SIMD模型 56
3.1.3 SIMT模型 57
3.2 CUDA線程的主要性 58
3.2.1 子程序?qū)傩韵薅ǚ鸻ttributes 58
3.2.2 kernel函數(shù) 59
3.3 CUDA線程結(jié)構(gòu) 60
3.3.1 線程block和線程grid 60
3.3.2 block內(nèi)線程與block間線程 63
3.3.3 CUDA線程與GPU硬件對應關系 63
3.3.4 CUDA線程設計 64
3.4 執(zhí)行配置 66
3.5 device子程序 74
3.6 自動生成kernel簡介 75
3.6.1 !$cuf 基本用法 75
3.6.2 !$cuf 使用注意事項 76
3.7 使用module封裝GPU數(shù)據(jù)與程序 77
3.7.1 用module封裝數(shù)據(jù) 77
3.7.2 用module封裝設備端子程序 78
3.8 CUDA線程同步 79
3.9 小結(jié) 80
參考文獻 81
第4章 CUDA存儲模型 82
4.1 GPU設備端變量 82
4.1.1 GPU內(nèi)存 82
4.1.2 變量限定符 83
4.1.3 變量類型與內(nèi)存分配 84
4.2 device變量 84
4.3 managed變量 88
4.4 pinned變量 90
4.5 shared變量 93
4.6 local變量 96
4.7 constant變量 96
4.8 texture變量 97
4.9 設備端派生數(shù)據(jù)類型 98
參考文獻 100
第5章 CUDA任務級并行 101
5.1 CUDA流管理 101
5.1.1 什么是流 101
5.1.2 流的創(chuàng)建與銷毀 102
5.1.3 流的使用 104
5.1.4 流的用法舉例 107
5.2 CUDA事件管理 109
5.2.1 什么是事件 109
5.2.2 事件基本用法 110
5.2.3 事件在任務計時中的應用 111
5.2.4 事件在任務管理中的應用 116
5.3 GPU設備管理 118
5.3.1 設備切換 118
5.3.2 設備參數(shù)查詢與修改 119
5.3.3 設備端變量存儲位置 123
5.3.4 GPU卡間數(shù)據(jù)通信 124
參考文獻 126
第6章 CUDA Fortran程序化 127
6.1 Fortran程序性能化一般準則 127
6.2 矩陣乘法CUDA程序化 130
6.2.1 化一:使用local變量 132
6.2.2 化二:使用shared變量 132
6.2.3 kernel的調(diào)用 135
6.3 線程block化設計 136
6.3.1 GPU微架構(gòu)與CUDA線程模型 136
6.3.2 線程block設計 140
6.3.3 local內(nèi)存使用技巧 142
參考文獻 143
第7章 高聲速流場數(shù)學模型 144
7.1 高聲速繞流流場問題描述 144
7.2 控制方程 145
7.3 組分熱力學性 148
7.3.1 統(tǒng)計熱力學方法 148
7.3.2 擬合函數(shù)法 149
7.4 組分輸運性 150
7.4.1 黏性系數(shù) 150
7.4.2 熱傳導系數(shù) 151
7.4.3 擴散系數(shù) 151
7.4.4 混合氣體輸運性 152
7.5 化學動力學模型 152
7.5.1 純空氣化學反應 152
7.5.2 化學反應源項 153
7.5.3 化學反應速率系數(shù) 154
7.6 N-S方程空間離散 155
7.6.1 定解條件 156
7.6.2 有限體積方法 158
7.6.3 差分格式 158
7.6.4 通量分裂 159
7.6.5 高迎風型格式 161
7.6.6 高維問題 163
7.7 時間迭代 165
7.7.1 顯式方法 165
7.7.2 隱式方法 167
7.8 邊界條件 170
7.8.1 虛擬網(wǎng)格法 171
7.8.2 物理邊界條件處理方法 171
7.8.3 壁面催化 174
參考文獻 174
第8章 N-S方程并行算法 177
8.1 并行計算術語 177
8.2 MPI并行環(huán)境 179
8.2.1 MPI進程級并行計算 179
8.2.2 MPI程序編譯與運行 180
8.2.3 并行進程的創(chuàng)建與回收 181
8.2.4 MPI通信 182
8.2.5 非阻塞通信 186
8.2.6 組通信 188
8.2.7 MPI高級話題 189
8.3 流場區(qū)域分解的N-S方程并行算法 192
8.3.1 高聲速流場的N-S方程數(shù)值求解 192
8.3.2 流場并行算法 194
8.3.3 流場并行算法化 195
8.4 結(jié)構(gòu)網(wǎng)格N-S方程并行計算負載均衡 198
8.4.1 并行計算負載估算 198
8.4.2 LPT負載分配 199
8.4.3 區(qū)域分解對CFD效率的影響 200
8.4.4 結(jié)構(gòu)網(wǎng)格塊二次剖分算法 202
8.5 N-S方程數(shù)值求解大規(guī)模高性能并行計算驗證 206
8.5.1 高聲速流場計算軟件HAS簡介 206
8.5.2 雙橢球模型風洞實驗流場計算 206
8.5.3 Apollo指令艙高聲速繞流計算 209
8.5.4 高聲速圓柱繞流大規(guī)模并行計算 211
參考文獻 212
第9章 N-S方程求解的GPU異構(gòu)并行算法 214
9.1 數(shù)據(jù)依賴關系 214
9.1.1 數(shù)據(jù)依賴性分析 214
9.1.2 無數(shù)據(jù)依賴隱式算法 215
9.2 CFD功能模塊kernel設計 220
9.2.1 無黏項空間離散 221
9.2.2 流場參數(shù)空間梯度計算 228
9.2.3 黏性項空間離散 231
9.2.4 DPLUR隱式計算模塊 231
9.2.5 其他模塊 233
9.3 邊界條件處理技術 234
9.3.1 適于CUDA線程的邊界網(wǎng)格單元分配方法 235
9.3.2 對接邊界數(shù)據(jù)交換 236
9.4 CFD功能模塊kernel調(diào)用 237
9.4.1 線程block與grid設計 237
9.4.2 CUDA任務級并行 239
9.4.3 多GPU設備問題 241
9.4.4 提升GPU并行計算效率的輔助措施 242
9.5 數(shù)據(jù)結(jié)構(gòu) 246
9.5.1 GPU設備數(shù)據(jù)存儲策略 246
9.5.2 常量數(shù)據(jù)定義 246
9.5.3 邊界條件數(shù)據(jù)結(jié)構(gòu) 248
9.5.4 網(wǎng)格塊數(shù)據(jù)結(jié)構(gòu) 249
9.6 CUDA算法的可靠性 251
9.6.1 確GPU異構(gòu)并行CFD算法可靠性的基本方法 251
9.6.2 算例驗證 252
參考文獻 260
附錄A 純空氣化學非平衡模型相關常數(shù) 262
附錄B N-S方程及其無黏通量征分裂 271
B.1 N-S方程無量綱化 271
B.2 雅可比矩陣及其征值 272
B.3 以征值表達的雅可比矩陣 274
B.4 以征值表達的無黏通量 276
B.5 無黏通量Van Leer分裂表達式 276
附錄C 化學源項及黏性通量雅可比矩陣 278
C.1 化學源項雅可比矩陣 278
C.2 黏性通量雅可比矩陣及其分裂 279
附錄D 結(jié)構(gòu)網(wǎng)格半自動生成工具AutoMesh 283


GPU并行算法 N-S方程高性能計算的評論 (共 條)

分享到微博請遵守國家法律
北宁市| 洛浦县| 望江县| 石屏县| 综艺| 临汾市| 南部县| 台江县| 凭祥市| 香河县| 鲜城| 化德县| 彝良县| 镇安县| 萍乡市| 呼玛县| 南华县| 井研县| 滁州市| 甘谷县| 漯河市| 宁乡县| 正镶白旗| 磐安县| 迁安市| 东辽县| 临桂县| 锡林浩特市| 长丰县| 钟山县| 乌鲁木齐市| 铜山县| 西贡区| 芷江| 香格里拉县| 鹤庆县| 贵州省| 镇原县| 南召县| 钟祥市| 揭阳市|