OSDI '20 - AntMan_ Dynamic Scaling on GP


?
00:49
?
?
01:27
?
?
02:55
?
?
03:14
?
?
04:47
?
?
05:04
?
?
05:30
?
?
07:59
?
?
09:40
?
?
09:55
?
?
11:04
?
?
12:32
?
?
14:45
?
?
15:44
?
?
17:16
?粗讀:
主要內(nèi)容:深度學習基礎(chǔ)設(shè)施,它與深度學習框架共同設(shè)計集群調(diào)度器,在深度學習框架中引入記憶和計算的動態(tài)縮放機制
貢獻:AntMan 在不損害公平性的情況下,將 GPU 內(nèi)存的整體利用率提高了 42%,計算利用率提高了 34%,為大規(guī)模高效利用 GPU 提供了新的方法。
結(jié)論:
不足:
精讀:
1.創(chuàng)新點在哪里
2.為什么這樣創(chuàng)新?好在哪里
3.具體模型結(jié)構(gòu)如何設(shè)置?參數(shù)怎么調(diào)節(jié)?
標簽: