006-【CMU15-418】【并行計算架構(gòu)和編程】【中英字幕】

1. /proc是現(xiàn)代操作系統(tǒng)中的一個虛擬文件系統(tǒng),以類似文件的格式導(dǎo)出系統(tǒng)狀態(tài)信息。
2. /proc中的每個目錄代表一個特定的進程,其中的文件包含有關(guān)進程的各種信息。
3. /proc中的CPU信息文件提供有關(guān)處理器的詳細信息,例如廠商ID、型號名稱、緩存大小和功耗。
4. /proc中的信息可以由人類或程序訪問和處理,可以使用grep來搜索特定的信息。
5. 了解處理器的詳細信息,例如緩存大小和功能單元,可以幫助優(yōu)化代碼以獲得更好的性能。
6. 在計算機架構(gòu)中,調(diào)度紀(jì)律可以在某些情況下非常有用,但需要有更多的專業(yè)知識。
7. 需要意識到聚合帶寬很少會被完全利用,因為請求模式可能是讀取為主或者是混合讀寫模式。
8. 在優(yōu)化程序性能時,需要關(guān)注內(nèi)部循環(huán),減少乘法和除法的次數(shù)可以提高性能。
9. 在優(yōu)化之前,首先要確保程序的正確性,并進行性能測量,以確定性能瓶頸所在。
10. 需要避免不必要的優(yōu)化,專注于對性能影響最大的部分。
11. 人類直覺是系統(tǒng)性能的不準(zhǔn)確指標(biāo),需要進行測量。
12. 通過重構(gòu)代碼,將不需要在循環(huán)中計算的部分移出內(nèi)部循環(huán),可以提高性能。
13. 循環(huán)的測試條件會增加額外開銷,影響性能。
14. 循環(huán)展開可以減少測試條件的開銷,提高并行性。
15. 浮點數(shù)運算的結(jié)果可能因為舍入誤差而不準(zhǔn)確,需要注意。
16. 通過查看匯編代碼,我們可以了解編譯器實際給我們的內(nèi)容。
17. 將變量聲明為uniform可以提高性能,因為它們不需要在每個實例中重新計算。
18. 通過常規(guī)優(yōu)化,我們可以獲得15倍的速度提升,而向量化可以獲得5.4倍的速度提升。
19. 優(yōu)化會影響代碼質(zhì)量,增加引入錯誤的風(fēng)險。
20. 在內(nèi)部工作循環(huán)中進行優(yōu)化非常重要,因為它們決定了是否能夠及時為客戶提供結(jié)果。
006-【CMU15-418】【并行計算架構(gòu)和編程】【中英字幕】的評論 (共 條)
