散文網(wǎng) » 科技 »學(xué)習(xí) » 【大數(shù)據(jù)基礎(chǔ)Ep6】《Hadoop權(quán)威指南》讀書筆記P10：網(wǎng)格計(jì)算

【大數(shù)據(jù)基礎(chǔ)Ep6】《Hadoop權(quán)威指南》讀書筆記P10：網(wǎng)格計(jì)算

（合計(jì)171字，用時(shí)10min——）

第1章初識(shí)Hadoop

1.5?相較于其他系統(tǒng)的優(yōu)勢(shì)

1.5.2 網(wǎng)格計(jì)算

概念：

高性能計(jì)算（High Performance Computing，HPC）和網(wǎng)格計(jì)算（Grid Computing）：一直研究大規(guī)模數(shù)據(jù)處理，主要使用類似于消息傳遞接口（Message Passing Interface，MPI）的API——

從廣義上講，高性能計(jì)算采用的方法是將作業(yè)分散到集群各臺(tái)機(jī)器上，這些機(jī)器訪問存儲(chǔ)區(qū)域網(wǎng)絡(luò)（SAN）所組成的共享文件系統(tǒng)。
數(shù)據(jù)本地化（data locality）：Hadoop數(shù)據(jù)處理的核心，并因此而獲得良好的性能——通過顯式網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)來保留網(wǎng)絡(luò)帶寬——這種排列方式并沒有降低Hadoop對(duì)計(jì)算密集型數(shù)據(jù)進(jìn)行分析的能力。
無共享（shared-nothing）框架：各個(gè)任務(wù)之間是彼此獨(dú)立的，賦予程序員的控制權(quán)加大了，但編程的難度也增大了。