【大數(shù)據(jù)基礎(chǔ)Ep6】《Hadoop權(quán)威指南》讀書筆記P10:網(wǎng)格計(jì)算
2023-04-12 23:21 作者:學(xué)酥酥的學(xué)習(xí)日記本 | 我要投稿

(合計(jì)171字,用時(shí)10min——)
第1章 初識(shí)Hadoop
1.5?相較于其他系統(tǒng)的優(yōu)勢(shì)
1.5.2 網(wǎng)格計(jì)算
概念:
高性能計(jì)算(High Performance Computing,HPC)和網(wǎng)格計(jì)算(Grid Computing):一直研究大規(guī)模數(shù)據(jù)處理,主要使用類似于消息傳遞接口(Message Passing Interface,MPI)的API——
從廣義上講,高性能計(jì)算采用的方法是將作業(yè)分散到集群各臺(tái)機(jī)器上,這些機(jī)器訪問存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)所組成的共享文件系統(tǒng)。- 數(shù)據(jù)本地化(data locality):Hadoop數(shù)據(jù)處理的核心,并因此而獲得良好的性能——通過顯式網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)來保留網(wǎng)絡(luò)帶寬——這種排列方式并沒有降低Hadoop對(duì)計(jì)算密集型數(shù)據(jù)進(jìn)行分析的能力。
- 無共享(shared-nothing)框架:各個(gè)任務(wù)之間是彼此獨(dú)立的,賦予程序員的控制權(quán)加大了,但編程的難度也增大了。