小象學(xué)院AI面試經(jīng)驗(yàn)分享
在大數(shù)據(jù)處理當(dāng)中,最核心要解決的其實(shí)就是兩個(gè)問題,大數(shù)據(jù)存儲(chǔ)和大數(shù)據(jù)計(jì)算。在Hadoop生態(tài)當(dāng)中,解決大數(shù)據(jù)存儲(chǔ),主要依靠就是HDFS,再配合數(shù)據(jù)庫(kù)去完成。而MapReduce為海量的數(shù)據(jù)提供了計(jì)算。
1.2.1 HDFS
HDFS是什么
HDFS即Hadoop distributed file system(hadoop分布式文件系統(tǒng)),在Hadoop當(dāng)中負(fù)責(zé)分布式存儲(chǔ)階段的任務(wù),它是一個(gè)分布式的文件系統(tǒng),也可以用來(lái)存放單個(gè)機(jī)器的數(shù)據(jù),只是大部分用來(lái)存儲(chǔ)分布式數(shù)據(jù)。HDFS跟window下的NTFS一樣可以通過目錄樹來(lái)查找數(shù)據(jù)。
標(biāo)簽: