黑馬博學(xué)谷狂野大數(shù)據(jù)
大數(shù)據(jù)處理流程
一般的大數(shù)(已報(bào)名底部評(píng))據(jù)處理流程都有以下幾個(gè)過程:數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)展現(xiàn)。如下圖所示。

在大數(shù)據(jù)時(shí)代,由于數(shù)據(jù)種類多,數(shù)據(jù)大,從結(jié)構(gòu)化的數(shù)據(jù)到非結(jié)構(gòu)化的數(shù)據(jù),數(shù)據(jù)采集的形式也變得更加復(fù)雜而多樣。
當(dāng)存儲(chǔ)技術(shù)的發(fā)展變得步履蹣跚,趕不上數(shù)據(jù)發(fā)展的速度時(shí),分布式存儲(chǔ)成為了必然選擇,非結(jié)構(gòu)型數(shù)據(jù)也對(duì)存儲(chǔ)格式提出了新的要求。層出不窮的數(shù)據(jù)源也使得數(shù)據(jù)量產(chǎn)生了井噴似的迅猛增長。此時(shí)分布式存儲(chǔ)與NoSQL的誕生回應(yīng)了這樣的需求,解決了大數(shù)據(jù)存儲(chǔ)的根本難題。
數(shù)據(jù)處理包括數(shù)據(jù)計(jì)算、分析,這部分是大數(shù)據(jù)技術(shù)的核心,本文剩余部分將詳細(xì)介紹這部分。數(shù)據(jù)展示指的是通過提供報(bào)表等可視化界面反應(yīng)目前平臺(tái)或業(yè)務(wù)運(yùn)行的各項(xiàng)指標(biāo)。
標(biāo)簽: