黑馬博學(xué)谷狂野大數(shù)據(jù)架構(gòu)師7期
多搜集資料你就會(huì)發(fā)現(xiàn),每個(gè)人對(duì)大數(shù)據(jù)大數(shù)據(jù)的講解都有些許不同,也許一千個(gè)讀者眼里的哈姆雷特是一樣的,但每個(gè)讀者或多或少表達(dá)的傾向不一樣。同理,大數(shù)據(jù)的概念我說(shuō)是說(shuō)不清的了,這輩子都說(shuō)不清的了,但請(qǐng)記住大數(shù)據(jù)的幾點(diǎn)特點(diǎn):數(shù)據(jù)量大、數(shù)據(jù)類型繁多、處理速度快、價(jià)值密度低。
應(yīng)用
大數(shù)據(jù)無(wú)處不在,包括金融、汽車、零售、餐飲、電信、能源、政務(wù)、醫(yī)療、體育、娛樂等在內(nèi)的社會(huì)各行各業(yè)都已經(jīng)融入了大數(shù)據(jù)的印跡。具體案例在此不詳細(xì)介紹啦,有興趣可以看知乎問題:基于大數(shù)據(jù)的成功應(yīng)用有哪些?
大數(shù)據(jù)技術(shù)的不同層面及其功能
數(shù)據(jù)采集:利用ETL工具將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等,抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ);或者也可以把實(shí)時(shí)采集的數(shù)據(jù)作為流計(jì)算系統(tǒng)的輸入,進(jìn)行實(shí)時(shí)處理分析。
?
標(biāo)簽: