大數(shù)據(jù)技術(shù)及架構(gòu)圖解實戰(zhàn)派
鏈接:https://pan.baidu.com/s/1YMD8JRZ0LiG3Qb5paWwnHQ?pwd=hs0y?
提取碼:hs0y

(1)體系完整,內(nèi)容豐富。
(2)從零起步,循序漸進。
(3)大量插圖,易于理解。
(4)豐富的實戰(zhàn)案例。
(5)銜接運維,無須擔(dān)心大數(shù)據(jù)集群環(huán)境問題。
(6)豐富的大數(shù)據(jù)架構(gòu)案例。
內(nèi)容簡介
本書提供了學(xué)習(xí)大數(shù)據(jù)技術(shù)及架構(gòu)的一站式解決方案,覆蓋了大數(shù)據(jù)生態(tài)圈中的完整技術(shù)體系,包含以下內(nèi)容。
.
一、數(shù)據(jù)采集
日志數(shù)據(jù)采集工具(Flume 、Logstash、Filebeat )
數(shù)據(jù)庫數(shù)據(jù)采集工具(離線采集工具——Sqoop、DataX,實時數(shù)據(jù)采集工具——Canal、Maxwell
網(wǎng)頁數(shù)據(jù)采集工具
物聯(lián)網(wǎng)數(shù)據(jù)采集工具
消息隊列中間件
.
二、數(shù)據(jù)存儲
分布式文件存儲之HDFS
NoSQL數(shù)據(jù)庫之HBase
NoSQL數(shù)據(jù)庫之Redis
.
三、離線數(shù)據(jù)計算
離線計算引擎MapReduce
離線計算引擎Spark
.
四、實時數(shù)據(jù)計算
實時計算引擎Storm
實時計算引擎Spark Streaming
新一代實時計算引擎Flink
.
五、OLAP數(shù)據(jù)分析
離線OLAP引擎(Hive、Impala、Kylin)
實時OLAP引擎(Druid、ClickHouse、Doris)
.
六、全文檢索引擎
Lucene
Solr
Elasticsearch
.
七、分布式任務(wù)調(diào)度系統(tǒng)
Azkaban
Ooize
DolphinScheduler
.
八、分布式資源管理
YARN的原理、架構(gòu)
YARN中的資源調(diào)度器
【實戰(zhàn)】配置和使用YARN多資源隊列
.
九 、大數(shù)據(jù)平臺搭建工具
大數(shù)據(jù)平臺工具HDP
大數(shù)據(jù)平臺工具CDH
大數(shù)據(jù)平臺工具CDP
.
本書還介紹了多個企業(yè)級大數(shù)據(jù)應(yīng)用案例(包括海量數(shù)據(jù)采集、“雙十一”數(shù)據(jù)大屏、海量數(shù)據(jù)全文搜索系統(tǒng)等)和大數(shù)據(jù)平臺架構(gòu)案例(包括離線數(shù)據(jù)倉庫架構(gòu)、實時數(shù)據(jù)倉庫架構(gòu)、批流一體化數(shù)據(jù)倉庫架構(gòu)、數(shù)據(jù)中臺架構(gòu)、直播大數(shù)據(jù)平臺架構(gòu)、電商大數(shù)據(jù)平臺架構(gòu)等),可以幫助讀者從全局角度理解大數(shù)據(jù)。
.
在本書中,技術(shù)內(nèi)容基本上都是從零講起的,結(jié)合原理和架構(gòu),以“圖解 實戰(zhàn)”的形式幫助讀者輕松理解復(fù)雜的知識。
作者簡介
徐葳
中科院大數(shù)據(jù)研究院大數(shù)據(jù)技術(shù)專家,曾就職于北京獵豹移動科技有限公司
大數(shù)據(jù)技術(shù)及架構(gòu)圖解實戰(zhàn)派的評論 (共 條)
