大數(shù)據(jù)技術及架構圖解實戰(zhàn)派
鏈接:pan.baidu.com/s/1LvlUdOFtKcvSEjDQe4tx5g?pwd=vmzj?
提取碼:vmzj

(1)體系完整,內容豐富。
(2)從零起步,循序漸進。
(3)大量插圖,易于理解。
(4)豐富的實戰(zhàn)案例。
(5)銜接運維,無須擔心大數(shù)據(jù)集群環(huán)境問題。
(6)豐富的大數(shù)據(jù)架構案例。
內容簡介
本書提供了學習大數(shù)據(jù)技術及架構的一站式解決方案,覆蓋了大數(shù)據(jù)生態(tài)圈中的完整技術體系,包含以下內容。
.
一、數(shù)據(jù)采集
日志數(shù)據(jù)采集工具(Flume 、Logstash、Filebeat )
數(shù)據(jù)庫數(shù)據(jù)采集工具(離線采集工具——Sqoop、DataX,實時數(shù)據(jù)采集工具——Canal、Maxwell
網(wǎng)頁數(shù)據(jù)采集工具
物聯(lián)網(wǎng)數(shù)據(jù)采集工具
消息隊列中間件
.
二、數(shù)據(jù)存儲
分布式文件存儲之HDFS
NoSQL數(shù)據(jù)庫之HBase
NoSQL數(shù)據(jù)庫之Redis
.
三、離線數(shù)據(jù)計算
離線計算引擎MapReduce
離線計算引擎Spark
.
四、實時數(shù)據(jù)計算
實時計算引擎Storm
實時計算引擎Spark Streaming
新一代實時計算引擎Flink
.
五、OLAP數(shù)據(jù)分析
離線OLAP引擎(Hive、Impala、Kylin)
實時OLAP引擎(Druid、ClickHouse、Doris)
.
六、全文檢索引擎
Lucene
Solr
Elasticsearch
.
七、分布式任務調度系統(tǒng)
Azkaban
Ooize
DolphinScheduler
.
八、分布式資源管理
YARN的原理、架構
YARN中的資源調度器
【實戰(zhàn)】配置和使用YARN多資源隊列
.
九 、大數(shù)據(jù)平臺搭建工具
大數(shù)據(jù)平臺工具HDP
大數(shù)據(jù)平臺工具CDH
大數(shù)據(jù)平臺工具CDP
.
本書還介紹了多個企業(yè)級大數(shù)據(jù)應用案例(包括海量數(shù)據(jù)采集、“雙十一”數(shù)據(jù)大屏、海量數(shù)據(jù)全文搜索系統(tǒng)等)和大數(shù)據(jù)平臺架構案例(包括離線數(shù)據(jù)倉庫架構、實時數(shù)據(jù)倉庫架構、批流一體化數(shù)據(jù)倉庫架構、數(shù)據(jù)中臺架構、直播大數(shù)據(jù)平臺架構、電商大數(shù)據(jù)平臺架構等),可以幫助讀者從全局角度理解大數(shù)據(jù)。
.
在本書中,技術內容基本上都是從零講起的,結合原理和架構,以“圖解 實戰(zhàn)”的形式幫助讀者輕松理解復雜的知識。