最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

基于Apache Flink的流處理

2023-07-07 23:30 作者:取個(gè)名字吧一個(gè)就好  | 我要投稿

鏈接:https://pan.baidu.com/s/12b4YM7F_6DCd228yRZihtw?pwd=6226?

提取碼:6226

帶你走近Apache Flink,一個(gè)為全世界多個(gè)Z大規(guī)模級別的流處理應(yīng)用提供支持的開源框架。通過本書,你將探索并行流處理的基本概念并了解該技術(shù)與傳統(tǒng)批處理的區(qū)別。


內(nèi)容簡介

Apache Flink項(xiàng)目的資深貢獻(xiàn)者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API實(shí)現(xiàn)可伸縮的流式應(yīng)用,以及怎樣在業(yè)務(wù)環(huán)境中持續(xù)運(yùn)行和維護(hù)這些應(yīng)用。流處理的理想應(yīng)用場景有很多,包括低延遲ETL、流式分析、實(shí)時(shí)儀表盤以及欺詐檢測、異常檢測和報(bào)警。你可以在任意類型的持續(xù)數(shù)據(jù)(包括用戶交互、金融交易和物聯(lián)網(wǎng)等數(shù)據(jù))生成后,立即對它們進(jìn)行處理。

了解有關(guān)分布式狀態(tài)化流處理的概念和挑戰(zhàn)。

探索Flink的系統(tǒng)架構(gòu),包括事件時(shí)間處理模式和容錯(cuò)模型。

理解DataStream API的基礎(chǔ)知識和構(gòu)成要素,包括基于時(shí)間和有狀態(tài)的算子。

以精確一次的一致性讀寫外部系統(tǒng)。

部署和配置Flink集群。

對持續(xù)運(yùn)行的流式應(yīng)用進(jìn)行運(yùn)維。


作者簡介

作者介紹


Fabian Hueske是Apache Flink項(xiàng)目的PMC成員,他從Flink項(xiàng)目創(chuàng)始之初就開始參與貢獻(xiàn)。Fabian是data Artisans(現(xiàn)在的Ververica)公司的創(chuàng)始人之一,擁有柏林工業(yè)大學(xué)的計(jì)算機(jī)科學(xué)博士學(xué)位。


Vasiliki Kalavri是蘇黎世聯(lián)邦理工學(xué)院系統(tǒng)組的博士后研究員。她同樣也是Apache Flink項(xiàng)目的PMC成員。作為Flink早期貢獻(xiàn)者,Vasiliki參與了圖計(jì)算庫Gelly以及初期版本的Table API和流式SQL的建設(shè)工作。


譯者介紹


崔星燦,加拿大約克大學(xué)博士后,分布式流處理技術(shù)和開源愛好者,Apache Flink Committer。


精彩書評

"無論你是在流計(jì)算領(lǐng)域摸爬滾打了多年的老手,還是剛剛完成第一個(gè)流處理作業(yè)的初級軟件工程師和數(shù)據(jù)工程師,本書都是一本很棒的讀物。書中不但介紹了Flink,還涉及到很多流處理的核心基礎(chǔ)知識,有助于讀者技術(shù)性思維的提升。強(qiáng)烈推薦?!?/p>


——Ted Malaska

Capital One企業(yè)架構(gòu)總監(jiān)


目錄

目錄

前言 .1

第1 章 狀態(tài)化流處理概述 .7

傳統(tǒng)數(shù)據(jù)處理架構(gòu) .8

事務(wù)型處理 8

分析型處理.9

狀態(tài)化流處理 11

事件驅(qū)動型應(yīng)用 .13

數(shù)據(jù)管道 14

流式分析 15

開源流處理的演變 .16

歷史回顧 17

Flink 快覽 18

運(yùn)行首個(gè)Flink 應(yīng)用 .20

小結(jié) .23

第2 章 流處理基礎(chǔ) . 25

Dataflow 編程概述 25

Dataflow 圖 25

數(shù)據(jù)并行和任務(wù)并行 26

數(shù)據(jù)交換策略 .27

并行流處理 28

延遲和吞吐.28

數(shù)據(jù)流上的操作 .31

時(shí)間語義 .36

流處理場景下一分鐘的含義 37

處理時(shí)間 38

事件時(shí)間 39

水位線 40

處理時(shí)間與事件時(shí)間 41

狀態(tài)和一致性模型 .41

任務(wù)故障 43

結(jié)果保障 44

小結(jié) .46

第3 章 Apache Flink 架構(gòu) . 47

系統(tǒng)架構(gòu) .47

搭建Flink 所需組件 .48

應(yīng)用部署 50

任務(wù)執(zhí)行 51

高可用性設(shè)置 .52

Flink 中的數(shù)據(jù)傳輸 .54

基于信用值的流量控制 56

任務(wù)鏈接 57

事件時(shí)間處理 58

時(shí)間戳 59

水位線 59

水位線傳播和事件時(shí)間 61

時(shí)間戳分配和水位線生成 63

狀態(tài)管理 .64

算子狀態(tài) 65

鍵值分區(qū)狀態(tài) .66

狀態(tài)后端 68

有狀態(tài)算子的擴(kuò)縮容 68

檢查點(diǎn)、保存點(diǎn)及狀態(tài)恢復(fù) 71

一致性檢查點(diǎn) .71

從一致性檢查點(diǎn)中恢復(fù) 72

Flink 檢查點(diǎn)算法 .74

檢查點(diǎn)對性能的影響 79

保存點(diǎn) 79

小結(jié) .82

第4 章 設(shè)置Apache Flink 開發(fā)環(huán)境 83

所需軟件 .83

在IDE 中運(yùn)行和調(diào)試Flink 程序 .84

在IDE 中導(dǎo)入書中示例 .84

在IDE 中運(yùn)行Flink 程序 .87

在IDE 中調(diào)試Flink 程序 88

創(chuàng)建Flink Maven 項(xiàng)目 89

小結(jié) .90

第5 章 DataStream API (1.7 版本) . 91

Hello, Flink! 91

設(shè)置執(zhí)行環(huán)境 .93

讀取輸入流.94

應(yīng)用轉(zhuǎn)換 94

輸出結(jié)果 95

執(zhí)行 96

轉(zhuǎn)換操作 .96

基本轉(zhuǎn)換 97

基于KeyedStream 的轉(zhuǎn)換 100

多流轉(zhuǎn)換 104

分發(fā)轉(zhuǎn)換 108

設(shè)置并行度 111

類型 . 112

支持的數(shù)據(jù)類型 . 113

為數(shù)據(jù)類型創(chuàng)建類型信息 116

顯式提供類型信息 . 117

定義鍵值和引用字段 . 118

字段位置 118

字段表達(dá)式. 119

鍵值選擇器.120

實(shí)現(xiàn)函數(shù) .121

函數(shù)類 121

Lambda 函數(shù) 122

富函數(shù) 123

導(dǎo)入外部和Flink 依賴 124

小結(jié) .125

第6 章 基于時(shí)間和窗口的算子 127

配置時(shí)間特性 127

分配時(shí)間戳和生成水位線 129

水位線、延遲及完整性問題 133

處理函數(shù) .134

時(shí)間服務(wù)和計(jì)時(shí)器 .136

向副輸出發(fā)送數(shù)據(jù) .138

CoProcessFunction .140

窗口算子 .141

定義窗口算子 .142

內(nèi)置窗口分配器 .143

在窗口上應(yīng)用函數(shù) .148

自定義窗口算子 .155

基于時(shí)間的雙流Join .167

基于間隔的Join .167

基于窗口的Join .168

處理遲到數(shù)據(jù) 170

丟棄遲到事件 .170

重定向遲到事件 .171

基于遲到事件更新結(jié)果 172

小結(jié) .174

第7 章 有狀態(tài)算子和應(yīng)用 . 175

實(shí)現(xiàn)有狀態(tài)函數(shù) 176

在RuntimeContext 中聲明鍵值分區(qū)狀態(tài) .176

通過ListCheckpointed 接口實(shí)現(xiàn)算子列表狀態(tài) .180

使用CheckpointedFunction 接口 .187

接收檢查點(diǎn)完成通知 189

為有狀態(tài)的應(yīng)用開啟故障恢復(fù) 190

確保有狀態(tài)應(yīng)用的可維護(hù)性 190

指定算子唯一標(biāo)識 .191

為使用鍵值分區(qū)狀態(tài)的算子定義最大并行度 192

有狀態(tài)應(yīng)用的性能及魯棒性 192

選擇狀態(tài)后端 .193

選擇狀態(tài)原語 .194

防止?fàn)顟B(tài)泄露 .195

更新有狀態(tài)應(yīng)用 198

保持現(xiàn)有狀態(tài)更新應(yīng)用 199

從應(yīng)用中刪除狀態(tài) .200

修改算子的狀態(tài) .200

可查詢式狀態(tài) .202

可查詢式狀態(tài)服務(wù)的架構(gòu)及啟用方式203

對外暴露可查詢式狀態(tài) 204

從外部系統(tǒng)查詢狀態(tài) 205

小結(jié) .207

第8 章 讀寫外部系統(tǒng) 209

應(yīng)用的一致性保障 .210

冪等性寫 211

事務(wù)性寫 211

內(nèi)置連接器 213

Apache Kafka 數(shù)據(jù)源連接器 214

Apache Kafka 數(shù)據(jù)匯連接器 218

文件系統(tǒng)數(shù)據(jù)源連接器 222

文件系統(tǒng)數(shù)據(jù)匯連接器 224

Apache Cassandra 數(shù)據(jù)匯連接器 .228

實(shí)現(xiàn)自定義數(shù)據(jù)源函數(shù) .232

可重置的數(shù)據(jù)源函數(shù) 233

數(shù)據(jù)源函數(shù)、時(shí)間戳及水位線 .235

實(shí)現(xiàn)自定義數(shù)據(jù)匯函數(shù) .236

冪等性數(shù)據(jù)匯連接器 238

事務(wù)性數(shù)據(jù)匯連接器 239

異步訪問外部系統(tǒng) .248

小結(jié) .251

第9 章 搭建Flink 運(yùn)行流式應(yīng)用 253

部署模式 .253

獨(dú)立集群 254

Docker 256

Apache Hadoop YARN .258

Kubernetes 261

高可用性設(shè)置 266

獨(dú)立集群的HA 設(shè)置 267

YARN 上的HA 設(shè)置 268

Kubernetes 的HA 設(shè)置 270

集成Hadoop 組件 270

文件系統(tǒng)配置 272

系統(tǒng)配置 .274

Java 和類加載.275

CPU 275

內(nèi)存和網(wǎng)絡(luò)緩沖 .276

磁盤存儲 278

檢查點(diǎn)和狀態(tài)后端 .279

安全性 280

小結(jié) .281

第10 章 Flink 和流式應(yīng)用運(yùn)維 283

運(yùn)行并管理流式應(yīng)用 .283

保存點(diǎn) 284

通過命令行客戶端管理應(yīng)用 285

通過REST API 管理應(yīng)用 .292

在容器中打包并部署應(yīng)用 298

控制任務(wù)調(diào)度 302

控制任務(wù)鏈接 .302

定義處理槽共享組 .303

調(diào)整檢查點(diǎn)及恢復(fù) .305

配置檢查點(diǎn).306

配置狀態(tài)后端 .309

配置故障恢復(fù) . 311

監(jiān)控Flink 集群和應(yīng)用 313

Flink Web UI 313

指標(biāo)系統(tǒng) 316

延遲監(jiān)控 322

配置日志行為 323

小結(jié) .324

第11 章 還有什么? 325

Flink 生態(tài)的其他組成部分 325

用于批處理的DataSet API .325

用于關(guān)系型分析的Table API 及SQL 326

用于復(fù)雜事件處理和模式匹配的FlinkCEP .326

用于圖計(jì)算的Gelly .327

歡迎加入社區(qū) 327


查看全部↓


基于Apache Flink的流處理的評論 (共 條)

分享到微博請遵守國家法律
财经| 陵川县| 嘉黎县| 咸丰县| 亚东县| 都兰县| 乌恰县| 屯门区| 仪征市| 金门县| 盐亭县| 启东市| 井冈山市| 永登县| 鲁山县| 元江| 札达县| 北宁市| 阿巴嘎旗| 东至县| 嫩江县| 会昌县| 阳原县| 康保县| 汉寿县| 康马县| 上蔡县| 乳源| 张家界市| 黄石市| 湖北省| 巴楚县| 南陵县| 甘肃省| 利津县| 文山县| 美姑县| 仙桃市| 五莲县| 修武县| 五河县|