尚硅谷Flink(Scala版)教程丨清華碩士-武晟然老師主講

- Flink是什么:起源于2010年德國柏林大學的一個項目,2014年成為apache基金會的項目,2015年成為apache基金會的頂級項目。
- 官網:Apache Flink是一個處理unbound 安定boundedd 數(shù)據(jù)流的state computations 的框架和分布式處理引擎。
stateful computations:狀態(tài)計算,有狀態(tài)計算是最近今年越來越被用戶需求的一個功能,比如一個網站一天內訪問UV數(shù)(unique visitor,獨立訪客),那么這個UV數(shù)便為狀態(tài)。flink提供了內置的對狀態(tài)的一致性的處理,即如果任務發(fā)生了failover(故障),其狀態(tài)不會丟失,不會被多算或者少算,同時提供了非常高的性能
無界和有界數(shù)據(jù)流:有頭無尾的流處理數(shù)據(jù);bounded data :有頭有尾的批處理數(shù)據(jù)
3.flink的logo是一個小松鼠,代表了快速靈巧,與Apache的小羽毛一致
framework:大數(shù)據(jù)處理的架構
distributed processing:大數(shù)據(jù)分布式處理
data stream: no end
4.應用場景非常廣泛
總結: flink是什么?說到底,它就是一個框架和分布式引擎,幫助快速進行大數(shù)據(jù)流的處理。
標簽: