Flink全量聚合函數(shù):apply和process這兩種實現(xiàn)方法有什么區(qū)別?
指在窗口觸發(fā)的時候才會對窗口內(nèi)的所有數(shù)據(jù)進行一次計算(等窗口的數(shù)據(jù)到齊,才開始進行聚合計算,可實現(xiàn)對窗口內(nèi)的數(shù)據(jù)進行排序等需求)

實現(xiàn)方法
apply(windowFunction)
process(processWindowFunction)
apply和process的區(qū)別

apply和process都是處理全量計算,但工作中正常用process。
process更加底層,更加強大,有open/close生命周期方法,又可獲取RuntimeContext。
ProcessWindowFunction/ProcessAllWindowFunction
全量聚合:窗口需要維護全部原始數(shù)據(jù),窗口觸發(fā)進行全量聚合。
ProcessWindowFunction一次性迭代整個窗口里的所有元素,比較重要的一個對象是Context,可以獲取到事件和狀態(tài)信息,這樣我們就可以實現(xiàn)更加靈活的控制,這實際上是process的主要特點吧。該算子會浪費很多性能吧,主要原因是不增量計算,要緩存整個窗口然后再去處理,所以要設計好內(nèi)存。
牛叉的地方是ProcessWindowFunction可以結(jié)合 ReduceFunction, AggregateFunction,或者 FoldFunction來做增量計算(推薦用法)
請注意,使用ProcessWindowFunction諸如 count 之類的簡單聚合效率很低。
