最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

Flink全量聚合函數(shù):apply和process這兩種實現(xiàn)方法有什么區(qū)別?

2023-08-14 14:30 作者:ingemar-  | 我要投稿

指在窗口觸發(fā)的時候才會對窗口內(nèi)的所有數(shù)據(jù)進行一次計算(等窗口的數(shù)據(jù)到齊,才開始進行聚合計算,可實現(xiàn)對窗口內(nèi)的數(shù)據(jù)進行排序等需求)

實現(xiàn)方法

  • apply(windowFunction)

  • process(processWindowFunction)

apply和process的區(qū)別


apply和process都是處理全量計算,但工作中正常用process。

process更加底層,更加強大,有open/close生命周期方法,又可獲取RuntimeContext。


ProcessWindowFunction/ProcessAllWindowFunction


全量聚合:窗口需要維護全部原始數(shù)據(jù),窗口觸發(fā)進行全量聚合。

ProcessWindowFunction一次性迭代整個窗口里的所有元素,比較重要的一個對象是Context,可以獲取到事件和狀態(tài)信息,這樣我們就可以實現(xiàn)更加靈活的控制,這實際上是process的主要特點吧。該算子會浪費很多性能吧,主要原因是不增量計算,要緩存整個窗口然后再去處理,所以要設計好內(nèi)存。

牛叉的地方是ProcessWindowFunction可以結(jié)合 ReduceFunction, AggregateFunction,或者 FoldFunction來做增量計算(推薦用法)

請注意,使用ProcessWindowFunction諸如 count 之類的簡單聚合效率很低。


Flink全量聚合函數(shù):apply和process這兩種實現(xiàn)方法有什么區(qū)別?的評論 (共 條)

分享到微博請遵守國家法律
阿荣旗| 聊城市| 柯坪县| 鹿邑县| 榆社县| 三都| 永寿县| 莎车县| 长沙市| 珲春市| 龙岩市| 苍梧县| 信宜市| 阿拉善右旗| 寿宁县| 仲巴县| 阿拉善右旗| 沿河| 洛扎县| 虞城县| 宁陵县| 穆棱市| 明光市| 镇宁| 汉寿县| 夏邑县| 吐鲁番市| 云林县| 元氏县| 区。| 岳普湖县| 栾川县| 永仁县| 资溪县| 广河县| 枣强县| 贵州省| 乐业县| 河池市| 娄烦县| 余庆县|