大数据
数据流 标签描述

窗口概述 在大多数场景下,需要统计的数据流都是无界的,因此无法等待整个数据流终止后才进行统计。通常情况下,只需要对某个时间范围或者数量范围内的数据进行统计分析 例如: 每隔10分钟统计一次过去30分钟内某个对象的点击量 每发生100次点击后,就去统计一下每个对象点击率的占比 因此,在ApacheFlink中,窗口是对无界数据流进行有界处理的机制。窗口可以将无限的数据流划分为有限的、可处理的块,使得可以基于这些有限的数据块执行聚合、计算和分析操作。 窗口的分类 是否按键分区 在定义窗口操作之前,首先需要确定,到底是基于按键分区的数据流KeyedStream来开窗,还是直接在没有按键...