我的编程空间,编程开发者的网络收藏夹
学习永远不晚

「Flink」使用Managed Keyed State实现计数窗口功能

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

「Flink」使用Managed Keyed State实现计数窗口功能

「Flink」使用Managed Keyed State实现计数窗口功能

先上代码:

public class WordCountKeyedState {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 初始化测试单词数据流
        DataStreamSource lineDS = env.addSource(new RichSourceFunction() {
            private boolean isCanaled = false;

            @Override
            public void run(SourceContext ctx) throws Exception {
                while(!isCanaled) {
                    ctx.collect("hadoop flink spark");
                    Thread.sleep(1000);
                }
            }

            @Override
            public void cancel() {
                isCanaled = true;
            }
        });

        // 切割单词,并转换为元组
        SingleOutputStreamOperator> wordTupleDS = lineDS.flatMap((String line, Collector> ctx) -> {
            Arrays.stream(line.split(" ")).forEach(word -> ctx.collect(Tuple2.of(word, 1)));
        }).returns(Types.TUPLE(Types.STRING, Types.INT));

        // 按照单词进行分组
        KeyedStream, Integer> keyedWordTupleDS = wordTupleDS.keyBy(t -> t.f1);

        // 对单词进行计数
        keyedWordTupleDS.flatMap(new RichFlatMapFunction, Tuple2>() {

            private transient ValueState> countSumValueState;

            @Override
            public void open(Configuration parameters) throws Exception {
                // 初始化ValueState
                ValueStateDescriptor> countSumValueStateDesc = new ValueStateDescriptor("countSumValueState",
                        TypeInformation.of(new TypeHint>() {})
                );
                countSumValueState = getRuntimeContext().getState(countSumValueStateDesc);
            }

            @Override
            public void flatMap(Tuple2 value, Collector> out) throws Exception {
                if(countSumValueState.value() == null) {
                    countSumValueState.update(Tuple2.of(0, 0));
                }

                Integer count = countSumValueState.value().f0;
                count++;
                Integer valueSum = countSumValueState.value().f1;
                valueSum += value.f1;

                countSumValueState.update(Tuple2.of(count, valueSum));

                // 每当达到3次,发送到下游
                if(count > 3) {
                    out.collect(Tuple2.of(value.f0, valueSum));
                    // 清除计数
                    countSumValueState.update(Tuple2.of(0, valueSum));
                }
            }
        }).print();

        env.execute("KeyedState State");
    }
}

代码说明:

构建测试数据源,每秒钟发送一次文本,为了测试方便,这里就发一个包含三个单词的文本行

image

对句子按照空格切分,并将单词转换为元组,每个单词初始出现的次数为1

image

按照单词进行分组

image

自定义FlatMap

初始化ValueState,注意:ValueState只能在KeyedStream中使用,而且每一个ValueState都对一个一个key。每当一个并发处理ValueState,都会从上下文获取到Key的取值,所以每个处理逻辑拿到的ValueStated都是对应指定key的ValueState,这个部分是由Flink自动完成的。

image

注意:

带默认初始值的ValueStateDescriptor已经过期了,官方推荐让我们手动在处理时检查是否为空

instead and manually manage the default value by checking whether the contents of the state is null.


@Deprecated
public ValueStateDescriptor(String name, TypeSerializer typeSerializer, T defaultValue) {
super(name, typeSerializer, defaultValue);
}

逻辑实现

在flatMap逻辑中判断ValueState是否已经初始化,如果没有手动给一个初始值。并进行累加后更新。每当count > 3发送计算结果到下游,并清空计数。

image

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

「Flink」使用Managed Keyed State实现计数窗口功能

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

「Flink」使用Managed Keyed State实现计数窗口功能

先上代码:public class WordCountKeyedState { public static void main(String[] args) throws Exception { StreamExecutionEnviron
「Flink」使用Managed Keyed State实现计数窗口功能
2016-03-16

怎么在python中使用PyQt5实现一个窗口功能

怎么在python中使用PyQt5实现一个窗口功能?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。python主要应用领域有哪些1、云计算,典型应用OpenSta
2023-06-14

怎么使用QGraphicsView实现气泡聊天窗口+排雷功能

这篇“怎么使用QGraphicsView实现气泡聊天窗口+排雷功能”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“怎么使用QG
2023-06-30

如何使用Redis+Lua脚本实现计数器接口防刷功能

这篇文章主要介绍如何使用Redis+Lua脚本实现计数器接口防刷功能,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!【实现过程】一、问题分析 如果set命令设置上,但是在设置失效时间时由于网络抖动等原因导致没有设置成功
2023-06-29

使用Pandas怎么实现一个分组计数功能

这篇文章将为大家详细讲解有关使用Pandas怎么实现一个分组计数功能,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。在对dataframe进行分析的时候会遇到需要分组计数,计数的column中
2023-06-14

使用react和redux怎么实现一个计数器功能

本篇文章给大家分享的是有关使用react和redux怎么实现一个计数器功能,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Redux,本身就是一个单纯的状态管理者,我们不追溯它的
2023-06-15

使用spring通过整合shiro如何实现数据库设与计权限管理功能

本篇文章为大家展示了使用spring通过整合shiro如何实现数据库设与计权限管理功能,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。首先要先设计好我们的数据库,先来看一张比较粗糙的数据库设计图:具体
2023-05-31

编程热搜

目录