Flink Batch SQL 1.10 实践

2023-06-05 08:09

短信预约 -IT技能 免费直播动态提醒

Flink作为流批统一的计算框架，在1.10中完成了大量batch相关的增强与改进。1.10可以说是第一个成熟的生产可用的Flink Batch SQL版本，它一扫之前Dataset的羸弱，从功能和性能上都有大幅改进，以下我从架构、外部系统集成、实践三个方面进行阐述。

架构

Stack

Flink Batch SQL 1.10 实践

首先来看下stack，在新的Blink planner中，batch也是架设在Transformation上的，这就意味着我们和Dataset完全没有关系了：

我们可以尽可能的和streaming复用组件，复用代码，有同一套行为。
如果想要Table/SQL的toDataset或者fromDataset，那就完全没戏了。尽可能的在Table的层面来处理吧。
后续我们正在考虑在DataStream上构建BoundedStream，给DataStream带来批处理的功能。

网络模型

Flink Batch SQL 1.10 实践

Batch模式就是在中间结果落盘，这个模式和典型的Batch处理是一致的，比如MapReduce/Spark/Tez。

Flink以前的网络模型也分为Batch和Pipeline两种，但是Batch模式只是支持上下游隔断执行，也就是说资源用量可以不用同时满足上下游共同的并发。但是另外一个关键点是Failover没有对接好，1.9和1.10在这方面进行了改进，支持了单点的Failover。

建议在Batch时打开：

jobmanager.execution.failover-strategy = region

为了避免重启过于频繁导致JobMaster太忙了，可以把重启间隔提高：

restart-strategy.fixed-delay.delay = 30 s

Batch模式的好处有：

容错好，可以单点恢复
调度好，不管多少资源都可以运行
性能差，中间数据需要落盘，强烈建议开启压缩
taskmanager.network.blocking-shuffle.compression.enabled = true

Batch模式比较稳，适合传统Batch作业，大作业。

Flink Batch SQL 1.10 实践

Pipeline模式是Flink的传统模式，它完全和Streaming作业用的是同一套代码，其实社区里Impala和Presto也是类似的模式，纯走网络，需要处理反压，不落盘，它主要的优缺点是：

容错差，只能全局重来
调度差，你得保证有足够的资源
性能好，Pipeline执行，完全复用Stream，复用流控反压等功能。

有条件可以考虑开启Pipeline模式。

调度模型

Flink on Yarn支持两种模式，Session模式和Per job模式，现在已经在调度层次高度统一了。

Session模式没有最大进程限制，当有Job需要资源时，它就会去Yarn申请新资源，当Session有空闲资源时，它就会给Job复用，所以它的模型和PerJob是基本一样的。
唯一的不同只是：Session模式可以跨作业复用进程。

另外，如果想要更好的复用进程，可以考虑加大TaskManager的超时释放：
resourcemanager.taskmanager-timeout = 900000

资源模型

先说说并发：

对Source来说：目前Hive的table是根据InputSplit来定需要多少并发的，它之后能Chain起来的Operators自然都是和source相同的并发。
对下游网络传输过后的Operators(Tasks)来说：除了一定需要单并发的Task来说，其它Task全部统一并发，由table.exec.resource.default-parallelism统一控制。

我们在Blink内部实现了基于统计信息来推断并发的功能，但是其实以上的策略在大部分场景就够用了。

Manage内存

Flink Batch SQL 1.10 实践

目前一个TaskManager里面含有多个Slot，在Batch作业中，一个Slot里只能运行一个Task (关闭SlotShare)。

对内存来说，单个TM会把Manage内存切分成Slot粒度，如果1个TM中有n个Slot，也就是Task能拿到1/n的manage内存。

我们在1.10做了重大的一个改进就是：Task中chain起来的各个operators按照比例来瓜分内存，所以现在配置的算子内存都是一个比例值，实际拿到的还要根据Slot的内存来瓜分。

这样做的一个重要好处是：

不管当前Slot有多少内存，作业能都run起来，这大大提高了开箱即用。
不管当前Slot有多少内存，Operators都会把内存瓜分干净，不会存在浪费的可能。

当然，为了运行的效率，我们一般建议单个Slot的manage内存应该大于500MB。

另一个事情，在1.10后，我们去除了OnHeap的manage内存，所以只有off-heap的manage内存。

外部系统集成

Hive

强烈推荐Hive Catalog + Hive，这也是目前批处理最成熟的架构。在1.10中，除了对以前功能的完善以外，其它做了几件事：

多版本支持，支持Hive 1.X 2.X 3.X
完善了分区的支持，包括分区读，动态/静态分区写，分区统计信息的支持。
集成Hive内置函数，可以通过以下方式来load:
a)TableEnvironment.loadModule("hiveModule",new HiveModule("hiveVersion"))
优化了ORC的性能读，使用向量化的读取方式，但是目前只支持Hive 2+版本，且要求列没有复杂类型。有没有进行过优化差距在5倍量级。

兼容Streaming Connectors

得益于流批统一的架构，目前的流Connectors也能在batch上使用，比如HBase的Lookup和Sink、JDBC的Lookup和Sink、Elasticsearch的Sink，都可以在Batch无缝对接使用起来。

实践

SQL-CLI

在1.10中，SQL-CLI也做了大量的改动，比如把SQL-CLI做了stateful，里面也支持了DDL，还支持了大量的DDL命令，给SQL-CLI暴露了很多TableEnvironment的能力，这让用户可以方便得多。后续，我们也需要对接JDBC的客户端，让用户可以更好的对接外部工具。但是SQL-CLI仍然待继续改进，比如目前仍然只支持Session模式，不支持Per Job模式。

编程方式

TableEnvironment tEnv = TableEnvironment.create(EnvironmentSettings  .newInstance()  .useBlinkPlanner()  .inBatchMode()  .build());

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

Flink Batch SQL 1.10 实践

下载Word文档到电脑，方便收藏和打印～

下载Word文档

Flink Batch SQL 1.10 实践

架构

Stack

网络模型

调度模型

资源模型

Manage内存

外部系统集成

Hive

兼容Streaming Connectors

实践

SQL-CLI

编程方式

Flink Batch SQL 1.10 实践

相关文章

猜你喜欢

Flink Batch SQL 1.10 实践

Flink实践Savepoint使用示例详解

Flink CDC 最佳实践（以 MySQL 为例）

浅谈Spring Batch在大型企业中的最佳实践

Flink 在人工智能领域的应用实践

Flink SQL怎么实现数据流的Join

美团点评基于 Flink 的实时数仓建设实践

知乎利用 JuiceFS 给 Flink 容器启动加速实践

ApacheHudi结合Flink的亿级数据入湖实践解析

MyBatis ORM动态SQL实践

SQL查询优化实践

flink 使用sql实现kafka生产者和消费者

使用flink的sql-client.sh，测试mysql--＞kafka--＞kafka--＞mysql实时流

SQL级别查询优化实践

SQL级别日志记录实践

SQL级别数据加密实践

MyBatis ORM的SQL语句条件动态SQL实践

MySQL与HBase在大数据流处理框架（如Flink）中的集成实践

Apache Spark SQL入门及实践的实例分析

企业实践 | 如何更好地使用 Apache Flink 解决数据计算问题？

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复