我的编程空间,编程开发者的网络收藏夹
学习永远不晚

并行Stream与Spring事务相遇会发生什么?

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

并行Stream与Spring事务相遇会发生什么?

前言:

事情是这样的:运营人员反馈,通过Excel导入数据时,有一部分成功了,有一部分未导入。初步猜测,是事务未生效导致的。查看代码,发现导入部分已经通过@Transcational注解进行事务控制了,为什么还会出现事务不生效的问题呢?下面我们就进行具体的案例分析,Let's go!

事务不生效的代码

这里写一段简单的伪代码来演示展示一下事务不生效的代码:

  @Transactional(rollbackFor = Exception.class)
  public void batchInsert(List<Order> list) {
    list.parallelStream().forEach(order -> orderMapper.save(order));
  }

逻辑很简单,遍历list,然后批量插入Order数据到数据库。在该方法上使用@Transactional来声明出现异常时进行回滚。

但事实情况是,其中某一条数据执行异常时,事务并没有进行回滚。这到底是为什么呢?

下面一探究竟。

JDK 8 的Stream

上面代码中涉及到了两个知识点:parallelStream和@Transactional,我们先来铺垫一下parallelStream相关知识。

在JDK8 中引入了Stream API的概念和实现,这里的Stream有别于 InputStream 和OutputStream,Stream API 是处理对象流而不是字节流。

比如,我们可以通过如下方式来基于Stream进行实现:

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9); 
numbers.stream().forEach(num->System.out.println(num));

输出:1 2 3 4 5 6 7 8 9

代码看起来方便清爽多了。

关于Stream的基本处理流程如下:

在这些Stream API中,还提供了一个并行处理的API,也就是parallelStream。它可以将任务拆分子任务,分发给多个处理器同时处理,之后合并。这样做的目的很明显是为了提升处理效率。

parallelStream的基本使用方式如下:

// 并行执行流
list.stream().parallel().filter(e -> e > 10).count()

针对上述代码,对应的流程如下:

而parallelStream会将流划分成多个子流,分散到不同的CPU并行处理,然后合并处理结果。其中,parallelStream默认是基于ForkJoinPool.commonPool()线程池来实现并行处理的。

通常情况下,我们可以认为并行会比串行快,但还是有前提条件的:

  • 处理器核心数量:并行处理核心数越多,处理效率越高;
  • 处理数据量:处理数据量越大优势越明显;

但并行处理也面临着一系列的问题,比如:资源竞争、死锁、线程切换、事务、可见性、线程安全等问题。

@Transactional事务处理

上面了解了parallelStream的基本原理及特性之后,再来看看@Transactional的事务处理特性。

@Transactional是Spring提供的基于注解的一种声明式事务方式,该注解只能运用到public的方法上。

基本原理:当一个方法被@Transactional注解之后,Spring会基于AOP在方法执行之前开启一个事务。当方法执行完毕之后,根据方法是否报错,来决定回滚或提交事务。

在默认代理模式下,只有目标方法由外部方法调用时,才能被Spring的事务拦截器拦截。所以,在同一个类中的两个方法直接调用,不会被Spring的事务拦截器拦截。这是事务不生效的一个场景,但在上述案例中,并不存在这种情况。

Spring在处理事务时,会从连接池中获得一个jdbc connection,将连接绑定到线程上(基于ThreadLocal),那么同一个线程中用到的就是同一个connection了。具体实现在DataSourceTransactionManager#doBegin方法中。

Bug综合分析

在了解了parallelStream和@Transactional的相关知识之后,我们会发现:parallelStream处理时开启了多线程,而@Transactional在处理事务时会(基于ThreadLocal)将连接绑定到当前线程,由于@Transactional绑定管理的是主线程的事务,而parallelStream开启的新的线程与主线程无关。因此,事务也就无效了。

此时,将parallelStream改为普通的stream,事务可正常回滚。这就提示我们,在使用基于@Transactional方式管理事务时,慎重使用多线程处理。

问题拓展

虽然parallelStream带来了更高的性能,但也要区分场景进行使用。即便是在不需要事务管理的情况下,如果parallelStream使用不当,也会造成同一时间对数据库发起大量请求等问题。

因此,在stream与parallelStream之间进行选择时,还要考虑几个问题:

  • 是否需要并行?数据量比较大,处理器核心数比较多的情况下才会有性能提升。
  • 任务之间是否是独立的,是否会引起任何竞态条件?比如:是否共享变量。
  • 执行结果是否取决于任务的调用顺序?并行执行的顺序是不确定的。

小结

文章讲述的Bug虽然简单,但如果不了解parallelStream与@Transactional注解的特性,还是很难排查的。而且也让我们意识到,虽然Spring通过@Transactional将事务管理进行了简化处理,但作为开发者,还是需要深入了解一下它的基本运作原理。不然,在排查bug时,很容易踩坑。

到此这篇关于并行Stream与Spring事务相遇会发生什么?的文章就介绍到这了,更多相关 Stream与Spring 内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

并行Stream与Spring事务相遇会发生什么?

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

如果在当前事务的中间执行 START TRANSACTION 命令,当前 MySQL 事务会发生什么?

如果在当前事务中间执行 START TRANSACTION,则当前事务将被提交并结束。当前事务中所做的所有数据库更改都将永久生效。这称为 START TRANSACTION 命令的隐式提交。示例假设我们在表“marks”中有以下值mysql
2023-10-22

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录