我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Mysql死锁排查实例分析

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Mysql死锁排查实例分析

这篇文章主要介绍“Mysql死锁排查实例分析”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Mysql死锁排查实例分析”文章能帮助大家解决问题。

  问题初现

  在某天下午,突然系统报警,抛出个异常:

  仔细一看好像是事务回滚异常,写着的是因为死锁回滚,原来是个死锁问题,由于我对Mysql锁还是有一定 了解的,于是开始主动排查这个问题。

  首先在数据库中查找Innodb Status,在Innodb Status中会记录上一次死锁的信息,输入下面命令:

  SHOW ENGINE INNODB STATUS

  死锁信息如下,sql信息进行了简单处理:

  ------------------------

  LATEST DETECTED DEADLOCK

  ------------------------

  2019-02-22 15:10:56 0x7eec2f468700

  *** (1) TRANSACTION:

  TRANSACTION 2660206487, ACTIVE 0 sec starting index read

  mysql tables in use 1, locked 1

  LOCK WAIT 2 lock struct(s), heap size 1136, 1 row lock(s)

  MySQL thread id 31261312, OS thread handle 139554322093824, query id 11624975750 10.23.134.92 erp_crm__6f73 updating

  UPDATE tenant_config SET

  open_card_point =  0

  where tenant_id = 123

  *** (1) WAITING FOR THIS LOCK TO BE GRANTED:

  RECORD LOCKS space id 1322 page no 534 n bits 960 index uidx_tenant of table ——erp_crm_member_plan——。——tenant_config—— trx id 2660206487 lock_mode X locks rec but not gap waiting

  *** (2) TRANSACTION:

  TRANSACTION 2660206486, ACTIVE 0 sec starting index read

  mysql tables in use 1, locked 1

  3 lock struct(s), heap size 1136, 2 row lock(s)

  MySQL thread id 31261311, OS thread handle 139552870532864, query id 11624975758 10.23.134.92 erp_crm__6f73 updating

  UPDATE tenant_config SET

  open_card_point =  0

  where tenant_id = 123

  *** (2) HOLDS THE LOCK(S):

  RECORD LOCKS space id 1322 page no 534 n bits 960 index uidx_tenant of table ——erp_crm_member_plan——。——tenant_config—— trx id 2660206486 lock mode S

  *** (2) WAITING FOR THIS LOCK TO BE GRANTED:

  RECORD LOCKS space id 1322 page no 534 n bits 960 index uidx_tenant of table ——erp_crm_member_plan——。——tenant_config—— trx id 2660206486 lock_mode X locks rec but not gap waiting

  *** WE ROLL BACK TRANSACTION (1)

  ------------

  给大家简单的分析解释一下这段死锁日志,事务1执行Update语句的时候需要获取uidx_tenant这个索引再where条件上的X锁(行锁),事务2执行同样的Update语句,也在uidx_tenant上面想要获取X锁(行锁),然后就出现了死锁,回滚了事务1。当时我就很懵逼,回想了一下死锁产生的必要条件:

  互斥。

  请求与保持条件。

  不剥夺条件。

  循环等待。 从日志上来看事务1和事务2都是取争夺同一行的行锁,和以往的互相循环争夺锁有点不同,怎么看都无法满足循环等待条件。经过同事提醒,既然从死锁日志中不能进行排查,那么就只能从业务代码和业务日志从排查。这段代码的逻辑如下:

  public int saveTenantConfig(PoiContext poiContext, TenantConfigDO tenantConfig) {

  try {

  return tenantConfigMapper.saveTenantConfig(poiContext.getTenantId(), poiContext.getPoiId(), tenantConfig);

  } catch (DuplicateKeyException e) {

  LOGGER.warn("[saveTenantConfig] 主键冲突,更新该记录。context:{}, config:{}", poiContext, tenantConfig);

  return tenantConfigMapper.updateTenantConfig(poiContext.getTenantId(), tenantConfig);

  }

  }

  这段代码的意思是保存一个配置文件,如果发生了唯一索引冲突那么就会进行更新,当然这里可能写得不是很规范,其实可以用

  insert into …

  on duplicate key update

  也可以达到同样的效果,但是就算用这个其实也会发生死锁。看了代码之后同事又给我发了当时业务日志,

  可以看见这里有三条同时发生的日志,说明都发生了唯一索引冲突进入了更新的语句,然后发生的死锁。到这里答案终于稍微有点眉目了。

  这个时候再看我们的表结构如下(做了简化处理):

  CREATE TABLE ——tenant_config—— (

  ——id—— bigint(21) NOT NULL AUTO_INCREMENT,

  ——tenant_id—— int(11) NOT NULL,

  ——open_card_point—— int(11) DEFAULT NULL,

  PRIMARY KEY (——id——),

  UNIQUE KEY ——uidx_tenant—— (——tenant_id——)

  ) ENGINE=InnoDB  DEFAULT CHARSET=utf8mb4 ROW_FORMAT=COMPACT

  我们的tenant_id是用来做唯一索引,我们的插入和更新的where条件都是基于唯一索引来操作的。

  UPDATE tenant_config SET

  open_card_point =  0

  where tenant_id = 123

  到了这里感觉插入的时候对唯一索引加锁有关系,接下来我们进行下一步的深入剖析。

  深入剖析

  上面我们说有三个事务进入update语句,为了简化说明这里我们只需要两个事务同时进入update语句即可,下面的表格展示了我们整个的发生过程:

  小提示:S锁是共享锁,X锁是互斥锁。一般来说X锁和S,X锁都互斥,S锁和S锁不互斥。

  我们从上面的流程中看见发生这个死锁的关键需要获取S锁,为什么我们再插入的时候需要获取S锁呢?因为我们需要检测唯一索引?在RR隔离级别下如果要读取那么就是当前读,那么其实就需要加上S锁。这里发现唯一键已经存在,这个时候执行update就会被两个事务的S锁互相阻塞,从而形成上面的循环等待条件。

  小提示: 在MVCC中,当前读和快照读的区别:当前读每次需要加锁(可以使共享锁或者互斥锁)获取到最新的数据,而快照读是读取的是这个事务开始的时候那个快照,这个是通过undo log去进行实现的。

  这个就是整个死锁的原因,能出现这种死锁的还有一个情况,就是同一时间来三个插入操作,其中先插入的那个事务如果最后回滚了,其余两个事务也会出现这种死锁。

  解决方案

  这里的核心问题是需要把S锁给干掉,这里有三个可供参考的解决方案:

  将RR隔离级别,降低成RC隔离级别。这里RC隔离级别会用快照读,从而不会加S锁。

  再插入的时候使用select * for update,加X锁,从而不会加S锁。

  可以提前加上分布式锁,可以利用Redis,或者ZK等等,分布式锁可以参考我的这篇文章。聊聊分布式锁

  第一种方法不太现实,毕竟隔离级别不能轻易的修改。第三种方法又比较麻烦。所以第二种方法是我们最后确定的。

关于“Mysql死锁排查实例分析”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网行业资讯频道,小编每天都会为大家更新不同的知识点。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Mysql死锁排查实例分析

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

MySQL死锁问题排查与详细分析

目录前言1. 死锁的基本概念1.1 死锁的定义1.2 死锁的四个必要条件2. 死锁的常见原因2.1 事务并发控制不当2.2 事务顺序不一致2.3 资源竞争激烈2.4 事务设计不合理3. 死锁的排查方法3.1 查看死锁日志3.1.1 启用死锁
MySQL死锁问题排查与详细分析
2024-09-11

MySQL死锁案例分析

最近项目中某个模块稳定复现MySQL死锁问题,本文记录死锁的发生原因以及解决办法。1. 预备知识1.1 表锁和行锁表锁表锁是MySQL中最基本的锁策略,并且是开销最小的策略。表锁会锁定整张数据表,用户的写操作(插入/删除/更新)前,都需要获取写锁(写锁会相互阻
MySQL死锁案例分析
2015-02-06

Linux死锁实例分析

这篇“Linux死锁实例分析”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Linux死锁实例分析”文章吧。死锁简介进程(线程
2023-06-28

mysql死锁怎么排查及解决

MySQL死锁是指两个或多个事务互相持有对方需要的资源,同时又等待对方释放资源,导致系统无法继续进行下去的情况。解决MySQL死锁问题需要进行以下步骤:1. 确认死锁:可以通过查看MySQL错误日志来确认是否发生死锁。错误日志中会记录死锁的
2023-09-21

MySQL锁等待与死锁问题分析

前言: 在 MySQL 运维过程中,锁等待和死锁问题是令各位 DBA 及开发同学非常头痛的事。出现此类问题会造成业务回滚、卡顿等故障,特别是业务繁忙的系统,出现死锁问题后影响会更严重。本篇文章我们一起来学习下什么是锁等待及死锁,出现此类问
2022-05-22

编程热搜

目录