我的编程空间,编程开发者的网络收藏夹
学习永远不晚

索引失效的7个原因

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

索引失效的7个原因

索引失效的7个原因

实际工作以及面试中,应该经常会遇到SQL相关的问题,而这些问题中,索引失效的场景又是一个常客。下面总结一下索引失效的场景,一共7种,索引失效的原因逃不过这7个。

概述

主要内容如下:

image-20230405121528598

先创建一张表用于测试,表中创建了三个索引(MySQL版本8.0.26)

  • 主键索引 id
  • 普通索引 age
  • 联合索引 name,code,address
SET NAMES utf8mb4;SET FOREIGN_KEY_CHECKS = 0;-- ------------------------------ Table structure for user-- ----------------------------DROP TABLE IF EXISTS `user`;CREATE TABLE `user`  (  `id` int(11) NOT NULL AUTO_INCREMENT,  `name` varchar(20) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,  `code` int(100) NULL DEFAULT NULL,  `address` varchar(100) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,  `age` int(11) NULL DEFAULT NULL,  `create_time` datetime(0) NOT NULL ON UPDATE CURRENT_TIMESTAMP(0),  PRIMARY KEY (`id`) USING BTREE,  INDEX `普通索引`(`age`) USING BTREE,  INDEX `联合索引`(`name`, `code`, `address`) USING BTREE) ENGINE = InnoDB AUTO_INCREMENT = 5 CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;-- ------------------------------ Records of user-- ----------------------------INSERT INTO `user` VALUES (1, '海绵宝宝', 1001, '上海', 23, '2022-11-02 20:44:14');INSERT INTO `user` VALUES (2, '章鱼哥', 1002, '北京', 22, '2022-11-02 20:44:16');INSERT INTO `user` VALUES (3, '派大星', 1003, '苏州', 23, '2022-11-02 20:44:19');INSERT INTO `user` VALUES (4, '蟹老板', 1004, '南通', 24, '2022-11-02 20:44:25');

1. 最左匹配原则

最左匹配原则就是指在联合索引中,如果你的 SQL 语句中用到了联合索引中的最左边的索引,那么这条 SQL 语句就可以利用这个联合索引去进行匹配,并且最左优先,以最左边的为起点任何连续的索引都能匹配上。同时遇到范围查询(>、<、between、like)就会停止匹配

首先思考下下面这些SQL会不会走到索引:

1select create_time from user where name = "派大星"  -- 会走索引吗?2select create_time from user where code = 1   -- 会走索引吗?3select create_time from user where address = "上海"  -- 会走索引吗?4select create_time from user where address = "上海" and code = 1 -- 会走索引吗?5select create_time from user where address = "上海" and name = "派大星"  -- 会走索引吗?6select create_time from user where name = "派大星" and address = "上海"  -- 会走索引吗?7select create_time from user where code = 1 and name = "派大星" and address = "上海" -- 会走索引吗?8select create_time from user where name = "派大星" and code = 1 and address = "上海"  -- 会走索引吗?  

答案是有1、5、6、7和8会走索引。

执行SQL1,分析执行计划:

explain select create_time from user where name = "派大星" 

image-20230405102022418

可以看到,其使用了联合索引,只扫描了1行。

执行SQL2,分析执行计划:

explain select create_time from user where code = 1

image-20230405102218158

没有使用索引,进行了全表扫描,rows=4。

SQL3-4可以自行验证,都没有走到索引。

执行SQL5,分析执行计划:

explain select create_time from user where address = "上海" and name = "派大星"

image-20230405102547562

使用了联合索引。

执行SQL6,分析执行计划:

explain select create_time from user where name = "派大星" and address = "上海"

image-20230405102439907

使用了联合索引。

执行SQL7,分析执行计划:

explain select create_time from user where code = 1 and name = "派大星" and address = "上海"

image-20230405104338047

使用了联合索引。

执行SQL8,分析执行计划:

explain select create_time from user where name = "派大星" and code = 1 and address = "上海"

image-20230405102720219

使用了联合索引。

SQL8能够使用到联合索引的原因,是他的查询条件的顺序,和联合索引的字段顺序是一致的,所以满足最左匹配原则。

可能会有疑惑,5和6不是没有满足最左匹配原则嘛,为什么还会使用到联合索引?

这是个好问题,因为MySQL会使用优化器对SQL进行优化,自动改写为最优查询语句,也就能够使用到联合索引。

但对于SQL5和6,虽然能使用联合索引,但是只走name字段索引,不会走address字段。

那什么又叫”同时遇到范围查询(>、<、between、like)就会停止匹配“呢?

看下面一个例子,改造下SQL7:

explain select create_time from user where code > 1 and name = "派大星" and address = "上海"

把code=1改为code>1,执行:

image-20230405105615129

虽然也使用了联合索引,但是她的type是range。而改造前的type如下图是ref:

image-20230405104338047

那么type位range和ref的区别是什么呢?

image-20230405110015052

可以理解为:range是范围查找,ref是索引查找。

根据官方描述,扫描方式从快到慢依次是:

image-20230405110241445

也就是说,**遇到范围查询(>、<、between、like)**后,后面的字段就不会进行索引匹配了,也就是需要走范围扫描了。

最左匹配规则的原理

我们要知其然也要知其所以然,不能不求甚解。最左匹配的原来是什么呢?其实和MySQL存储引擎使用的存储数据结构有关。

我们都知道,MySQL的默认存储引擎是InnoDB,InnoDB的存储结构使用的是B+树,索引也是一棵B+树。

联合索引是非聚集索引。聚集索引和聚集索引的区别可以参考这篇文章

联合索引的B+树节点中存储的是键值。由于构建一棵B+树只能根据一个值来确定索引关系,所以数据库依赖联合索引最左的字段来构建。(看晕了吧,哈哈哈哈,谁看了不晕!!)看下面的图,比较直观,假如创建一个(a,b,c)的联合索引,那么它的索引树是这样的:

image-20230405111516621

其中的非叶子节点存储的是第一个关键字的索引 a,而叶子节点存储的是三个关键字(a,b,c)的数据,如[5,1,2]代表a,b,c三个字段的数据。

可以看出来他的特点:

  • a是有序的:5,5,5,6,6,7,7
  • b,c无序
  • 当a等值时,b有序。如a=5,b为1,1,2
  • 当a,b等值时,c有序。如a=5,b=1,c为2,3

也就是说,后一个字段,需要前字段的支持才能形成有序。

最左匹配小结:

如果创建 b,c,d 联合索引面

  • 如果 我where 后面的条件是c = 1 and d = 1为什么不能走索引呢 如果没有b的话 你查询的值相当于 *11 我们都知道*是所有的意思也就是我能匹配到所有的数据
  • 如果 我 where 后面是 b = 1 and d =1 为什么会走索引呢?你等于查询的数据是 1*1 我可以通过前面 1 进行索引匹配 所以就可以走索引
  • 最左缀匹配原则的最重要的就是 第一个字段

下面看下一个失效场景。

2. 使用函数

在select后面使用函数可以使用索引:

explain select sum(id) from user where code = 1001

image-20230405113830105

但是在where语句后面使用函数,是不能使用索引的:

explain select create_time from user where length(name) = 3 

image-20230405113943060

因为索引保存的是索引字段的原始值,而不是经过函数计算后的值,自然就没办法走索引了。

3. 计算操作

和使用函数一样,导致索引失效是因为改变了索引原来的值 在树中找不到对应的数据只能全表扫描。

explain select create_time from user where code-1 = 3 

image-20230405114253712

因为索引保存的是索引字段的原始值,而不是 code - 1 表达式计算后的值,所以无法走索引,只能通过把索引字段的取值都取出来,然后依次进行表达式的计算来进行条件判断,因此采用的就是全表扫描的方式。

小结:影响到索引列的值,索引就会失效

4. Like %

Like 通配符有什么:

  • %:表示任意字符出现任意的次数(类似正则表达式总的.)
  • _:表示匹配单个字符

like就是只是MySQL后面的搜索模式利用通配符。

需要注意:

使用 like 但是没有使用通配符,效果和使用 = 一样,如:

SELECT * FROM products WHERE products.prod_name like '1000';

使用%通配符造成索引失效的场景主要是**%在左边**:

explain select create_time from user where name like '%派大星'

image-20230405115110356

失效的原因是模糊查询范围比较大,没有使用索引的必要了。

%在右边是不会失效的:

explain select create_time from user where name like '派大星%'

image-20230405115149304

小结:%在左边失效,%在右边不失效

5. 使用Or导致索引失效

在 WHERE 子句中,如果在 OR 前的条件列是索引列,而在 OR 后的条件列不是索引列,那么索引会失效。

explain select create_time from user where code = 1001 or name ='派大星'

image-20230405115654929

优化方式就是在Or的时候两边都加上索引。

6. in使用不当

In 不是一定会造成全表扫描的 IN肯定会走索引,但是当IN的取值范围较大时会导致索引失效,走全表扫描

in 在结果集 大于30%的时候索引失效

not in 和 In的失效场景相同

不失效的场景:

explain select create_time from user where  age in (22)

image-20230405120410044

失效的场景:

explain select create_time from user where  age in (21,22,23,24)

image-20230405120511901

7. order By

失效场景:

explain select create_time from user order by age

image-20230405120714446

MySQL执行有两种方案:

  • 走索引 + 回表
  • 不走索引 直接全表扫描

MySQL任务直接全表扫描更快,所以就没有走索引。

8. 总结

索引失效的具体场景有7种:

  1. 未遵循最左匹配原则
  2. 使用函数
  3. 计算操作
  4. like %在左边
  5. 使用or
  6. in 使用不当
  7. order by

image-20230405121528598

9. 补充 SELECT *

select * 和走不走索引无关,但会影响效率。

使用sekect * 存在的问题:

  • 增加查询分析器解析成本。
  • 增减字段容易与 resultMap 配置不一致。
  • 无用字段增加网络 消耗,尤其是 text 类型的字段。

为什么会音响改那个效率,这就涉及到聚集索引和非聚集索引了。我们创建的联合索引是非聚集索引,非聚集索引的B+树的叶子节点只存储了某些列,那么需要select * 的话,只查联合索引的B+树是不够的,需要经过回表查询聚集索引,从而查出所有的数据。

因为经历了回表,自然效率就低了很多。

关于聚集索引和非聚集索引,可以看这篇文章

参考

https://mp.weixin.qq.com/s/R91WyEIXVh2_tvczVHOq9A

https://cloud.tencent.com/developer/article/1774781

https://worktile.com/kb/p/24047

来源地址:https://blog.csdn.net/weixin_43155866/article/details/129969304

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

索引失效的7个原因

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

oracle 索引失效原因

1.查询结果集超过大表的30%会导致索引失效,因为orcale优化器认为既然已经查询了该表的30%以上的数据,那还不如全表扫描。2.SQL查询条件包含如下条件:not innot exists!=name like ‘%张‘ oracle 索引失效原因原文地址

	oracle 索引失效原因
2021-11-21

MySQL索引失效原因剖析

MySQL索引失效的原因多种多样,以下是一些常见的原因及其解决方法:索引失效的常见原因使用函数或表达式操作索引列:当在查询条件中使用函数(如SUBSTRING、DATE_FORMAT等)或表达式时,索引可能会失效。隐式类型转换:如果查询
MySQL索引失效原因剖析
2024-10-20

oracle索引失效的原因有哪些

有以下几个常见的原因会导致Oracle索引失效:数据分布不均匀:如果索引列的数据分布不均匀,即某些值出现的频率较高,而其他值出现的频率较低,索引的选择性会变低,导致索引失效。统计信息不准确:统计信息是Oracle优化器做出执行计划的基础之一
oracle索引失效的原因有哪些
2024-04-09

MySQL索引失效的原因有哪些

MySQL索引失效的原因可能包括以下几点:数据量过大:当数据量过大时,即使使用了索引,也可能因为需要扫描大量数据而导致索引失效。数据分布不均匀:如果数据在某个列上的分布不均匀,即某个值出现的频率过高或过低,可能会导致索引失效。索引列上使用了
MySQL索引失效的原因有哪些
2024-04-09

mysql in索引失效的原因是什么

这篇“mysql in索引失效的原因是什么”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“mysql in索引失效的原因是什么
2023-05-25

oracle函数索引失效的原因有哪些

数据分布不均匀:如果函数索引的参数值分布不均匀,可能会导致索引失效。比如,如果函数返回的值只有很少几个离散值,那么索引的选择性会很低,导致索引失效。函数运算代价高:如果函数的计算代价很高,可能会导致索引失效。数据库优化器在选择执行计划时会考
oracle函数索引失效的原因有哪些
2024-04-09

Oracle主键索引失效的原因有哪些

数据量过大:如果表中的数据量过大,Oracle可能会选择不使用主键索引,而是进行全表扫描来获取数据,这样会导致主键索引失效。数据分布不均匀:如果主键索引列上的数据分布不均匀,即某些值出现的频率较高,而另一些值出现的频率较低,那么主键索引可
Oracle主键索引失效的原因有哪些
2024-03-15

mysql索引失效的常见原因有哪些

本篇内容介绍了“mysql索引失效的常见原因有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!前言:MySQL中提高性能的一个最有效的方式
2023-06-30

MySQL索引失效原因以及SQL查询语句不走索引原因详解

目录前言1. 隐式的类型转换,索引失效2. 查询条件包含 or,可能导致索引失效3. like 通配符可能导致索引失效4. 查询条件不满足联合索引的最左匹配原则5. 在索引列login_time上使用 mysql 的内置函数6. 对索引列a
2023-03-06

MySQL索引失效原因及SQL查询语句不走索引原因是什么

这篇“MySQL索引失效原因及SQL查询语句不走索引原因是什么”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“MySQL索引失
2023-03-07

mysql中出现索引失效的原因是什么

这篇文章将为大家详细讲解有关mysql中出现索引失效的原因是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。1、最佳左前缀原则——如果索引了多列,要遵守最左前缀原则。指的是查询要从索引的最
2023-06-08

mysql索引失效的原因及解决方法有哪些

MySQL索引失效的原因及解决方法有以下几个方面:1. 索引选择不当:MySQL根据查询的条件和数据分布情况来选择使用哪个索引。如果查询的条件与索引不匹配或者数据分布不均匀,就会导致索引失效。解决方法是优化查询语句,使用合适的索引。2. 索
2023-08-09

编程热搜

目录