MySQL45讲之优化器选错索引 - flowers
前言
本文简要介绍优化器选择索引的依据有哪些,有什么办法人为引导优化器选择更优的执行方案。
为什么会出现选错索引
可能是统计索引基数信息错误,导致优化器错选索引,也可能是MySQL
的bug
。
选择依据
优化器选择索引的依据有扫描行记录数、回表次数、是否创建临时表和是否排序。
索引扫描行数。通过取样的方式统计索引列上不同的值数量,取N
张数据页,统计页面上不同值的数量,然后估算总的不同数量(基数cardinality
),这也称之为索引的“区分度”。可以通过SHOW INDEX FROM table_name
来查看每个索引的基数。
对于这条执行语句 SELECT * FROM t WHERE a BETWEEN (1, 10000) AND b BETWEEN (50000, 100000) ORDER BY b LIMIT 1
,从扫描行数上考虑,应该选择a
上的索引,但通过MySQL
执行计划发现,实际选择了b
索引。因为优化器考虑了需要根据b
排序,选择b
索引扫描获取记录可以避免再排序。但是,使用a
索引的查询耗时远比使用b
索引耗时低。
如何避免选错索引
强制使用索引
使用force Index(a)
强制SQL
执行时采用某个索引,比如SELECT * FROM t force Index(a) WHERE a BETWEEN (1, 10000) AND b BETWEEN (50000, 100000) ORDER BY b LIMIT 1
。
重新计算基数
因为MySQL
取样估计基数可能存在比较大的误差,导致优化器选择低效的执行方案。为了避免这个统计信息的问题,可以使用Analyze TABLE t
来重新统计信息。
选择更合适的索引或者删除误用的索引
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341