我的编程空间,编程开发者的网络收藏夹
学习永远不晚

MySQL统计信息的存储有哪几种

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

MySQL统计信息的存储有哪几种

这篇文章主要介绍MySQL统计信息的存储有哪几种,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

MySQL统计信息的存储分为两种,非持久化和持久化统计信息。

一、非持久化统计信息

非持久化统计信息存储在内存里,如果数据库重启,统计信息将丢失。有两种方式可以设置为非持久化统计信息:

1 全局变量,

INNODB_STATS_PERSISTENT=OFF

2 CREATE/ALTER表的参数,

STATS_PERSISTENT=0

非持久化统计信息在以下情况会被自动更新:

1 执行ANALYZE TABLE

2 innodb_stats_on_metadata=ON情况下,执SHOW TABLE STATUS, SHOW INDEX, 查询 INFORMATION_SCHEMA下的TABLES, STATISTICS

3 启用--auto-rehash功能情况下,使用mysql client登录

4 表第一次被打开

5 距上一次更新统计信息,表1/16的数据被修改

非持久化统计信息的缺点显而易见,数据库重启后如果大量表开始更新统计信息,会对实例造成很大影响,所以目前都会使用持久化统计信息。

二、持久化统计信息

5.6.6开始,MySQL默认使用了持久化统计信息,即INNODB_STATS_PERSISTENT=ON,持久化统计信息保存在表mysql.innodb_table_stats和mysql.innodb_index_stats。

持久化统计信息在以下情况会被自动更新:

1 INNODB_STATS_AUTO_RECALC=ON

情况下,表中10%的数据被修改

2 增加新的索引

innodb_table_stats是表的统计信息,innodb_index_stats是索引的统计信息,各字段含义如下:

innodb_table_stats

database_name

数据库名

table_name

表名

last_update

统计信息最后一次更新时间

n_rows

表的行数

clustered_index_size

聚集索引的页的数量

sum_of_other_index_sizes

其他索引的页的数量

innodb_index_stats

database_name

数据库名

table_name

表名

index_name

索引名

last_update

统计信息最后一次更新时间

stat_name

统计信息名

stat_value

统计信息的值

sample_size

采样大小

stat_description

类型说明

为更好的理解innodb_index_stats,建一张测试表做说明:

CREATE TABLE t1 (
 a INT, b INT, c INT, d INT, e INT, f INT,
 PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)
) ENGINE=INNODB;

写入数据如下:

MySQL统计信息的存储有哪几种

查看t1表的统计信息,需主要关注stat_name和stat_value字段

MySQL统计信息的存储有哪几种

tat_name=size时:stat_value表示索引的页的数量

stat_name=n_leaf_pages时:stat_value表示叶子节点的数量

stat_name=n_diff_pfxNN时:stat_value表示索引字段上唯一值的数量,此处做一下具体说明:

1、n_diff_pfx01表示索引第一列distinct之后的数量,如PRIMARY的a列,只有一个值1,所以index_name='PRIMARY' and stat_name='n_diff_pfx01'时,stat_value=1。

2、n_diff_pfx02表示索引前两列distinct之后的数量,如i2uniq的e,f列,有4个值,所以index_name='i2uniq' and stat_name='n_diff_pfx02'时,stat_value=4。

3、对于非唯一索引,会在原有列之后加上主键索引,如index_name='i1' and stat_name='n_diff_pfx03',在原索引列c,d后加了主键列a,(c,d,a)的distinct结果为2。

了解了stat_name和stat_value的具体含义,就可以协助我们排查SQL执行时为什么没有使用合适的索引,例如某个索引n_diff_pfxNN的stat_value远小于实际值,查询优化器认为该索引选择度较差,就有可能导致使用错误的索引。

三、统计信息不准确的处理

我们查看执行计划,发现未使用正确的索引,如果是innodb_index_stats中统计信息差别较大引起,可通过以下方式处理:

1、手动更新统计信息,注意执行过程中会加读锁:

ANALYZETABLE TABLE_NAME;

2、如果更新后统计信息仍不准确,可考虑增加表采样的数据页,两种方式可以修改:

a) 全局变量INNODB_STATS_PERSISTENT_SAMPLE_PAGES,默认为20;

b) 单个表可以指定该表的采样:

ALTER TABLE TABLE_NAME STATS_SAMPLE_PAGES=40;

经测试,此处STATS_SAMPLE_PAGES的最大值是65535,超出会报错。

目前MySQL并没有提供直方图的功能,某些情况下(如数据分布不均)仅仅更新统计信息不一定能得到准确的执行计划,只能通过index hint的方式指定索引。新版本8.0会增加直方图功能,让我们期待MySQL越来越强大的功能吧!

以上是“MySQL统计信息的存储有哪几种”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注亿速云行业资讯频道!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

MySQL统计信息的存储有哪几种

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

kafka的存储方式有哪几种

Kafka的存储方式主要有两种:持久化存储方式:Kafka使用持久化存储方式将消息持久化到磁盘上,确保消息的可靠性。Kafka使用分段日志的方式来存储消息,每个主题都会被分成多个分区,每个分区都是一个有序的消息日志。Kafka使用两种索引结
2023-10-27

mysql存储过程中错误处理有哪几种类型

mysql 存储过程错误处理提供以下几种类型:begin...end 块:发生错误时回滚事务,不执行后续语句。error 语句:手动引发错误,指定错误代码和消息。signal 语句:从自定义错误处理例程引发错误,发送错误代码和消息。hand
mysql存储过程中错误处理有哪几种类型
2024-04-22

计算机中管理信息系统的主要功能有哪些

小编给大家分享一下计算机中管理信息系统的主要功能有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!管理信息系统的主要功能:1、数据处理功能;2、预测功能,根据过
2023-06-14

如何在MySQL中设计仓库管理系统的表结构来管理库存价格信息?

如何在MySQL中设计仓库管理系统的表结构来管理库存价格信息?在仓库管理系统中,库存价格的管理对于企业的运营十分重要。为了有效管理库存价格信息,在设计MySQL数据库的表结构时,需要考虑以下几个方面:仓库管理、商品管理、库存管理以及价格管理
如何在MySQL中设计仓库管理系统的表结构来管理库存价格信息?
2023-10-31

如何在MySQL中设计仓库管理系统的表结构来管理库存供应商信息?

如何在MySQL中设计仓库管理系统的表结构来管理库存供应商信息?在一个仓库管理系统中,库存供应商信息的管理是非常重要的一部分。在MySQL中,可以通过设计合适的表结构来存储和管理这些信息。本文将介绍如何在MySQL中设计表结构来管理库存供应
如何在MySQL中设计仓库管理系统的表结构来管理库存供应商信息?
2023-10-31

编程热搜

目录