位置：首页-资讯-数据库

MySQL统计信息的存储有哪几种

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

这篇文章主要介绍MySQL统计信息的存储有哪几种，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！

MySQL统计信息的存储分为两种，非持久化和持久化统计信息。

一、非持久化统计信息

非持久化统计信息存储在内存里，如果数据库重启，统计信息将丢失。有两种方式可以设置为非持久化统计信息：

1 全局变量，

INNODB_STATS_PERSISTENT=OFF

2 CREATE/ALTER表的参数，

STATS_PERSISTENT=0

非持久化统计信息在以下情况会被自动更新：

1 执行ANALYZE TABLE

2 innodb_stats_on_metadata=ON情况下，执SHOW TABLE STATUS, SHOW INDEX, 查询 INFORMATION_SCHEMA下的TABLES, STATISTICS

3 启用--auto-rehash功能情况下，使用mysql client登录

4 表第一次被打开

5 距上一次更新统计信息，表1/16的数据被修改

非持久化统计信息的缺点显而易见，数据库重启后如果大量表开始更新统计信息，会对实例造成很大影响，所以目前都会使用持久化统计信息。

二、持久化统计信息

5.6.6开始，MySQL默认使用了持久化统计信息，即INNODB_STATS_PERSISTENT=ON，持久化统计信息保存在表mysql.innodb_table_stats和mysql.innodb_index_stats。

持久化统计信息在以下情况会被自动更新：

1 INNODB_STATS_AUTO_RECALC=ON

情况下，表中10%的数据被修改

2 增加新的索引

innodb_table_stats是表的统计信息，innodb_index_stats是索引的统计信息，各字段含义如下：

innodb_table_stats
database_name	数据库名
table_name	表名
last_update	统计信息最后一次更新时间
n_rows	表的行数
clustered_index_size	聚集索引的页的数量
sum_of_other_index_sizes	其他索引的页的数量

innodb_index_stats
database_name	数据库名
table_name	表名
index_name	索引名
last_update	统计信息最后一次更新时间
stat_name	统计信息名
stat_value	统计信息的值
sample_size	采样大小
stat_description	类型说明

为更好的理解innodb_index_stats，建一张测试表做说明：

CREATE TABLE t1 (
 a INT, b INT, c INT, d INT, e INT, f INT,
 PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)
) ENGINE=INNODB;

写入数据如下：

MySQL统计信息的存储有哪几种

查看t1表的统计信息，需主要关注stat_name和stat_value字段

MySQL统计信息的存储有哪几种

tat_name=size时：stat_value表示索引的页的数量

stat_name=n_leaf_pages时：stat_value表示叶子节点的数量

stat_name=n_diff_pfxNN时：stat_value表示索引字段上唯一值的数量，此处做一下具体说明：

1、n_diff_pfx01表示索引第一列distinct之后的数量，如PRIMARY的a列，只有一个值1，所以index_name='PRIMARY' and stat_name='n_diff_pfx01'时，stat_value=1。

2、n_diff_pfx02表示索引前两列distinct之后的数量，如i2uniq的e,f列，有4个值，所以index_name='i2uniq' and stat_name='n_diff_pfx02'时，stat_value=4。

3、对于非唯一索引，会在原有列之后加上主键索引，如index_name='i1' and stat_name='n_diff_pfx03'，在原索引列c,d后加了主键列a，(c,d,a)的distinct结果为2。

了解了stat_name和stat_value的具体含义，就可以协助我们排查SQL执行时为什么没有使用合适的索引，例如某个索引n_diff_pfxNN的stat_value远小于实际值，查询优化器认为该索引选择度较差，就有可能导致使用错误的索引。

三、统计信息不准确的处理

我们查看执行计划，发现未使用正确的索引，如果是innodb_index_stats中统计信息差别较大引起，可通过以下方式处理：

1、手动更新统计信息，注意执行过程中会加读锁：

ANALYZETABLE TABLE_NAME;

2、如果更新后统计信息仍不准确，可考虑增加表采样的数据页，两种方式可以修改：

a) 全局变量INNODB_STATS_PERSISTENT_SAMPLE_PAGES，默认为20；

b) 单个表可以指定该表的采样：

ALTER TABLE TABLE_NAME STATS_SAMPLE_PAGES=40;

经测试，此处STATS_SAMPLE_PAGES的最大值是65535，超出会报错。

目前MySQL并没有提供直方图的功能，某些情况下（如数据分布不均）仅仅更新统计信息不一定能得到准确的执行计划，只能通过index hint的方式指定索引。新版本8.0会增加直方图功能，让我们期待MySQL越来越强大的功能吧！

以上是“MySQL统计信息的存储有哪几种”这篇文章的所有内容，感谢各位的阅读！希望分享的内容对大家有帮助，更多相关知识，欢迎关注亿速云行业资讯频道！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

MySQL统计信息的存储有哪几种

下载Word文档到电脑，方便收藏和打印～

下载Word文档

MySQL统计信息的存储有哪几种

一、非持久化统计信息

二、持久化统计信息

三、统计信息不准确的处理

MySQL统计信息的存储有哪几种

相关文章

猜你喜欢

MySQL统计信息的存储有哪几种

kafka的存储方式有哪几种

mysql存储过程中错误处理有哪几种类型

MySQL InnoDB存储引擎更新Cardinality统计信息的策略分析

MySQL索引统计信息更新相关的参数有哪些

ASP 重定向的路径信息存储方法有哪些？

收集统计数据库信息的隐患有哪些

Oracle 11g系统自动收集统计信息的知识有哪些

PostgreSQL统计信息中相关的数据字典表有哪些

计算机中管理信息系统的主要功能有哪些

怎么样的Python脚本进行MySQL对所有表收集统计信息

Sqlserver关于统计信息自动创建自动更新的知识点有哪些

如何在MySQL中设计仓库管理系统的表结构来管理库存价格信息？

如何在MySQL中设计仓库管理系统的表结构来管理库存供应商信息？

SQL Server统计信息更新时采样百分比对数据预估准确性的影响有哪些

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复