我的编程空间,编程开发者的网络收藏夹
学习永远不晚

聊聊MySQL的COUNT(*)的性能

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

聊聊MySQL的COUNT(*)的性能

前言

基本职场上的程序员用来统计数据库表的行数都会使用count(*),count(1)或者count(主键),那么它们之间的区别和性能你又是否了解呢?

其实程序员在开发的过程中,在一张大表上统计总行数是非常耗时的一个操作,那么我们应该用哪个方法统计会更快呢?

接下来我们就来聊一聊MySQL中统计总行数的方法和性能。

count(*),count(1),count(主键)哪个更快?

建表并且插入1000万条数据进行实验测试:


# 创建测试表
CREATE TABLE `t6` (
 `id` int(11) NOT NULL AUTO_INCREMENT,
 `name` varchar(50) NOT NULL,
 `status` tinyint(4) NOT NULL,
 PRIMARY KEY (`id`),
 KEY `idx_status` (`status`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

# 创建存储过程插入1000w数据
CREATE PROCEDURE insert_1000w()
BEGIN
  DECLARE i INT;
  SET i=1;
  WHILE i<=10000000 DO
    INSERT INTO t6(name,status) VALUES('god-jiang-666',1);
    SET i=i+1;
  END WHILE;
END;

#调用存储过程,插入1000万行数据
call insert_1000w();

分析实验结果


# 花了0.572秒
select count(*) from t6;

在这里插入图片描述


# 花了0.572秒
select count(1) from t6;

在这里插入图片描述


# 花了0.580秒
select count(id) from t6;

在这里插入图片描述


# 花了0.620秒
select count(*) from t6 force index (primary);

在这里插入图片描述

从上面的实验我们可以得出,count(*)和count(1)是最快的,其次是count(id),最慢的是count使用了强制主键的情况。

下面我们继续测试一下它们各自的执行计划:


explain select count(*) from t6;
show warnings;

在这里插入图片描述

在这里插入图片描述


explain select count(1) from t6;
show warnings;

在这里插入图片描述

在这里插入图片描述


explain select count(id) from t6;
show warnings;

在这里插入图片描述

在这里插入图片描述


explain select count(*) from t6 force index (primary);
show warnings;

在这里插入图片描述

在这里插入图片描述

从上面的实验可以得出这三点:

  1. count(*)被MySQL查询优化器改写成了count(0),并选择了idx_status索引
  2. count(1)和count(id)都选择了idx_statux索引
  3. 加了force index(primary)之后,走了强制索引

这个idx_status就是相当于是二级辅助索引树,目的就是为了说明: InnoDB在处理count(*)的时候,有辅助索引树的情况下,会优先选择辅助索引树来统计总行数。

为了验证count(*)会优先选择辅助索引树这个结论,我们继续来看看下面的实验:


# 删除idx_status索引,继续执行count(*)
alter table t6 drop index idx_status;

explain select count(*) from t6;

在这里插入图片描述

从以上实验可以得出,删除了idx_status这个辅助索引树,count(*)就会选择走主键索引。所以结论:count(*)会优先选择辅助索引,假如没有辅助索引的存在,就会走主键索引。

为什么count(*)会优先选择辅助索引?

在MySQL5.7.18之前,InnoDB通过扫描聚集索引来处理count(*)语句。

从MySQL5.7.18开始,InnoDB通过遍历最小的可用二级索引来处理count(*)语句。如果不存在二级索引,则扫描聚集索引。

新版本为何会使用二级索引来处理count(*)呢?

因为InnoDB二级索引树的叶子节点上存放的是主键,而主键索引树的叶子节点存放的是整行数据,所以二级索引树比主键索引树小。因此查询优化器基于成本考虑,优先选择的是二级索引。所以索引count(*)快于count(主键)。

总结

这篇文章的结论就是count(*)=count(1)>count(id)

为什么count(id)走了主键索引还会更慢呢?因为count(id)需要取出主键,然后判断不为空,再累加,代价更高。

count(*)是会总计出所有NOT NULL和NULL的字段,而count(id)是不会统计NULL字段的,所以我们在建表的尽量使用NOT NULL并且给它一个默认是空即可。

最后,在以后总计数据库表的总行数的时候,可以大胆的使用count(*)或者count(1)。

参考资料

  • 《高性能MySQL》(第三版)第六章优化COUNT()查询
  • 《MySQL实战45讲》林晓斌

到此这篇关于聊聊MySQL的COUNT(*)的性能的文章就介绍到这了,更多相关MySQL COUNT(*)内容请搜索自学编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持自学编程网!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

聊聊MySQL的COUNT(*)的性能

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

聊聊MySQL的COUNT(*)的性能

前言 基本职场上的程序员用来统计数据库表的行数都会使用count(*),count(1)或者count(主键),那么它们之间的区别和性能你又是否了解呢? 其实程序员在开发的过程中,在一张大表上统计总行数是非常耗时的一个操作,那么我们应该用哪
2022-05-25

聊一聊关于MySQL的count(*)

2. count(*)的实现方式据说,MyISAM 引擎把一个表的总行数存在了磁盘上,因此执行 count(*) 的时候会直接返回这个数,效率很高。而我们的mysql一般都是用Innodb的引擎,Innodb是怎么实现count操作的呢?InnoDB 引擎就比
聊一聊关于MySQL的count(*)
2020-12-23

聊聊MySQL中的参数

前言: 在前面一些文章中,经常能看到介绍某某参数的作用,可能有些小伙伴仍搞不清楚 MySQL 参数是啥。本篇文章我们来聊聊 MySQL 参数,学习下如何管理维护 MySQL 参数。 1.MySQL参数概念 我们所说的参数在官方文档中称为 系
2022-05-29

聊聊MySQL事务的特性和隔离级别

网上对于此类的文章已经十分饱和了,那还写的原因很简单——作为自己的理解笔记。 前言 此篇文章作为自己学习MySQL的一些个人理解,使用的引擎是InnoDb。首先先讲讲事务的概念,在《高性能MySQL》第三版中其对事务的描述是这样的:事务就是
2022-05-11

聊聊daos高性能分布式存储

DAOs(分布式自治组织)是一种新兴的组织形式,它使用区块链技术实现了去中心化的决策和运营。在DAOs中,成员可以通过投票来制定组织的决策,并且通过智能合约来执行这些决策。这种组织形式具有很高的灵活性和透明度,可以在没有中心化机构的情况下进
2023-09-21

一文聊聊php5.6的特性【总结】

本篇文章带大家聊聊php5.6的特性(常量作为函数参数默认值、可变函数参数、命名空间等等),有需要的可以看看,希望对大家有所帮助!更好的常量定义常量时允许使用之前定义的常量进行计算:const A = 2;const B = A + 1;class C{ const STR = "hello"; const STR2 = self::STR + ", world";}允许常量作为函数参数
2022-08-08

一文聊聊php5.4的特性【总结】

本篇文章带大家聊聊php5.4的特性(Short Open Tag、数组简写形式、Traits等等),有需要的可以看看,希望对大家有所帮助!Short Open TagShort Open Tag 自 PHP5.4 起总是可用。在这里集中讲一下有关 PHP 起止标签的问题。即:通常就是上面的形式,除此之外还有一种简写形式:还可以
2022-08-08

聊聊MySQL中的存储引擎

基础知识在关系型数据库中每一个数据表相当于一个文件,而不同的存储引擎则会构建出不同的表类型。存储引擎的作用是规定数据表如何存储数据,如何为存储的数据建立索引以及如何支持更新、查询等技术的实现。在Oracle以及SqlServer等数据库中只
2022-05-23

聊聊Vue中的计算属性computed

computed 是基于它的依赖缓存,只有在它的相关依赖发生改变时才会进行更新。官方文档是这样说的:对于任何包含响应式数据的复杂逻辑,你都应该使用计算属性。
2022-11-22

深入聊聊gitee中的极化功能

随着开源技术的日益发展,越来越多的开发者开始使用Gitee来管理和分享他们的代码。作为一个开发者,如何更好地利用Gitee提高自己的开发效率和项目贡献呢?其中之一就是要学会如何看极化。一、Gitee的极化概念Gitee的极化是指将代码库中的
2023-10-22

聊聊GitLab关闭部分功能的背景

随着越来越多的开发者使用GitLab来管理其代码库,GitLab作为一款领先的源代码管理平台,也逐渐成为了软件行业的核心工具之一。但是最近,GitLab宣布关闭部分功能以提高服务稳定性和安全性,引起了广泛关注。本文将详细介绍GitLab关闭
2023-10-22

编程热搜

目录