我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Mysql大表全表查询的全过程(分析底层的数据流转过程)

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Mysql大表全表查询的全过程(分析底层的数据流转过程)

Mysql大表全表查询

当我们需要对一整张大表的数据执行全量查询操作,比如select * from t 没有where条件,整个数据有几千万条占用内存大概 100G,而Mysql所在服务器的内存只有8G,那就不直接OOM,将整个数据库打崩了吗?

刚开始开发的时候会有这样的疑问,但是随着时间的推移知道是不会打崩的,但是为什么不会崩,慢慢地就没有好奇心了。

下面对整个流程进行分析,主要的冲击点就是Mysql和InnoDB,所以下面还是分成两个部分进行分析。

下面的分析同样适用于所有的查询流程,只是其他查询操作流程更复杂,但是数据量无论大小都会按照下面的流程执行。

查询整张表其实就是查询 主键聚簇索引的那棵B+树,比如查询的就是InnoDB 表 db1. t。

查询和返回按照Java方式理解为 request和response流程,request查询流程可以理解为:Mysql架构图 ,即下面分析的是返回的流程:

1、Server层

Server层不会一次调用InnoDB存储引擎接口获取全量数据,也不是一次将所有数据发生给Mysql客户端,Mysql是边读边发送的,发送的过程中依赖两个缓存池:

  • Mysql的 net buffer,由参数 net_buffer_length控制,默认大小为 16K;即一个查询不论返回结果多大,读Mysql的影响就是 net_buffer_length大小。
  • 本地网络栈: Mysql服务器的 socket send buffer【默认配置在/proc/sys/net/core/wmem_default,当写满时,会暂停接受net buffer的数据】、 Mysql客户端的 socket receive buffer;

具体的查询执行流程如下:

  • 获取一行,写到 net buffer 中。这块内存的大小是由参数 net_buffer_length 定义的,默认是 16k。
  • 重复获取行,直到 net buffer 写满,调用网络接口发出去。
  • 如果发送成功,就清空 net buffer,然后继续取下一行,并写入 net buffer。
  • 如果发送函数返回 EAGAIN 或 WSAEWOULDblock,就表示本地网络栈(socket send buffer)写满了,进入等待。直到网络栈重新可写,再继续发送。

Mysql大表全表查询的全过程(分析底层的数据流转过程)

并且在此数据查询过程当前,底层的表现就是Mysql服务端的socket send buffer 和 Mysql客户端 socket receive buffer,在不停的发生和接收数据包,因为底层是tcp协议。

而从表象上看,执行 show processlist,查询到的结果为 Sending to client,所以不能简单的理解成发生数据给客户端,仅仅表示服务器端的网络栈写满了。

Mysql大表全表查询的全过程(分析底层的数据流转过程)

2、innoDB层

在前面博客分析了InnoDB的架构图,分为内存和磁盘架构。内存架构中最大的一块儿内存就是 Buffer Pool,可以占用到物理内存的 60~80%。

并且分析了针对当前这种大表查询流程,会将所有的B+树缓存页都在变种的 LRU缓存队列中过一遍。

所以Mysql将缓存链表分成young和old区,使用配置参数 innodb_old_blocks_time控制缓存页真正加入的young取余的条件。

即大表查询流程对innodb层的影响就是,将所有主键聚簇索引B+树上的页,全部在 Buffer Pool内部的 LRU链的 old区域全部执行一遍,当超过内存大小限制时,再从 old链的尾部出队列。流程图如下:

Mysql大表全表查询的全过程(分析底层的数据流转过程)

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网(www.lsjlt.com)。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Mysql大表全表查询的全过程(分析底层的数据流转过程)

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Mysql大表全表查询的全过程(分析底层的数据流转过程)

目录mysql大表全表查询1、Server层2、innoDB层总结Mysql大表全表查询当我们需要对一整张大表的数据执行全量查询操作,比如sejslect * from t 没有where条件,整个数据有几千万条占用内存大概 100G,而
Mysql大表全表查询的全过程(分析底层的数据流转过程)
2024-08-13

mysql与oracle通过存储过程查询数据库所有表的列总和

mysql数据库: delimiter // # 定义//为一句sql的结束标志,取消;的所代表的意义drop procedure if exists db_table_col_count; # 如果存在名字为db_table_col_count的proc
mysql与oracle通过存储过程查询数据库所有表的列总和
2020-01-06

Mybatis应用mysql存储过程查询数据的示例分析

小编给大家分享一下Mybatis应用mysql存储过程查询数据的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1.创建mysql存储过程,这是个复杂查询加
2023-05-30

编程热搜

目录