我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Mysql 适合单表的数据量是多少

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Mysql 适合单表的数据量是多少

Mysql 适合单表的数据量是多少,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

影响 Mysql 单表的最优最大数量的一个重要因素其实是索引。

我们知道 Mysql 的主要存储引擎 InnoDB 采用 B+树结构索引。(至于为什么 Mysql 选择  b+树而不是其他数据结构来组织索引,不是本文讨论的话题,之后的文章会讲到。)那么 B+树索引是如何影响 Mysql 单表数据量的呢?

B+树

一棵 B+树如下所示:

Mysql 适合单表的数据量是多少

Mysql 的 B+树索引存储在磁盘上,Mysql 每次读取磁盘 Page 的大小是  16KB,为了保证每次查询的效率,需要保证每次查询访问磁盘的次数,一般设计为 2-3 次磁盘访问,再多性能将严重不足。Mysql  B+树索引的每个节点需要存储一个指针(8Byte)和一个键值(8Byte)。因此计算16KB/(8B+8B)=1K 16KB 可以存储 1K 个节点,3  次磁盘访问(即 B+树 3 的深度)可以存储 1K _ 1K _ 1K 即 10 亿数据。

如果查询依赖非主键索引,那么还涉及二级索引。这样数据量将更小。

拆分

分而治之——没有什么问题不能通过拆分一次来解决,不行就拆多次。

Mysql 单表存储的数据量有限。一个解决大数据量存储的办法就是分库分表。说白了就是一个数据库一张表放不下那么多数据,那就分多个数据库多张表存储。

拆分可分为垂直拆分和水平拆分。

垂直拆分是按照不同的表(或者  Schema)来切分到不同的数据库(主机)之上,水平拆分则是根据表中的数据的逻辑关系,将同一个表中的数据按照某种条件拆分到多台数据库(主机)上面或多张相同  Schema 的不同表中。

垂直拆分的最大特点就是规则简单,实施也更为方便,尤其适合各业务之间的耦合度非常低,相互影响很小,业务逻辑非常清晰的系统。在这种系统中,可以很容易做到将不同业务模块所使用的表分拆到不同的数据库中。根据不同的表来进行拆分,对应用程序的影响也更小,拆分规则也会比较简单清晰。

水平拆分与垂直切分相比,相对来说稍微复杂一些。因为要将同一个表中的不同数据拆分到不同的数据库中,对于应用程序来说,拆分规则本身就较根据表名来拆分更为复杂,后期的数据维护也会更为复杂一些。

垂直拆分最直接的就是按领域拆分服务,隔离领域数据库。如此每个库所承担的数据压力就减少了。

水平拆分就是将同一个 Schema  的数据拆分到不同的库或不同的表中,这样每个表的数据量也将减小,查询效率将更高效。水平拆分就涉及到表的分片规则问题。

几种典型的分片规则包括:

按照用户 ID 求模,将数据分散到不同的数据库,具有相同数据用户的数据都被分散到一个库中。

按照日期,将不同月甚至日的数据分散到不同的库中。

按照某个特定的字段求摸,或者根据特定范围段分散到不同的库中。

实现

门面模式——没有什么问题不能通过添加一个中间层来解决。

垂直拆分的一个方案就是在应用层使用多个数据源,按业务访问不同的数据源。另外更好方案其实就是微服务化。按不同的业务领域来拆分微服务,明确领域边界,隔离领域数据库。这样将对数据的存取内聚到独立的服务之中,对外提供统一的接口。在需要同时依赖多个服务时,我们可以通过添加门面应用来组合底层服务的数据,以提供更符合上层业务需求的接口,这些服务往往更接近真实的业务。而底层的服务则是更加内聚的资源服务。

代理模式——没有什么问题不能通过添加一个中间层来解决。

对于水平拆分应该尽量屏蔽拆分带来的数据访问困恼,为了让上层业务无需关心下层数据组织方式。水平拆分往往通过添加一个代理层来做这些事情,代理层对上提供虚拟表,这些虚拟表就像我们在单库上设计的单表一样;代理层对下解析和拆分执行  sql,然后按相应规则在不同的库和表执行相应的 sql 请求,再合并数据,并将合并后的结果返回给上层调用者。

一般代理方式分为如下两种:

进程内代理进程内代理即将代理层嵌入到业务服务内部,拦截 sql 请求并做相应的处理。这样的好处是简单,但是侵入性大,且不够灵活。

Mysql 适合单表的数据量是多少

进程外代理进程外代理即将代理独立成服务,代理真实业务服务和数据库之间的请求。这样是比较复杂的,需要高可用的代理服务架构。但是这样对业务的侵入性低,且易于升级扩展。

Mysql 适合单表的数据量是多少

问题

分布式事务问题

什么是分布式事务?本地事务的定义就是一系列相关的数据库操作完成后要满足 ACID  四大特性,而分布式事务就是将同一进程的操作放到不同的微服务进程中,即不同微服务应用进程的数据库操作满足事务要求,或者对不同数据库的一系列操作需满足事务要求。

这里就有两个问题需要解决。一个是因为应用的分布式造成的,一个是因为数据库本身的分布式造成的。数据库本身的分布式事务问题一般由数据库自身解决,大多数分布式数据库都可以做到一定的数据一致性保证,如  HBase 保证的强一致性,Cassandra 保证的最终一致性。

应用数据的一致性事务方案我们也可以参考分布式数据库的实现原理来实现。业界也有很多分布式事务的解决思路,如:

  • XA 方案

  • TCC 方案

  • 本地消息表

  • 可靠消息最终一致性方案

  • 最大努力通知方案

多表 Join 问题

通过分析 Join sql,将 sql 拆分成独立的查询请求,然后分别执行,并将结果合并计算返回给调用者。这个地方会涉及到很多执行优化的问题。

数据统计问题

当数据被分片到不同的数据库或不同的表中时,要对数据做一些全局的或涉及大量数据的统计时便会遇到一些问题。如求 Max,Min,Sum  等聚合问题。如果统计的数据有一定的业务规则,如只会按用户维度去统计,如统计某个用户的订单量,那么对订单表的分片,其实可以采用按用户 id  来分片,如此就可以解决这类统计问题。但是这种方案不通用。很多分片代理服务都需要将 sql 分片到不同的节点上去执行,然后再合并结果返回。

ID 问题

使用分库分表之后,就无法使用 Mysql 的表自增作为 id,因为不同库和表的自增将出现冲突的 id。解决这个问题就需要引入分布式 id  生成技术。

关于Mysql 适合单表的数据量是多少问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Mysql 适合单表的数据量是多少

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

MySQL一张表能存的数据是多少

这篇“MySQL一张表能存的数据是多少”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“MySQL一张表能存的数据是多少”文章吧
2023-02-02

Mysql中的单表最大记录是多少

这篇文章主要介绍了Mysql中的单表最大记录是多少问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-02-18

轻量应用服务器峰值带宽是多少合适的

轻量应用服务器峰值带宽应该取决于具体应用场景和应用程序的需求。对于需要大规模并行处理任务的应用程序来说,峰值带宽通常需要超过20-30G的带宽,而对于需要快速响应和实时处理数据的应用程序来说,峰值带宽通常需要达到100-200G的带宽。在处理大规模的数据时,轻量应用服务器可以将峰值带宽提高到50-100G,而对于处理小规模数据集的应用程序,轻量应用服务器通常可以将峰值带宽提高到50-80G,
2023-10-26

MYSQL单表数据量达到多少时性能会严重下降的问题探讨!

不知从什么时候开始,有着MySQL单表数据量超过2000万性能急剧下降的说法。 在中国互联网技术圈流传着这么一个说法:MySQL 单表数据量大于 2000 万行,性能会明显下降。事实上,这个传闻据说最早起源于百度。具体情况大概是这样的,当年
2023-08-19

MySQL如何统计多张表的数据量

要统计多张表的数据量,可以使用以下MySQL语句:SELECTTABLE_NAME,TABLE_ROWSFROMinformation_schema.TABLESWHERETABLE_SCHEMA = 'your_datab
MySQL如何统计多张表的数据量
2024-04-17

云服务器的数据库最大并发量是多少

一、服务器硬件配置服务器硬件配置是云服务器数据库最大并发量的重要因素之一。云服务器的硬件配置可以分为多个等级,从低到高分别为CPU、内存、硬盘等。CPU是云服务器的核心,其性能直接影响到数据库的处理能力和并发处理能力,因此云服务器的CPU配置需要足够强大,可以支持数千个并发用户同时访问。内存则是云服务器的“缓存”,用于保存数据库中的数据,并提高数据库的响应速度,因此云服务器的内存容量需要足够大,可...
2023-10-27

合理的Golang数据库连接池大小设置是多少?

Golang是一种快速、简单、高效的编程语言,越来越多的开发者选择使用Golang进行数据库开发。然而,在进行数据库操作时,使用连接池可以提高性能和效率。那么在Golang中,设置多少个连接池是合理的呢?本文将围绕这个问题展开讨论。连接池
合理的Golang数据库连接池大小设置是多少?
2024-01-29

什么是适合表示带有道岔的铁路的数据结构?

本篇文章给大家分享《什么是适合表示带有道岔的铁路的数据结构?》,覆盖了Golang的常见基础知识,其实一个语言的全部知识点一篇文章是不可能说完的,但希望通过这些问题,让读者对自己的掌握程度有一定的认识(B 数),从而弥补自己的不足,更好的掌
什么是适合表示带有道岔的铁路的数据结构?
2024-04-04

mysql数据库恢复单个表的方法是什么

恢复MySQL数据库中的单个表,可以使用以下方法:使用备份文件:如果你有数据库的备份文件,可以通过将备份文件中的表导入到现有的数据库中,来恢复单个表。可以使用MySQL命令行或者图形界面工具(如phpMyAdmin)导入备份文件。使用SEL
mysql数据库恢复单个表的方法是什么
2024-04-09

MySQL中最适合用于性别字段的数据类型是什么?

在MySQL中,最适合用于性别字段的数据类型是ENUM枚举类型。ENUM枚举类型是一种允许定义一组可能取值的数据类型,性别字段适合使用ENUM类型是因为性别通常仅有两个取值,即男和女。接下来,我将通过具体的代码示例来展示如何在MySQL中
MySQL中最适合用于性别字段的数据类型是什么?
2024-03-15

mysql单表千万级数据查询的方法是什么

在处理千万级数据的单表查询时,可以采取以下方法来提高查询效率:使用合适的索引:在主键字段和经常用于查询的字段上创建索引,可以加快查询速度。但是要注意索引也会占用存储空间,并且会增加更新和插入操作的时间。避免全表扫描:尽量避免使用没有索引的字
mysql单表千万级数据查询的方法是什么
2024-03-02

如何在学习大数据技术时选择合适的数据库引擎?MySQL还是Oracle?

如何在学习大数据技术时选择合适的数据库引擎?MySQL还是Oracle?在当今数据爆炸的时代,大数据技术已经成为了企业发展和决策的重要组成部分。而作为大数据技术的核心,数据库引擎的选择更是至关重要的。在众多数据库引擎中,MySQL和Orac
2023-10-22

学大数据技术到底是该学MySQL还是该学Oracle?如何选择适合自己的数据库技术?

学大数据技术到底是该学MySQL还是该学Oracle?如何选择适合自己的数据库技术?随着大数据时代的到来,数据库技术在处理大量数据和复杂查询方面起着至关重要的作用。MySQL和Oracle作为两个常见的关系型数据库系统,在大数据领域中有着广
2023-10-22

编程热搜

目录