我的编程空间,编程开发者的网络收藏夹
学习永远不晚

MySQL 树形索引结构 B树 B+树 - G

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

MySQL 树形索引结构 B树 B+树 - G

MySQL 树形索引结构 B树 B+树 - G

MySQL 树形索引结构 B树 B+树

 

如何评估适合索引的数据结构

  • 索引的本质是一种数据结构
  • 内存只是临时存储,容量有限且容易丢失数据。因此我们需要将数据放在硬盘上。
  • 在硬盘上进行查询时也就产生了硬盘的I/O操作,而硬盘的I/O存取消耗的时间要比读取内存大很多。因此数据查询的时间主要决定于I/O操作的次数
  • 每访问一次节点就需要对磁盘进行一次I/O操作

 

树模型

二分查找的时间复杂度是O(log2n),是一种很高效的查询方式。在一系类树种使用二分查找的树有很多,但并不是所有树都适合作为索引的结构。

 

Binary Search Tree 二叉搜索树(BST)

性质:

  • 对任意节点,左子树不为空则左子树所有节点小于或等于该节点的值
  • 对任意节点,右子树不为空则右子树所有节点大于或等于该节点的值

但二叉搜索树不一定是"平衡的",它有可能退化成一条链表,那么他的搜索时间就变成了O(n)。

 

平衡二叉搜索树(AVL)

为了避免退化成一条链表,人们提出了二叉搜索树,AVL在二叉搜索树的基础上增加了约束:

每个节点的左子树和右子树的高度差不能超过1

也就是说要求节点的左右子树仍然为平衡二叉树。

常见的平衡二叉树有很多种,包括了AVL树、红黑树、数堆、伸展树。AVL树是最早提出来的自AVL树,当我们提到平衡二叉树时一般指的就是AVL树

左右平衡后就使得搜索时间复杂度能稳定在O(log2n)。

但是即便在理论上它的搜索效率高且比较稳定,但是由于“每访问一次节点就需要进行一次磁盘I/O操作”,在实际情况中只有两个子节点的情况下,树的高度依然有可能会很高,比如说现有一个五层共31个节点的树,那么我们需要进行5次I/O操作。

 

B Tree

既然"二叉"结构可能让树变得很高,那么我们自然而然地就明白可以让子节点数变得更多来减少I/O次数。在文件系统和部分数据库系统中,B树就已经得到了实际的应用。

如图所示,B树有如下性质

  • B树也是平衡的,每个节点可以有M个子节点,M也称为B树的阶

  • 每个磁盘块都包含着关键字和指针,有k-1个关键字,那么就有k个指针,也就是k个子节点。也就等同于子节点的数量=关键字数量+1

  • 所有子节点都在同一层,且每个叶子节点没有子节点,只包含k-1个关键字

  • 子节点和非子节点都即保存数据记录又保存索引。

  • k-1个关键字相当于划分出了k个范围,每个范围对应一个指针。

    例如,有关键字Key[1], Key[2], …, Key[k-1],且关键字按照升序排序

    它们划分出k个范围对应k个指针,P[1], P[2], …, P[k]

    对应关系就是:P[1]指向关键字小于 Key[1]的子树,P[i]指向关键字属于 (Key[i-1], Key[i]) 的子树,P[k]指向关键字大于 Key[k-1]的子树

在B树上的搜索过程就是:

  • 要找目标关键字n,那么就从根节点开始,不断在树的每一层的每两个相邻关键字划定的范围中寻找包含目标关键字的节点,顺着索引一直寻找,直到某节点中关键字与目标关键字相同。

这里说的关键字在实际的数据库中,其实就是一条实际的数据或者主键值,详细可见此处

MongoDB内部使用的就是B树

 

B+ Tree

主流的RDMS大多采用B+树作为索引结构,包括MySQL的InnoDB引擎(不同存储引擎的索引的工作方式并不一样。而即使多个存储引擎支持同一种类型的索引,其底层的实现也可能不同)

在数据结构性质上与B树不同的是:

  • 有K个孩子就有k个关键字。通俗来讲,B树是给每一个范围一个指针,而B+树是给每个子节点直接给一个指针。
  • 只有叶子节点保存数据记录,非叶子节点仅用于索引
  • 所有关键字都在叶子节点中。每层子节点的关键字也会保存在下一层子节点中且是子节点关键字中最大或最小的那一个,这样到最后,所有关键字都集合在叶子节点中。
  • 叶子节点之间会按照关键字的大小从小到大,使用双向链表进行串联。支持了区间查询。

 

B+树 vs B树

上面说了两种数据结构性质上的不同,下面里对比下实际生产中两种索引结构的区别。

  • B+树查询效率更稳定

    B+树所有的数据记录都在叶子节点,而B树的数据记录可能在叶子节点也可能在非叶子节点,这样就会导致查询效率的不稳定。

  • B+树查询效率更高

    B+树的内部节点并没有指向关键字具体信息的指针,因此其内部节点相对B树更小。那么盘块所能容纳的关键字数量也越多,一次性读入内存的需要查找的关键字也就越多,相对IO读写次数就降低了。

  • B+树的范围查询效率更高

    B+树所有叶子节点都通过双向链表进行查询,方便范围查询。

    而B树因为在非叶子节点中也存有数据记录,因此范围查询时需要通过对树的中序遍历才能完成

 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

MySQL 树形索引结构 B树 B+树 - G

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

MySQL 树形索引结构 B树 B+树 - G

MySQL 树形索引结构 B树 B+树 如何评估适合索引的数据结构索引的本质是一种数据结构内存只是临时存储,容量有限且容易丢失数据。因此我们需要将数据放在硬盘上。在硬盘上进行查询时也就产生了硬盘的I/O操作,而硬盘的I/O存取消耗的时间要比读取内存大很多。因此
MySQL 树形索引结构 B树 B+树 - G
2021-08-06

MySQL索引:B+树索引

MySQL索引:B+树索引B+树索引是传统意义上的索引,这是目前关系型数据库系统中查找最为常用和最为有效的索引。B+树索引的构造类似于二叉树,根据键值快速找到数据B树B+树是由B树演化而来的,在了解B+树之前,我们需要对B树有一点认知。B树全称Balance-
MySQL索引:B+树索引
2021-09-01

B+树索引

https://www.iteye.com/blog/zhuyuehua-1872202 1.索引结构        1.1 B+树索引结构       从物理上说,索引通常可以分为:分区和非分区索引、常规B树索引、位图(bitmap)索引、翻转(revers
B+树索引
2022-04-10

B树索引

https://www.cnblogs.com/xqzt/p/4456746.html  B-Tree索引是最常见的索引结构,默认创建的索引就是B-Tree索引。一、B树索引的结构B-树索引是基于二叉树结构的。B-树索引结构有3个基本组成部分:根节点、分支节点
B树索引
2014-08-16

MySQL中B树索引和B+树索引的区别是什么

本文小编为大家详细介绍“MySQL中B树索引和B+树索引的区别是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“MySQL中B树索引和B+树索引的区别是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。如果用
2023-06-29

MySQL索引的数据结构-B+树介绍

1.聚集索引和辅助索引在数据库中,B+树的高度一般都在24层,这也就是说查找某一个键值的行记录时最多只需要2到4次IO,这倒不错。因为当前一般的机械硬盘每秒至少可以做100次IO,24次的IO意味着查询时间只需要0.02~0.04秒。数据库中的B+树索引可以分
MySQL索引的数据结构-B+树介绍
2017-02-08

MySQL用B+树(而不是B树)做索引的原因

https://www.jianshu.com/p/7ce804f97967众所周知,MySQL的索引使用了B+树的数据结构。那么为什么不用B树呢?先看一下B树和B+树的区别。1.B树维基百科对B树的定义为“在计算机科学中,B树(B-tree)是一种树状数据结
MySQL用B+树(而不是B树)做索引的原因
2020-03-03

MySQL中InnoDB索引数据结构(B+树)详解

mysql的innodb的索引的B+树逐步讲解 B树B+树B树和B+树的不同点聚集索引 VS 非聚集索引总结(面试题)1.为什么不使用二叉查找树?2.为什么不使用平衡二叉树?3.为什么不使用B树?4.为什么MySQL选择B+树做索引
2023-08-17

浅析MySQL索引结构采用B+树的问题

目录1、B树和B+树2、原因分析3、总结一位6年经验的小伙伴去字节面试的时候被问到这样一个问题,为什么mysql索引结构要采用B+树?这位小伙伴从来就没有思考过这个问题。只因为现在都这么卷,后面还特意查了很多资料,他也希望听听我的见解。另
2022-06-21

索引原理及B树索引

索引原理及B树索引http://hongyitong.github.io/2017/01/05/%E7%B4%A2%E5%BC%95%E5%8E%9F%E7%90%86%E5%8F%8AB%E6%A0%91%E7%B4%A2%E5%BC%95/一、索引的原理说
索引原理及B树索引
2020-03-30

MySQL用B+树作为索引结构有什么好处

前言在MySQL中,无论是Innodb还是MyIsam,都使用了B+树作索引结构(这里不考虑hash等其他索引)。本文将从最普通的二叉查找树开始,逐步说明各种树解决的问题以及面临的新问题,从而说明MySQL为什么选择B+树作为索引结构。 一
2022-05-18

MySQL-InnoDB为什么采用B+树结构实现索引

索引的作用是提高查询效率,其实现方式有很多种,常见的索引模型有哈希表、有序列表、搜索树等。 哈希表 一种以key-value键值对的方式存储数据的结构,通过指定的key可以找到对应的value。 哈希把值放在数组里,用一个哈希函数把key换算成一个确定位
MySQL-InnoDB为什么采用B+树结构实现索引
2018-07-22

为什么MySQL用B+树做索引

索引这个词,相信大多数人已经相当熟悉了,很多人都知道MySQL的索引主要以B+树为主,但是要问到为什么用B+树,恐怕很少有人能把前因后果讲述的很完整。本文就来从头到尾介绍下数据库的索引。 索引是一种数据结构,用于帮助我们在大量数据中快速定位到我们想要查找的数据
为什么MySQL用B+树做索引
2017-02-01

编程热搜

目录