0

0

深入聊聊mysql索引为什么采用B+树结构

青灯夜游

青灯夜游

发布时间:2021-09-28 19:52:03

|

2593人浏览过

|

来源于掘金社区

转载

本篇文章是mysql的进阶学习,介绍一下mysql使用b+树作为索引数据结构的原因,希望对大家有所帮助!

深入聊聊mysql索引为什么采用B+树结构

索引提高查询效率,就像我们看的书,想要直接翻到某一章,是不是不用一页一页的翻,只需要看下目录,根据目录找到其所在的页数即可。【相关推荐:mysql视频教程

在计算机中我们需要一种数据结构来存储这个目录,常见数据结构有哈希表,二叉查找树,二叉平衡树(AVL),红黑树,那为什么Innodb和MyISAM选择b+树呢。

1. 哈希表
哈希表就是一个数组+链表,用下标0,1,2,3..... 表示其数据所在的位置。如果想要在哈希表中存放数据,首先用对这个数据进行散列算法(基本的就是取模运算),假如数组长度是13 ,进行模13之后是0-12,正好对应的数据的下标,如果计算出的下标一样的,就会在下标位置跟上链表。

缺点:

  1. 利用hash存储需要将所有的数据文件添加到内存,比较消耗内存空间。
  2. hash的查找是等值查询,速度很快,但是各个数据间没有范围规律,但在实际工作中更多的是范围查询,hash就不太合适了。

不能直接说mysql不使用哈希表,而是要根据存储引擎来确定的,Memory存储引擎使用的就是哈希表

2. 二叉查找树

2.gif

缺点:

  1. 如图,极端情况可能会出现倾斜的问题,最后变成链表结构。
  2. 造成树节点过深,从而增加查找的IO,而现在IO就是查找的瓶颈
3. 二叉平衡树-AVL

为了保持树的平衡,避免出现数据倾斜,需要进行旋转操作,通过左旋或者右旋最终保持最长子树和最短子树长度不能超过1,如果超过1就不是严格意义上AVL树了

3.gif

缺点:

1.当数据量很大的时候,为了保持平衡,需要进行1-n次的旋转,这个旋转是比较浪费性能的,插入和删除效率极低,查询效率很高。

  1. 只有两个分支,数据量大的时候树的深度依然很深。
4. 红黑树

最长子树的不能超过最短子树的2倍,通过变色和旋转,在插入和查询上做了平衡

红黑树是avl树的变种,损失了部分查询性能来提高插入性能。

4.gif

缺点:

同样是只有两个分支,数据量大的时候深度依然会很深

以上三种二叉树,随着数据的增多,最终都会出现节点过多的情况,而且他们有且仅有2个分支,那么IO的次数一样很多.

怎么解决仅有2个分支而且深度过深,这就有了B树,增加分支

5. B-Tree
  1. 首先不读B减树,读B树
  2. 所有键值分布在整棵树中。
  3. 搜索有可能在非叶子结点结束,在关键字全集内做一次查找,性能逼近二分查找。
  4. 每个结点最多拥有m个子树。
  5. 根节点至少有2个子树。
  6. 分支节点至少拥有m/2棵子树(除根节点和叶子节点外都是分支节点)。
  7. 所有叶子节点都在同一层,每个节点最多可以有m-1个key,并且以升序排列

5.gif

如上图:(图中只是画出来一部分,实际上没有限制的,不止p1,p2,p3)

Vondy
Vondy

下一代AI应用平台,汇集了一流的工具/应用程序

下载

每个节点占用一个磁盘块,一个节点上有两个升序排列的关键字和三个指向子树根节点的指针,指针存储的是子节点所在的磁盘块地址。两个关键词划分成的三个范围域对应三个指针指向的子树的数据的范围域。以根节点为例,关键字为16和34,p1指针指向的子树的数据范围小于16,p2指针指向的子树的数据范围为16-34,p3指针指向的子树的数据范围大于34。

查找关键字28的过程:

  1. 根据根节点找到磁盘块1,读到内存中。【第一次磁盘I/O操作】
  2. 比较关键字28在区间(16,34),找到磁盘块1的指针p2。
  3. 根据p2指针找到磁盘块3,读到内存。【第二次磁盘I/O操作】
  4. 比较关键字28在区间(25,31),找到磁盘块3的指针p2。
  5. 根据指针p2找到磁盘块8,读到内存。【第三次磁盘I/O操作】
  6. 在磁盘块8中的关键字列表中找到关键字28,结束。

缺点:

  1. 每个节点都有key,同时包含data,而每个页存储空间是有限的,如果data很大的话会导致每个节点能存储的key的数量变小。
  2. 当存储的数据量很大的时候会导致深度变大,增加查询磁盘的io次数,进而影响查询性能。
6. B+树

B+树是在B树的基础上做的一种优化,变化如下:

  1. B+树每个节点可以包含更多的节点,这个做的原因有两个,第一个原因是为了降低树的高度,第二个原因是将数据范围变成多个区间,区间越多,数据检索越快。
  2. 非叶子节点只存储key,叶子节点存储key和数据。
  3. 叶子节点两两指针互相连接(符合磁盘预读的特性),顺序查询性能更高。

6.gif

如上图: 在B+树上有两个头指针,一个指向根节点,另一个指向关键字的最小叶子节点,而且所有叶子节点(及数据节点)之间是一种链式环结构,因此可以对B+树进行两种查找运算:一种是对于主键的范围查找和分页查找,另一种是从根节点开始的随机查找。

InnoDB和MyISAM中索引上的差异

1. InnoDB-主键索引

叶子节点存储的是具体的行数据

7.gif

2. InnoDB-非主键索引

非主键索引的叶子节点存储的是主键值(所以查询数据基本要回表)

8.gif

3. MyISAM

叶子节点存储的是行数据的地址,额外需要一次寻址,多一次IO

9.gif

总结:为什么mysql使用的是B+树

准确的表述:为什么mysql的InnoDB和MyISAM存储引擎的索引使用的是B+树

  • hash表,等值查询是很快的,但是不满足常用的范围查找且相邻的两个值之间没有关系,而且hash比较消耗内存。

  • 二叉树/平衡二叉树/红黑树等都是有且仅有2个分支,共性就是数据量大的时候树的深度变深,增加IO的次数。

  • B树会在节点上存储数据,这样一页存放的key的数量就会减少,增加树的深度。

  • B+树中非叶子节点去除了数据,这样就会增加一页中key的数量,而且叶子节点之间是通过链表相连,有利于范围查找和分页。

原文地址:https://juejin.cn/post/6994810803643744269

作者:纪先生

更多编程相关知识,请访问:编程视频!!

相关专题

更多
Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

37

2026.01.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

19

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

37

2026.01.13

MySQL数据库报错常见问题及解决方法大全
MySQL数据库报错常见问题及解决方法大全

本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

19

2026.01.13

PHP 文件上传
PHP 文件上传

本专题整合了PHP实现文件上传相关教程,阅读专题下面的文章了解更多详细内容。

16

2026.01.13

PHP缓存策略教程大全
PHP缓存策略教程大全

本专题整合了PHP缓存相关教程,阅读专题下面的文章了解更多详细内容。

6

2026.01.13

jQuery 正则表达式相关教程
jQuery 正则表达式相关教程

本专题整合了jQuery正则表达式相关教程大全,阅读专题下面的文章了解更多详细内容。

3

2026.01.13

交互式图表和动态图表教程汇总
交互式图表和动态图表教程汇总

本专题整合了交互式图表和动态图表的相关内容,阅读专题下面的文章了解更多详细内容。

45

2026.01.13

nginx配置文件详细教程
nginx配置文件详细教程

本专题整合了nginx配置文件相关教程详细汇总,阅读专题下面的文章了解更多详细内容。

9

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 1.8万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 793人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号