mysql索引b+树和b树（MySQL使用B+Tree当索引的优势有哪些）

时间：2021-10-22 07:48:05类别：数据库

mysql索引b+树和b树

MySQL使用B+Tree当索引的优势有哪些

数据库为什么需要索引呢？

我们都是知道数据库的数据都是存储在磁盘上的，当我们程序启动起来的时候，就相当于一个进程运行在了机器的内存当中。所以当我们程序要查询数据时，必须要从内存出来到磁盘里面去查找数据，然后将数据写回到内存当中。但是磁盘的io效率是远不如内存的，所有查找数据的快慢直接影响程序运行的效率。
而数据库加索引的主要目的就是为了使用一种合适的数据结构，可以使得查询数据的效率变高，减少磁盘io的次数，提升数据查找的速率，而不再是愣头青式的全局遍历。

那索引为啥要用b+tree的数据结构呢？

如果我们简单的想的话，想要快速的查找到数据，感觉hash表是最快的，根据key，hash到某个槽位上，直接一次查找就可以准确的找到数据的位置，这多快呀。但是我们在做业务时，往往只需要一条的数据需求很少，大部分的需求都是根据一定的条件查询一部分的数据，这个时候hash显示不是很合适。

我们再考虑树，比如二叉树，平衡二叉树，红黑树，b树等，他们都是二分查找，找数也快，但是不管是平衡二叉树还是优化后的红黑树，说到底他们都是二叉树，当节点多了的时候，它们的高度就会高呀，我找一个数据。根节点不是，那就找下一层，下一层还没有我就再去找下一层，这样造成的后果就是我找一个数据可能要找好几次，而每一次都是执行了一次磁盘的io，而我们的索引的目的就是要减少磁盘io呀，这样设计可不行。那我们是不是把高度变矮就可以了呢？
所以我们再考虑下b树。首先简单介绍下b树的数据结构：
首先看看b树的定义。

每个节点最多有m-1个关键字（可以存有的键值对）。
根节点最少可以只有1个关键字。
非根节点至少有m/2关键字。
每个节点中的关键字都按照从小到大的顺序排列，每个关键字的左子树中的所有关键字都小于它，而右子树中的所有关键字都大于它。
所有叶子节点都位于同一层，或者说根节点到每个叶子节点的长度都相同。
每个节点都存有索引和数据，也就是对应的key和value。

所以，根节点的关键字数量范围：1 <= k <= m-1，非根节点的关键字数量范围：m/2 <= k <= m-1。

这里的m表示阶数，阶数表示了一个节点最多有多少个孩子节点，所以描述一颗b树时需要指定它的阶数。

我们再举个例子来说明一下上面的概念，比如这里有一个5阶的b树，根节点数量范围：1 <= k <= 4，非根节点数量范围：2 <= k <= 4。

下面，我们通过一个插入的例子，讲解一下b树的插入过程，接着，再讲解一下删除关键字的过程。

b树插入

插入的时候，我们需要记住一个规则：判断当前结点key的个数是否小于等于m-1，如果满足，直接插入即可，如果不满足，将节点的中间的key将这个节点分为左右两部分，中间的节点放到父节点中即可。

例子：在5阶b树中，结点最多有4个key,最少有2个key（注意：下面的节点统一用一个节点表示key和value）。

插入18，70，50,40