千锋教育-做有情怀、有良心、有品质的职业教育机构

400-811-9990
手机站
千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频
千锋教育

关注千锋学习站小程序
随时随地免费学习课程

上海
  • 北京
  • 郑州
  • 武汉
  • 成都
  • 西安
  • 沈阳
  • 广州
  • 南京
  • 深圳
  • 大连
  • 青岛
  • 杭州
  • 重庆
当前位置:沈阳千锋IT培训  >  技术干货  >  为什么B+树索引比顺序索引文件效率要高?

为什么B+树索引比顺序索引文件效率要高?

来源:千锋教育
发布人:xqq
时间: 2023-10-15 02:16:26

一、为什么B+树索引比顺序索引文件效率要高

B+树进化具有的优点

索引节点没有数据,比较小,能够完全加载到内存中而且叶子节点之间都是链表的结构,所以B+Tree也是可以支持范围查询的,而B树每个节点key和data在一起,则无法区间查找B+树中因为数据都在叶子节点,每次查询的时间复杂度是稳定的,因此稳定性保证了

B+树的检索过程

我们再来看下B+树的检索过程

从B+树的根开始,逐层找到叶子节点。找到叶子节点为对应的数据页,将数据叶加载到内存中,通过页目录的槽采用二分查找的方式先找到一个粗略的记录分组。在分组中通过链表遍历的方式进行记录的查找。

B+树页节点结构

将所有的记录分成几个组, 每组会存储多条记录,页目录存储的是槽(slot),槽相当于分组记录的索引,每个槽指针指向了不同组的最后一个记录我们通过槽定位到组,再查看组中的记录

页的主要作用是存储记录,在页中记录以单链表的形式进行存储。
单链表优点是插入、删除方便,缺点是检索效率不高,最坏的情况要遍历链表所有的节点。因此页目录中提供了二分查找的方式,来提高记录的检索效率。所以B+树索引比顺序索引文件效率要高。

延伸阅读:

二、为什么要从AVL树变成B树

因为内存的易失性。一般情况下,我们都会选择将 user 表中的数据和索引存储在磁盘这种外围设备中。

但是和内存相比,从磁盘中读取数据的速度会慢上百倍千倍甚至万倍,所以,我们应当尽量减少从磁盘中读取数据的次数。

另外,从磁盘中读取数据时,都是按照磁盘块来读取的,并不是一条一条的读。

如果我们能把尽量多的数据放进磁盘块中,那一次磁盘读取操作就会读取更多数据,那我们查找数据的时间也会大幅度降低。

如果我们用树这种数据结构作为索引的数据结构,那我们每查找一次数据就需要从磁盘中读取一个节点,也就是我们说的一个磁盘块。

我们都知道平衡二叉树可是每个节点只存储一个键值和数据的。那说明什么?说明每个磁盘块仅仅存储一个键值和数据!那如果我们要存储海量的数据呢?

可以想象到二叉树的节点将会非常多,高度也会极其高,我们查找数据时也会进行很多次磁盘 IO,我们查找数据的效率将会极低

声明:本站稿件版权均属千锋教育所有,未经许可不得擅自转载。

猜你喜欢LIKE

Python中动态编译函数compile参数filename的作用是什么?

2023-10-15

为什么使用红黑树以及如何使用红黑树?

2023-10-15

HBase、TiDB、TDengine有什么优势?

2023-10-15

最新文章NEW

网站间隙性502怎么解决?

2023-10-15

Mysql为什么只能支持2000w左右的数据量?

2023-10-15

AliSQL和OceanBase是什么关系?

2023-10-15

相关推荐HOT

更多>>

快速通道 更多>>

最新开班信息 更多>>

网友热搜 更多>>