`

索引(BTree和hash区别)

 
阅读更多

在MySQL里常用的索引数据结构有B+树索引和哈希索引两种,我们来看下这两种索引数据结构的区别及其不同的应用建议。

二者区别

备注:先说下,在MySQL文档里,实际上是把B+树索引写成了BTREE,例如像下面这样的写法:

CREATE TABLE t(
aid int unsigned not null auto_increment,
userid int unsigned not null default 0,
username varchar(20) not null default ‘’,
detail varchar(255) not null default ‘’,
primary key(aid),
unique key(uid) USING BTREE,
key (username(12)) USING BTREE — 此处 uname 列只创建了最左12个字符长度的部分索引
)engine=InnoDB;

一个经典的B+树索引数据结构见下图:
20160106B树索引
(图片源自网络)

B+树是一个平衡的多叉树,从根节点到每个叶子节点的高度差值不超过1,而且同层级的节点间有指针相互链接。

在B+树上的常规检索,从根节点到叶子节点的搜索效率基本相当,不会出现大幅波动,而且基于索引的顺序扫描时,也可以利用双向指针快速左右移动,效率非常高。

因此,B+树索引被广泛应用于数据库、文件系统等场景。顺便说一下,xfs文件系统比ext3/ext4效率高很多的原因之一就是,它的文件及目录索引结构全部采用B+树索引,而ext3/ext4的文件目录结构则采用Linked list, hashed B-tree、Extents/Bitmap等索引数据结构,因此在高I/O压力下,其IOPS能力不如xfs。

详细可参见:

https://en.wikipedia.org/wiki/Ext4
https://en.wikipedia.org/wiki/XFS

哈希索引的示意图则是这样的:
20160106哈希索引
(图片源自网络)

简单地说,哈希索引就是采用一定的哈希算法,把键值换算成新的哈希值,检索时不需要类似B+树那样从根节点到叶子节点逐级查找,只需一次哈希算法即可立刻定位到相应的位置,速度非常快。

从上面的图来看,B+树索引和哈希索引的明显区别是:

  • 如果是等值查询,那么哈希索引明显有绝对优势,因为只需要经过一次算法即可找到相应的键值;当然了,这个前提是,键值都是唯一的。如果键值不是唯一的,就需要先找到该键所在位置,然后再根据链表往后扫描,直到找到相应的数据;
  • 从示意图中也能看到,如果是范围查询检索,这时候哈希索引就毫无用武之地了,因为原先是有序的键值,经过哈希算法后,有可能变成不连续的了,就没办法再利用索引完成范围查询检索;
  • 同理,哈希索引也没办法利用索引完成排序,以及like ‘xxx%’ 这样的部分模糊查询(这种部分模糊查询,其实本质上也是范围查询);
  • 哈希索引也不支持多列联合索引的最左匹配规则
  • B+树索引的关键字检索效率比较平均,不像B树那样波动幅度大,在有大量重复键值情况下,哈希索引的效率也是极低的,因为存在所谓的哈希碰撞问题

后记

在MySQL中,只有HEAP/MEMORY引擎表才能显式支持哈希索引(NDB也支持,但这个不常用),InnoDB引擎的自适应哈希索引(adaptive hash index)不在此列,因为这不是创建索引时可指定的。

还需要注意到:HEAP/MEMORY引擎表在mysql实例重启后,数据会丢失。

通常,B+树索引结构适用于绝大多数场景,像下面这种场景用哈希索引才更有优势:

在HEAP表中,如果存储的数据重复度很低(也就是说基数很大),对该列数据以等值查询为主,没有范围查询、没有排序的时候,特别适合采用哈希索引

例如这种SQL:
SELECT … FROM t WHERE C1 = ?; — 仅等值查询

在大多数场景下,都会有范围查询、排序、分组等查询特征,用B+树索引就可以了。

分享到:
评论

相关推荐

    Mysql中的Btree与Hash索引比较

    主要介绍了Mysql中的Btree与Hash索引比较,本文起讲解了B-Tree 索引特征、Hash 索引特征等内容,需要的朋友可以参考下

    索引类型FULLTEXT,HASH,BTREE,RTREE,索引优化1

    2、存储结构正如其名,这类索引的物理文件大多就是以BTree结构来存储的,但会有不同的存储引擎在使用BTree索引时,对存储结构稍作修改 2、Hash索引的弊端

    MySQL数据库索引优化

    介绍BTree索引和Hash索引,详细介绍索引的优化策略等等 1.Btree索引和Hash索引 2.安装演示数据库 3.索引优化策略上 4.索引优化策略中 5.索引优化策略下

    MySQL Hash索引和B-Tree索引的区别

    MySQL Hash索引和B-Tree索引的区别究竟在哪里呢?相信很多人都有这样的疑问,下文对两者的区别进行了详细的分析,需要的朋友可以参考下

    Hash索引和B+树索引的区别

    文章目录前言B+树HashHash索引与B+树索引的区别总结 前言 我们都知道在MySQL中索引的数据结构有两种,一种是Hash,另一种是BTree。在数据表中建立什么样的索引需要我们根据实际情况进行选择。 B+树 B+树结构示意图:...

    mysql面试题,MySQL中有几种索引类型,可以简单说说吗?

    BTREE :BTREE索引就是一种将索引值按一定的算法,存入一个树形的数据结构中(二叉树),每次查询都是从树的入口root开始,依次遍历node,获取leaf。这是MySQL里默认和最常用的索引类型。 RTREE :RTREE在MySQL很少...

    MySQL 创建索引(Create Index)的方法和语法结构及例子

    CREATE INDEX Syntax CREATE [UNIQUE|FULLTEXT|SPATIAL] INDEX index_name [index_type] ON ... HASH | RTREE} 代码如下: — 创建无索引的表格 create table testNoPK ( id int not null, name varchar(10) ); — 创建

    Mysql索引优化解决方案.doc

    索引的数据结构有多种,常用的有BTree索引(Myisam普通索引)、B+Tree索引(Innodb普通索引)、Hash索引(memory存储引擎)等等。索引的优点是可以提高数据检索的效率,降低数据库的IO成本。通过索引对数据进行排序...

    MySQL中索引与视图的用法与区别详解

    前言 本文主要给大家介绍了关于MySQL中索引与视图的使用与区别的相关内容,分享出来供大家...MyISAM和InnoDB存储引擎的表默认创建BTREE索引, MEMORY存储引擎的表默认创建HASH索引。 二、创建索引 create index语法为

    2023MYSQL面试题集锦.docx

    索引的数据结构和具体存储引擎的实现有关,在MySQL中使用较多的索引有Hash索引,B+树索引等, InnoDB存储引擎的默认索引实现为:B+树索引。对于哈希索引来说,底层的数据结构就是哈希表,因 此在绝大多数需求为单条...

    MySQL优化技巧大揭秘实战课视频.zip

    2-9 Hash算法与Hash索引 3-1 explain介绍 3-2 explian中id属性介绍 3-3 explain中select_type属性介绍 3-4 explain中type属性介绍 3-5 explain中type属性实例 3-6 explain中possible_keys与key区别 3-7 索引使用规则

    mysql 索引详细介绍

    在mysql 中,索引可以分为两种类型 hash索引和 btree索引。  什么情况下可以用到B树索引?  1.全值匹配索引  比如: orderID=”123”  2.匹配最左前缀索引查询  比如:在userid 和 date字段上创建联合索引。 ...

    mysql 索引分类以及用途分析

    一、 MySQL: 索引以B树格式保存 Memory存储引擎可以选择Hash或BTree索引,Hash索引只能用于=或<=>的等式比较。 1、普通索引:create index on Tablename(列的列表) alter table TableName add index (列的列表) ...

    mysql索引和explain的详解

    MEMORY/HEAP存储引擎:支持HASH和BTREE索引 B树图示 B树是为了磁盘或其它存储设备设计的一种多叉(下面你会看到,相对于二叉,B树每个内结点有多个分支,即多叉)平衡查找树。 多叉平衡。 B树和B+树的区别: B树和B...

    mysql 索引的基础操作汇总(四)

    根据索引的存储类型,可以将索引分为B型树索引(BTREE)和哈希索引(HASH)。注意:InnoDB和MyISAM存储引擎支持BTREE类型索引,MEMORY存储引擎支持HASH类型的索引,默认为前者索引。  MySQL支持6种索引,分别是普通...

    Mysql面试问题加答案50道题.docx

    MySQL中常用的索引类型包括BTree、Hash、Full-text等。 3. MySQL中的主键和唯一键有何不同? 一个表只能有一个主键,但可以有多个唯一键。主键可以是NULL值,但唯一键不能是。主键是自动递增的,但唯一键不是。 4...

    mysql索引学习教程

    在mysql 中,索引可以分为两种类型 hash索引和 btree索引。 什么情况下可以用到B树索引? 1.全值匹配索引 比如: orderID=”123” 2.匹配最左前缀索引查询 比如:在userid 和 date字段上创建联合索引。 那么...

    MySQL性能优化易实现的MySQL优化方案汇总

     5、Hash索引与BTree索引区别(MyISAM与InnoDB不支持Hash索引)  (1)、BTree索引使用多路搜索树的数据结构,可以减少定位的中间过程;综合效率较高,默认使用的索引。  (2)、Hash索引使用Hash算法构建索引;...

    MySQL之索引

    MyISAM和InnoDB实现BTree索引方式的区别6. 索引的分类1. 主键索引和二级(辅助)索引2. 聚簇索引和非聚簇索引3. 覆盖索引7. 最左前缀原则8. 索引的使用注意事项1. 索引的创建2. 注意点 索引 1. 什么是索引? ​ ...

Global site tag (gtag.js) - Google Analytics