`
mc90716
  • 浏览: 9791 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

MySQL索引基础

阅读更多

介绍

    索引用于加快数据访问的速度。把计算机的磁盘比作一本字典,索引就是字段的目录,当我们想快速查到某个词语的时候只需要通过查询目录找到词语所在的页数,然后直接打开某页就可以。MySQL最常用的索引是B+树索引,为什么使用B+作为MySQL的索引,这是许多面试官必问的问题。

为什么B+树

硬件相关知识

    计算机的磁盘是一个圆盘的接口,圆盘上有一个个的圆圈,数据就是记录在这些圆圈的扇区上。如下图所示

当计算机系统读取数据的时候要通过以下几个步骤:
1、首先移动臂根据柱面号使磁头移动到所需要的柱面上,这一过程被称为寻道。所耗费的时间叫寻道时间(ts)。
2、目标扇区旋转到磁头下,这个过程耗费的时间叫旋转时间。
    因此访问磁盘的时间由三部分构成: 寻道时间+旋转时间+数据传输时间 
第一部分寻道时间延迟最高,最大可达到100ms,旋转时间取决于磁盘的转速,转速在7200转/分钟的磁盘平均旋转时间在5ms左右。磁盘的读取是以block(盘块)为单位的,位于同一个盘块的数据可以一次性读取出来。在读写数据的时候尽量减少磁头来回移动的次数,避免过多的查找时间。如果每次从磁盘上读取数据的时候都要经历上面的几个过程那么效率上无疑是极低的。

为什么B+树

    从上面可以看到,如果随机访问磁盘的速度是很慢的,因此需要设计一个合理的数据结构来减少随机访问磁盘的次数。B树就是这样一种数据结构。

B树、B+树介绍

B树

    B树是为存储设备而设计的一种多叉平衡查找树。它与红黑树类似,但是在降低IO操作方面B树的表现要更好一些,B树与红黑树最大的区别在于B树可以有多个子节点,红黑树最多是有两个子节点,这就决定了大多数情况下B树的高度要比红黑树低很多,因此在查找的时候能够降低IO次数。下图是一棵B树:

B 树又叫平衡多路查找树。一棵m阶的B树的特性如下:
    a.树中每个结点最多含有m个孩子(m>=2);
    b.除根结点和叶子结点外,其它每个结点至少有[ceil(m / 2)]个孩子(其中ceil(x)是一个取上限的函数);
    c.若根结点不是叶子结点,则至少有2个孩子(特殊情况:没有孩子的根结点,即根结点为叶子结点,整棵树只有一个根节点);
    d.所有叶子结点都出现在同一层,叶子结点不包含任何关键字信息
    e.每个非终端结点中包含有n个关键字信息: (n,P0,K1,P1,K2,P2,......,Kn,Pn)。其中:
        a) Ki (i=1…n)为关键字,且关键字按顺序升序排序K(i-1)< Ki。 
        b) Pi为指向子树根的接点,且指针P(i-1)指向子树种所有结点的关键字均小于Ki,但都大于K(i-1)。 
        c) 关键字的个数n必须满足: [ceil(m / 2)-1]<= n <= m-1。
    B树中的每个节点都尽可能存储多的关键字信息和分支信息,但是不会超过磁盘块的大小。这样在有效降低了树的高度,在查找的时候可以快速定位在指定的磁盘块。假如要从上图中找到79这个数字,首先从根节点开始扫描,79大于35所以选择P3指针,指向磁盘块4,在磁盘块4中79在65和87之间,因此选择P2指针,选择磁盘块10,这时候就可以从磁盘块10中找到79。整个过程只需要3次IO,如果这棵树被缓存在内存中,那么只需要一次IO就可以读到79这个数字。

B+树

    B+树是B的变种,一颗m阶B+树和m阶B树的异同点在于:
    1、有n棵子树的节点中有n-1个关键字(与B树n棵子树有n-1个关键字,保持一致)
    2、所有的叶子节点中包含了全部的关键字的信息,以及指向含有这些关键字记录的指针,且叶子节点本身依关键字的大小而自小而大顺序链接(而B树的叶子节点并没有包含全部需要查找的信息)
    3、所有的非终端节点可以看成索引部分,节点中仅含有其子树根节点中最大或者最小的关键字(而B树的非终节点也要包含需要查找的有效信息)
    
由于B+树的叶子节点是连接在一起的,因此相对于使用B树作为索引,对于MySQL的范围查询更加优化。同时由于叶子节点包含所有关键字信息,因此有的查询语句就不需要回表,只需要查询索引就可以查到需要的数据。

索引类型

B树索引

    虽然是叫B树索引,但是数据库实际上使用的是B+树来组织数据。B树索引意味着所有值都是按照顺序存储的,并且每个叶子节点到根节点的距离是相同的。
假如有如下数据表:

CREATE TABLE `people` (
  `last_name` varchar(50) DEFAULT NULL,
  `first_name` varchar(50) DEFAULT NULL,
  `dob` date DEFAULT NULL,
  `gender` enum('m','f') DEFAULT NULL,
  KEY `last_name` (`last_name`,`first_name`,`dob`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;


该表对last_name,first_name,dob三列建立了索引,索引的组织方式如下:

当同时对多列进行索引的时候,索引的顺序是非常重要的,上面的索引首先是按照last_name进行索引,在last_name相同的情况下在对first_name进行排序,最后是dob字段。
    B树索引适用于全键值、键值范围和最左前缀查找:
全键值
    查找名字为Allen Kim,出生日期为1930-07-12的人,这样的查找方式匹配了索引中的所有字段,依次扫描索引中的last_name、first_name和dob字段,找到对应的数据。
键值范围
    查找姓名在Allen和Barrymore之间的人,这种查找方式也会使用到索引。需要注意的是这里只能是索引中的第一列,也就是last_name的范围查找。
前缀匹配
    查找last_name是以Al开头的人,这种查询会以此扫描索引中的节点,然后选出来对应的复合条件的行。也是只能使用第一列的前缀查询。如果是说想查first_name的前缀匹配,那么是无法使用到索引的,意味着要进行全表扫描。
精确匹配某一列,范围批量另外一列
    精确匹配的列必须是所以中的第一列,范围匹配的列是第二列,这样才能使用到上面的索引。

 

B树索引的使用限制:
1、不是按照最左列开始查询的,无法使用索引。
2、不能跳过索引的列进行查询。
3、如果使用到了范围匹配,那么范围匹配右边的列都无法使用索引查询。

哈希索引

    哈希索引使用哈希表来实现,只有是精确匹配的时候才会生效。存储引擎会对索引列计算出一个哈希值,然后保存一个哈希值到行数据的指针。哈希索引由于其特殊的组织方式,限制了其使用场景。哈希索引只适合值比较少的情况,例如枚举类型。在以下几种方式中是不适合使用哈希索引的:
1、哈希索引只包含哈希值和指针,不存储字段值,因此使用哈希索引避免不了要进行回表查询。
2、哈希索引数据并不是按照值的顺序进行排序的,因此哈希索引无法用来排序
3、哈希索引不支持部分索引列匹配。比如说在(A,B)两列上简历哈希索引,那么只有在同时使用A、B两列查询的时候才会使用哈希索引,只使用A列查询无法使用哈希索引。
4、哈希索引只支持等值比较,不支持像between and这种范围查询。
5、使用哈希索引的时候应该尽量避免哈希冲突。

后记

    数据库的索引机制解决的问题是在访问内存数据与磁盘数据的速度差别很大的情况下,如何快速访问数据的问题。只有了解了索引的原理才可以更好的设计表的索引字段以及写出性能更优的查询语句。在我们写SQL语句的时候头脑中应该大体上能规划出查询数据以及如何使用索引的过程。下一篇会介绍一下高性能索引的策略,带你设计出更优的索引。

----------------------------------------------------------------

 

欢迎关注我的微信公众号:yunxi-talk,分享Java干货,进阶Java程序员必备。

0
0
分享到:
评论

相关推荐

    (1)MySql索引基础

    本文是学习MySQL索引知识后进行得整理,部分图片来源马士兵老师的公开课,仅作笔记使用 一、MySql架构图 原创文章 1获赞 1访问量 50 关注 私信 展开阅读全文 作者:CatRecord

    mysql 索引与执行计划

    目录 1. 索引与执行计划 1 1.1. 索引入门 1 1.1.1. 索引是什么 1 ...1.1.3. 基础语法 3 1.2. 执行计划 3 1.2.1. 什么是执行计划 3 1.2.2. 执行计划的作用 3 1.2.3. 执行计划的语法 4 1.2.4. 执行计划详解 4

    MYSQL基础入门pdf

    MYSQL 基础入门知识,可以学习下 数据库概述 •MySQL基本操作 •MySQL索引基础 •MySQL高级特性

    mysql面试题,涉及MySQL基础、MySQL索引、MySQL语句 MySQL进阶等方面,适用于初、中级开发人员

    mysql面试题,涉及MySQL基础、MySQL索引、MySQL语句 MySQL进阶等方面,适用于初、中级开发人员

    计算机二级MYSQL数据库基础与提升课程PPT模板.pptx

    18索引和视图索引和视图 计算机二级MYSQL数据库基础与提升课程PPT模板全文共22页,当前为第19页。 19用户管理和权限管理用户和权限管理 计算机二级MYSQL数据库基础与提升课程PPT模板全文共22页,当前为第20页。 20...

    MySQL索引的基本语法

    索引是排好序的数据结构!可以用在 where 条件查找的字段,和order by 排序的字段,有了索引,...4.全文索引(FULLTEXT):MySQL 自带的全文索引只支持英文。 一般使用专门的全文搜索引擎,比如 ES(ElasticSearch) 创建索

    MySQL中利用索引对数据进行排序的基础教程

    MySQL中,有两种方式生成有序...MySQL索引通常是被用于提高WHERE条件的数据行匹配或者执行联结操作时匹配其它表的数据行的搜索速度。 MySQL也能利用索引来快速地执行ORDER BY和GROUP BY语句的排序和分组操作。 通过索

    mysql数据库索引自学笔记,基础+单表索引+多表索引的创建方法及原理

    单表的索引数不要超过6个:这个是数据库软件的限制,在早期oracle数据库上会有此限制,但mysql等就不会存在这个限制。但读者也要清楚的知道,索引数据过多会影响写的性能; 不应该索引不稳定的列:一般认为更新速度...

    Mysql基础教程.chm

    1、MySQL安全性指南 2、MySQL查询优化讲座-查询优化器 3、MySQL查询优化讲座-使用索引 4、MySQL查询优化讲座-数据类型与效率 5、MySQL查询优化讲座之调度和锁定 6、MySQL 5.0 新特性...

    快速学习MySQL索引的入门超级教程

    主要介绍了快速学习MySQL索引的入门教程,包括索引的创建和删除等基础知识,需要的朋友可以参考下

    169集全新MySQL课程 MySQL技能全面探索 MySQL核心特训教程 MySQL零基础实战班视频

    较以往的MySQL核心基础课程有更好的优势,是MySQL运维人员 编程人员及相关技术人员的必备学习课程 ├─10、课程:进阶数据类型(上).10、Geohash.mp4 ├─10、课程:进阶数据类型(上).11、JSON数据格式(一)....

    mysql 索引的基础操作汇总(四)

    主要为大家详细介绍了mysql 索引的基础操作汇总,涵盖了创建和查看索引、删除索引等操作,感兴趣的小伙伴们可以参考一下

    Mysql基础语法及脚本.zip

    Mysql基础语法及脚本,非常适合新人学习,里面有2个Demo及脚本,第一个适合完全不会的新人,通过学习Demo1,能掌握简单的增删改查,通过学习Demo2,能掌握mysql运算符,排序,用limit分页查询,MySQL正则表达式,约束,索引,函数...

    mysql基础笔记

    1.2 mysql索引 1.3 mysql试图 1.4 mysql 内置函数 1.4.1 字符串函数 1.4.2 数学函数 1.5 mysql预处理语句 1.6 mysql事务处理 1.7 mysql存储 1.8 mysql触发器(trigger) 1.9 重排auto_increment值

    MySQL学习笔记-基础到进阶

    内容概要:MySQL学习笔记,内容包括SQL基本语法、MySQL基础知识,包括存储引擎、索引、视图、锁、优化、存储结构等MySQL主要的内容。 适用人群:适合自学MySQL的同学使用。 能学到什么:MySQL从基础到进阶的全部内容...

    新版 MySQL DBA 高级视频 基于MySQL 5.7 MySQL 8.0版本.rar

    │ 第二十课MySQL索引和调优.pdf │ 第二课MySQL入门介绍.pdf │ 第五课MySQL常用函数介绍.pdf │ 第八课InnoDB内核.pdf │ 第六课SQL高级应用.pdf │ 第十一课MySQL表分区8.0.pdf │ 第十七课Elasticsearch分享-...

    MySQL的基础知识笔记

    2. 数据库基础知识介绍:介绍了MySQL的基本概念、数据类型、变量、索引、事务、提交和回滚等知识。 3. MySQL的安装:介绍了如何安装MySQL,包括选择安装方式、配置MySQL环境变量等。 4. MySQL常用的一些命令介绍:...

    互联网Python与MySQL基础入门

    在本教程中,我们将为您介绍MySQL的基本概念、安装与配置、SQL语言、数据库表的设计与操作、索引、存储过程和触发器等知识。 Python操作MySQL数据库 掌握Python与MySQL的操作是开发高效数据库应用的关键。在本教程中...

    MySQL只学有用的–MYSQL索引原理及创建技巧

    MySQL只学有用的–MYSQL索引原理及使用索引的基础理解索引的常见模型(字典目录的编写形式)1. 哈希表2. 有序数组3. 二叉树聊一聊InnoDB的索引模型(B+树)索引的维护(《新华字典》的目录修改)SQL索引执行过程–...

    MySQL学习笔记,包括SQL基本语法、MySQL基础知识,包括存储引擎、索引、视图、锁、优化、存储结构等MySQL主要的内容

    MySQL学习笔记,包括SQL基本语法、MySQL基础知识,包括存储引擎、索引、视图、锁、优化、存储结构等MySQL主要的内容。

Global site tag (gtag.js) - Google Analytics