您当前的位置:首页 > 电脑百科 > 数据库 > MYSQL

MySQL是如何利用索引的?

时间:2021-02-25 11:16:12  来源:  作者:

什么是索引?

索引是数据库快速找到记录行的一种数据结构,类似我们看书时的目录,它是良好性能的关键因素。尤其是表中的数据量越来越大时,如果索引使用不当,会严重影响性能。索引也是最常见的数据库优化手段,它能轻易的将查询性能提高好几个量级。

MySQL索引类型?

mysql索引数据是存储在存储引擎中的,所以不同存储引擎中索引的工作方式并不一样。

B-Tree索引:基于B+树(一种多叉搜索数树)来实现的索引类型,一般也是使用的最多的索引类型,之所以选择B+树而不是其他数据结构,是因为B+树在查询时间复杂度可以维持在O(logn)的级别上,由于B+的矮胖(从根节点到叶子节点的距离可以维持在较小范围)特性减少磁盘IO次数、数据只存在叶子节点中并且按顺序存储也可以支持快速的范围查询,这是其他结构无法满足的!

B+索引中值是按顺序存储的,叶子节点到根节点的距离都相同,从B+树的根节点开始往下查找,节点存储了指向叶子节点的指针,通过将要查找的值和每个节点值比较后,一层层定位到最终的叶子结点上,叶子节点存储的就是行数据、指针或主键。

假如我们索引列是:

key(lastname(姓),firstname(名),born),可以使用B+树索引的查询类型包括:全键值、键值范围、键前缀查找,其中键前缀只适用于最左前缀查找:

  • 全值匹配:指的是和索引中所有的列进行匹配,如可以找到姓名为:Cuba(名) Allen(姓) 、生于1988-10-04的人,如where lastname=‘Allen’ and firstname=‘Cuba’ and born='1988-10-04'
  • 匹配最左前缀:可以查找姓为Allen的人,如where lastname=‘Allen’
  • 匹配列前缀:也可以匹配某一列的值的开头部分,如where lastname like ‘A%’ 或者where firstname like ‘M%’
  • 匹配范围:可以匹配姓在Allen和Bill之间的人
  • 精确匹配某一列并匹配另外一列:查找所有姓为Allen、并且名字是以M开头的人,如where lastname=‘Allen’ and firstname like ‘M%’
  • 访问索引数据:这种查询只需要访问索引本身就行了,不需要访问数据行,也就是常说的索引覆盖,举个例子:如果只需要找到姓为Allen的人的名称, 而不需要这个人其他的信息,名称就存在与索引中,不需要再去数据行中查找数据了。

这里需要注意的是叶子节点存什么类型数据不同的存储引擎还不一样,在MyISAM中叶子节点存储的是数据物理位置(指针),而InnoDB使用B+结构存储的是原始数据或主键,也就是我们常说的聚簇索引,它存储的是原始全量数据、键值,聚簇索引指的是一种数据索引组织形式,它将数据和索引聚集在一起所以叫聚簇,它本身并不是一种索引类型。

一般InnoDB查找过程为从辅助索引上开始查找到数据主键,然后在主键索引中用主键再次查找,最后再找到数据,虽然多了一次查找过程,但更新数据不会导致聚簇索引频繁变化。而在MyISAM中不需要2次索引查找,因为叶子节点存储的是数据的物理地址可以直接定位,虽然查询看似简单了,但是物理地址会因为数据频繁变更而发生变化。

假设有以下数据:

InnoDB(聚簇索引)数据查找过程:

MyISAM(非聚簇索引结构)数据查找过程:

哈希索引:基于哈希表来实现的索引类型,如果存在哈希冲突,索引会使用链表来存放多个记录到一个哈希桶中。举个例子:如果存在以下索引 key USING HASH(firstname),哈希索引会使用哈希函数计算出firstname列的哈希值作为key,并将行指针作为value存储,当使用 =、IN()、<=>操作时,先计算出sql语句操作查找值的哈希值,并使用其来查找哈希表对应的行指针,从而返回数据。

这里需要注意是:

  • 哈希索引只存储哈希值和行指针,索引索引本身没有行数据,也就没有所谓的索引覆盖。
  • 哈希索引没有按哈希值的顺序排列,所有不支持排序操作。
  • 不支持部分索引列的匹配,哈希索引使用你指定的全部列来计算哈希值,列入(A,B)如果查询只有列A,则索引无发匹配。
  • 哈希索引只支持等值比较(=、in(),<=>)。
  • 哈希冲突较高时,查找效率就变成了链表,复杂度从O(1)变为O(n)。

空间数据索引:MyISAM支持空间索引可以用来存储地理数据。必须使用GIS相关函数如MBRCONUNTAINS()来维护数据,因为本身mysql对GIS的支持下不完善,这中特性使用很少。

全文索引:这是一种特殊类型的索引,他查找的是索引列中文本的关键词,而不是比较索引值,全文索引的使用要注意列的文本大小和数据量,它的匹配方式类似于搜索引擎

索引的优缺点?

  • 大大减少了服务器扫描表的数据量。
  • 避免不必要的排序和临时表。
  • 将随机IO变为顺序IO。
  • 对于非常小的表,全表扫描可能比索引更快,对于中型数据量表,索引将会非常有效,对于TB级别的表来说,索引的维护和效果可能没有我们想象的那样好,这是可以使用表分区、业务拆分表和分库等技术。

常见的索引优化方式及注意事项?

  • 不要把索引的列纳入表达式,也不能是函数参数,如where aid+1=5、where to_days(col)<=10.
  • 选择重复性较低的列建索引,重复性较高会导致索引失效,全表扫描。
  • 多列索引中很多常见的错误是,喜欢为每个列创建独立索引,实际上这是错误的!要选择合适的顺序和列来合并索引,来看个简单例子:

表数据为:

分别建2个独立索引:inx_name, inx_company :

现在执行以下语句:

SELECT * from tuser where `name`='22' or company='bb'

结果显示并没有使用索引来查询数据:

现在加一个多列索引:inx_name_company

执行同样的sql显示使用了多列索引:

  • 不要在大文本字段建全量索引,这会然导致索引数据较大,查询较慢,可以建一个前缀索引,例如

//在city列上取前7个字符作为索引 mysql > alter table demo add key(city(7))

这是一种使索引更小,更快的方法,但缺点是无法使用缀索引order by或group by



Tags:MySQL 索引   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
什么是索引?索引是数据库快速找到记录行的一种数据结构,类似我们看书时的目录,它是良好性能的关键因素。尤其是表中的数据量越来越大时,如果索引使用不当,会严重影响性能。索引也...【详细内容】
2021-02-25  Tags: MySQL 索引  点击:(189)  评论:(0)  加入收藏
在冯小刚冯导作为导演拍摄的《天下无贼》中有一句经典台词,那就是出自葛优之口:21世纪什么最贵?人才!从这句话说出到现在,已经16年过去了,那么在现在这个大数据时代,什么最贵呢?那...【详细内容】
2020-12-30  Tags: MySQL 索引  点击:(131)  评论:(0)  加入收藏
一、高性能索引1、查询性能问题在MySQL使用的过程中,所谓的性能问题,在大部分的场景下都是指查询的性能,导致查询缓慢的根本原因是数据量的不断变大,解决查询性能的最常见手段是...【详细内容】
2020-08-03  Tags: MySQL 索引  点击:(62)  评论:(0)  加入收藏
概述随着电商的发展,使用数据库的业务越来越复杂,除了掌握哪些场景可以使用索引,哪些场景适合使用索引,还需要掌握索引在运行过程中的一些使用规则,特别是组合索引的使用。比如索...【详细内容】
2020-07-06  Tags: MySQL 索引  点击:(54)  评论:(0)  加入收藏
一个索引提高600倍查询速度?首先准备一张books表create table books( id int not null primary key auto_increment, name varchar(255) not null, author varchar(...【详细内容】
2020-04-07  Tags: MySQL 索引  点击:(74)  评论:(0)  加入收藏
我会谈谈对于索引结构我自己的看法,以及分享如何从零开始一层一层向上最终理解索引结构。从一个简单的表开始createtableuser(idintprimarykey,ageint,heightint,weightint...【详细内容】
2019-12-26  Tags: MySQL 索引  点击:(117)  评论:(0)  加入收藏
学习索引,主要是写出更快的sql,当我们写sql的时候,需要明确的知道sql为什么会走索引?为什么有些sql不走索引?sql会走那些索引,为什么会这么走?我们需要了解其原理,了解内部具体过程,...【详细内容】
2019-12-24  Tags: MySQL 索引  点击:(75)  评论:(0)  加入收藏
前言为什么你写的sql查询慢?为什么你建的索引常失效?通过本章内容,你将学会MySQL性能下降的原因,索引的简介,索引创建的原则,explain命令的使用,以及explain输出字段的意义。助你了...【详细内容】
2019-10-29  Tags: MySQL 索引  点击:(101)  评论:(0)  加入收藏
索引是一种特殊的文件(InnoDB 数据表上的索引是表空间的一个组成部分),它们 包含着对数据表里所有记录的引用指针。普通索引(由关键字 KEY 或 INDEX 定义的索引)的唯一任务是...【详细内容】
2019-10-11  Tags: MySQL 索引  点击:(179)  评论:(0)  加入收藏
MySQL凭借着出色的性能、低廉的成本、丰富的资源,已经成为绝大多数互联网公司的首选关系型数据库。虽然性能出色,但所谓“好马配好鞍”,如何能够更好的使用它,已经成为开发工程...【详细内容】
2019-09-12  Tags: MySQL 索引  点击:(131)  评论:(0)  加入收藏
▌简易百科推荐
作者:雷文霆 爱可生华东交付服务部 DBA 成员,主要负责Mysql故障处理及相关技术支持。爱好看书,电影。座右铭,每一个不曾起舞的日子,都是对生命的辜负。 本文来源:原创投稿 *爱可生...【详细内容】
2021-12-24  爱可生    Tags:MySQL   点击:(6)  评论:(0)  加入收藏
生成间隙(gap)锁、临键(next-key)锁的前提条件 是在 RR 隔离级别下。有关Mysql记录锁、间隙(gap)锁、临键锁(next-key)锁的一些理论知识之前有写过,详细内容可以看这篇文章...【详细内容】
2021-12-14  python数据分析    Tags:MySQL记录锁   点击:(17)  评论:(0)  加入收藏
binlog 基本认识 MySQL的二进制日志可以说是MySQL最重要的日志了,它记录了所有的DDL和DML(除了数据查询语句)语句,以事件形式记录,还包含语句所执行的消耗的时间,MySQL的二...【详细内容】
2021-12-14  linux上的码农    Tags:mysql   点击:(13)  评论:(0)  加入收藏
为查询优化你的查询 大多数的MySQL服务器都开启了查询缓存。这是提高性最有效的方法之一,而且这是被MySQL的数据库引擎处理的。当有很多相同的查询被执行了多次的时候,这些查...【详细内容】
2021-12-09  元宇宙iwemeta    Tags:mysql   点击:(15)  评论:(0)  加入收藏
测试的目的和原因,公司有很多程序员,每个程序员对数据库和表结构都有自己的理解。而且每个程序员的理解往往是以效率考虑。既然都是为了效率考虑,那么我就来测试一下究竟哪种使...【详细内容】
2021-12-08  吴彬的分享    Tags:Mysql数据库   点击:(14)  评论:(0)  加入收藏
当你们考虑项目并发的时候,我在部署环境,当你们在纠结使用ArrayList还是LinkedArrayList的时候,我还是在部署环境。所以啊,技术不止境,我在部环境。今天这篇文章缕一下在同一台服...【详细内容】
2021-12-08  秃头码哥    Tags:MySQL数据库   点击:(16)  评论:(0)  加入收藏
对于数据分析来说,MySQL使用最多的是查询,比如对数据进行排序、分组、去重、汇总及字符串匹配等,如果查询的数据涉及多个表,还需要要对表进行连接,本文就来说说MySQL中常用的查询...【详细内容】
2021-12-06  笨鸟学数据分析    Tags:MySQL   点击:(19)  评论:(0)  加入收藏
在学习SQL语句之前,首先需要区分几个概念,我们常说的数据库是指数据库软件,例如MySQL、Oracle、SQL Server等,而本文提到的数据库是指数据库软件中的一个个用于存储数据的容器。...【详细内容】
2021-11-24  笨鸟学数据分析    Tags:SQL语句   点击:(23)  评论:(0)  加入收藏
概述以前参加过一个库存系统,由于其业务复杂性,搞了很多个应用来支撑。这样的话一份库存数据就有可能同时有多个应用来修改库存数据。比如说,有定时任务域xx.cron,和SystemA域...【详细内容】
2021-11-05  Java云海    Tags:分布式锁   点击:(31)  评论:(0)  加入收藏
MySQL的进阶查询 一、 按关键字排序 使用ORDERBY语句来实现排序排序可针对一个或多个字段ASC:升序,默认排序方式 【升序是从小到大】DESC:降序 【降序是从大到小】ORDER BY的...【详细内容】
2021-11-05  Java热点    Tags:SQL语句   点击:(27)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条