您当前的位置:首页 > 电脑百科 > 数据库 > MYSQL

MySQL : explain 快速查询手册

时间:2022-10-17 16:43:52  来源:今日头条  作者:架构师之道

一. 前言

这一篇来详细看看 EXPLAIN 各个参数的含义和扩展 , 整理出来便于使用时快速查询

二 . explain 使用


 

三. 业务实践

在日常实践中 , 我们应该如何使用 explain 提供的查询来判断索引怎么配置呢?

以一个实际业务场景为例 : 首先场景里面的数据分布都很均衡 , 这就导致设置的索引在查询优化器的处理下 , 很难产生最好的效果.

先来看一下表结构 :

CREATE TABLE `user_info` ( `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键id', `user_id` bigint(20) NOT NULL DEFAULT '0' COMMENT '会员ID', `user_no` bigint(20) NOT NULL DEFAULT '0' COMMENT '会员编号', `open_id` varchar(128) NOT NULL DEFAULT '' COMMENT '外部ID', `org_id` varchar(128) NOT NULL DEFAULT '0' COMMENT '组织ID', `listen_num` int(11) NOT NULL DEFAULT '0' COMMENT '记录次数', `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间', `create_person` varchar(50) NOT NULL DEFAULT '' COMMENT '创建人', `update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间', `update_person` varchar(50) NOT NULL DEFAULT '' COMMENT '更新人', PRIMARY KEY (`id`), KEY `idx_user_id` (`user_id`), KEY `idx_org_id_open_id` (`org_id`,`open_id`) USING BTREE, KEY `idx_create_time` (`create_time`) USING BTREE, KEY `idx_update_time` (`update_time`) USING BTREE ) COMMENT='会员记录表'; 复制代码

  • 需要获取到记录次数 (listen_num) > 0 用户的会员编号 (user_no)
  • org_id 只有四种数据 (A/B/C/D) , 每种数据预计占25% - 30%
  • 数据是重复修改的关系 , 修改后会更新 update_time
基础信息
// 1. 总记录数 4200000 // 2. 不同 org_id 下的记录数 - 1234567890 : 100万 - 9876543210 : 100万 - 8888888888 : 100万 - 6666666666 : 100万 - 其他 : 20万 // 3. 时间周期 > 2022-01 > 2022-12 复制代码 3.1 以 user_id 为条件进行查找的思路

 

listen_num 本身没有创建索引 , 以该字段查肯定会走全表 , 优先考虑的思路就是 > user_id 为条件进行有序查询 :

explain select * from user_info where user_id > 69999887 and listen_num > 0 复制代码


 

这里看起来好像万事大吉 , 你看索引不是生效了吗 , 只扫描了16行 ,nice!

但是 , 回想一下 B+Tree 的原则 , 在节点里面搜索条件是由小到大有序排列的 , 而带了这个 user_id 处 , 实际上已经快结束了 , 查询优化器理所当然地选择了通过 idx_user_id 进行查询

如果以开始ID做查询条件 ,可以发现实际上索引没有生效 , 而类型也是全表

explain select * from user_info where user_id > 10000025 and listen_num > 0 复制代码


 

总结 : 当索引字段遍布整个数据范围 , 且查询很分散的时候 , 在前排序区间的数据可能会放弃使用索引

3.2 以更新时间为查询条件

既然二级索引里面是有序 , 那么以时间作为查询条件是不是最好的 ?

EXPLAIN SELECT * FROM user_info WHERE update_time > "2022-08-03 01:04:55" AND update_time < "2022-09-03 01:04:55" AND listen_num > 0 LIMIT 100 复制代码


 

这里看起来就很不错了 , 查询行数和索引都使用得很理想. 但是这里面会有一个致命的问题 , 如果是大批量数据查询 , 那么这里一定会出现深度分页的问题

3.3 简单优化通过 orgId 进行切割

首先数据结构的特点是什么? >> 四个组织分布很平均 , 也就是说如果 org_id 生效 ,我们至少可以只保存四分之一的查询量

EXPLAIN SELECT * FROM user_info WHERE org_id = "123" and update_time > "2022-08-03 01:04:55" AND update_time < "2022-09-03 01:04:55" and listen_num > 0 LIMIT 100 复制代码


 

 

初步总结

 

通过以上三个案例 , 基本上就可以看出 explain 的基本用法

 

  • 通过 type 判断比较的类型
  • 通过 key 判断是否使用了自己期望的索引
  • 通过 row 判断这个索引的效果
3.4 多索引条件的抉择

 

要记住的一点是 , 索引并不是我们以为的样子 ,当多个索引同时存在的时候 , MySQL 会根据情况进行选择. 比如 :

EXPLAIN SELECT * FROM user_info WHERE org_id = "1234567890" and update_time > "2022-08-03 01:04:55" AND update_time < "2022-08-04 01:04:55" and listen_num > 0 LIMIT 100 复制代码


 

如果这里把时间周期拉长 , 那么结果也会相应的转变 :

EXPLAIN SELECT * FROM user_info WHERE org_id = "1234567890" and update_time > "2022-08-03 01:04:55" AND update_time < "2022-09-04 01:04:55" and listen_num > 0 LIMIT 100 复制代码


 

3.5 连表查询的关注点

连表查询中主要关注的属性是 filtered , 来实际来看看这个属性 :

// org 是个很简单的表 , org_id 即对于其ID EXPLAIN SELECT * FROM user_info as u , org as o WHERE org_id = "123" and u.org_id = o.id 复制代码


 

 

  • 在单表时 , filtered 表示索引生效的占比 . 简单来说 ,比例越高,则索引利用率越高
  • 在多表时 , 这个表示次表需要查询的行数占比. 也就是被驱动的表剩余的查询次数
四. 深入问题 4.1 explain 的结果能作为最终决策吗?

 

explain 的结果并不能作为最终决策行为 , explain 是执行计划 , 计划和实际是会存在偏差的, 毕竟 explain 没有真的执行.

哪怕我们最终只需要100行 , 按照 ID 排序的情况下只查几行 , 实际上执行计划的 row 仍然会很庞大.

总结

explain 主要作为参考 , 在实际使用中 , 需要更多的经验思考. 可能最终的结果和explain的不一致.

例如上面的案例 , 按照 explain 的做法 , 用短时间周期最好 ,其次应该是 org_id .

但是根据业务场景 ,我会选择通过 > id 的方式循环查. 一个是业务原因 ,查询的量大 , 上述两种方式都不能避免深度翻页的问题.

 

作者:AntBlack 链接:https://juejin.cn/post/7154744473048580110 来源:稀土掘金 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


Tags:explain   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
MySQL : explain 快速查询手册
一. 前言这一篇来详细看看 EXPLAIN 各个参数的含义和扩展 , 整理出来便于使用时快速查询二 . explain 使用 三. 业务实践在日常实践中 , 我们应该如何使用 explain 提供的...【详细内容】
2022-10-17  Search: explain  点击:(339)  评论:(0)  加入收藏
MySQL 的 EXPLAIN 语句及用法
在MySQL中 DESCRIBE 和 EXPLAIN 语句是相同的意思。DESCRIBE 语句多用于获取表结构,而 EXPLAIN 语句用于获取查询执行计划(用于解释MySQL如何执行查询语句)。通过 EXPLAIN 语句...【详细内容】
2022-05-18  Search: explain  点击:(472)  评论:(0)  加入收藏
▌简易百科推荐
MySQL 核心模块揭秘
server 层会创建一个 SAVEPOINT 对象,用于存放 savepoint 信息。binlog 会把 binlog offset 写入 server 层为它分配的一块 8 字节的内存里。 InnoDB 会维护自己的 savepoint...【详细内容】
2024-04-03  爱可生开源社区    Tags:MySQL   点击:(7)  评论:(0)  加入收藏
MySQL 核心模块揭秘,你看明白了吗?
为了提升分配 undo 段的效率,事务提交过程中,InnoDB 会缓存一些 undo 段。只要同时满足两个条件,insert undo 段或 update undo 段就能被缓存。1. 关于缓存 undo 段为了提升分...【详细内容】
2024-03-27  爱可生开源社区  微信公众号  Tags:MySQL   点击:(11)  评论:(0)  加入收藏
MySQL:BUG导致DDL语句无谓的索引重建
对于5.7.23之前的版本在评估类似DDL操作的时候需要谨慎,可能评估为瞬间操作,但是实际上线的时候跑了很久,这个就容易导致超过维护窗口,甚至更大的故障。一、问题模拟使用5.7.22...【详细内容】
2024-03-26  MySQL学习  微信公众号  Tags:MySQL   点击:(10)  评论:(0)  加入收藏
从 MySQL 到 ByteHouse,抖音精准推荐存储架构重构解读
ByteHouse是一款OLAP引擎,具备查询效率高的特点,在硬件需求上相对较低,且具有良好的水平扩展性,如果数据量进一步增长,可以通过增加服务器数量来提升处理能力。本文将从兴趣圈层...【详细内容】
2024-03-22  字节跳动技术团队    Tags:ByteHouse   点击:(25)  评论:(0)  加入收藏
MySQL自增主键一定是连续的吗?
测试环境:MySQL版本:8.0数据库表:T (主键id,唯一索引c,普通字段d)如果你的业务设计依赖于自增主键的连续性,这个设计假设自增主键是连续的。但实际上,这样的假设是错的,因为自增主键不...【详细内容】
2024-03-10    dbaplus社群  Tags:MySQL   点击:(9)  评论:(0)  加入收藏
准线上事故之MySQL优化器索引选错
1 背景最近组里来了许多新的小伙伴,大家在一起聊聊技术,有小兄弟提到了MySQL的优化器的内部策略,想起了之前在公司出现的一个线上问题,今天借着这个机会,在这里分享下过程和结论...【详细内容】
2024-03-07  转转技术  微信公众号  Tags:MySQL   点击:(28)  评论:(0)  加入收藏
MySQL数据恢复,你会吗?
今天分享一下binlog2sql,它是一款比较常用的数据恢复工具,可以通过它从MySQL binlog解析出你要的SQL,并根据不同选项,可以得到原始SQL、回滚SQL、去除主键的INSERT SQL等。主要...【详细内容】
2024-02-22  数据库干货铺  微信公众号  Tags:MySQL   点击:(49)  评论:(0)  加入收藏
如何在MySQL中实现数据的版本管理和回滚操作?
实现数据的版本管理和回滚操作在MySQL中可以通过以下几种方式实现,包括使用事务、备份恢复、日志和版本控制工具等。下面将详细介绍这些方法。1.使用事务:MySQL支持事务操作,可...【详细内容】
2024-02-20  编程技术汇    Tags:MySQL   点击:(53)  评论:(0)  加入收藏
MySQL数据库如何生成分组排序的序号
经常进行数据分析的小伙伴经常会需要生成序号或进行数据分组排序并生成序号。在MySQL8.0中可以使用窗口函数来实现,可以参考历史文章有了这些函数,统计分析事半功倍进行了解。...【详细内容】
2024-01-30  数据库干货铺  微信公众号  Tags:MySQL   点击:(54)  评论:(0)  加入收藏
mysql索引失效的场景
MySQL中索引失效是指数据库查询时无法有效利用索引,这可能导致查询性能显著下降。以下是一些常见的MySQL索引失效的场景:1.使用非前导列进行查询: 假设有一个复合索引 (A, B)。...【详细内容】
2024-01-15  小王爱编程  今日头条  Tags:mysql索引   点击:(85)  评论:(0)  加入收藏
站内最新
站内热门
站内头条