MySQL的 order by 工作原理

时间：2019-05-15 17:05:34 来源：作者：

在程序设计当中，我们很多场景下都会用 group by 关键字。比如在分页读取数据时，为了避免重复扫描记录，这就是必须要使用 group by 了。

比如我们使用如下 DDL 创建表：

CREATE TABLE `user_info` (
 `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
 `city` varchar(16) NOT NULL COMMENT '城市',
 `name` varchar(16) NOT NULL COMMENT '姓名',
 `age` int(11) NOT NULL COMMENT '年龄',
 `addr` varchar(128) DEFAULT NULL COMMENT '地址',
 PRIMARY KEY (`id`),
 KEY `city` (`city`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

并且我们会执行如下查询语句

SELECT city,`name`,age FROM user_info WHERE city='上海' ORDER BY `name` LIMIT 1000;

全字段排序

因为上面的建表语句已经在 city 字段上面创建索引了，当我们使用 EXPLAIN 命令时，会有如下结果：

上面 Extra 字段中的 “Using filesort” 表示的就是需要排序，MySQL 会为每个线程分配一块内存用于排序，成为 sort_buffer。下面我们看一下 index(city) 的结构示意图。

执行流程如下：

初始化 sort_buffer，确定放入 city name age 这 3 个字段；
从 city 索引中获取到第一个 city='上海' 的记录，也就是 id_x；
到主键索引中获取对应的记录，并取出 name city age 的值放入 sort_buffer；
取下一条符合条件的记录，重复 3 4 的操作，直至不符合条件为止；
对 sort_buffer 中的数据按照 name 做快速排序；
取出前 1000 条数据并返回。

我们暂时叫这种排序过程为“全字段排序”，如下所示：

图中的“按 name 排序” 可能在内存中，也可能使用磁盘文件排序，这取决与排序所需要的内存和 sort_buffer_size 。sort_buffer_size 就是 MySQL 为排序开辟的内存大小，当所需内存小于 sort_buffer_size 时，就直接在内存中完成排序，如果所需要的内存大于 sort_buffer_size ，就需要额外的磁盘空间辅助排序。

rowid 排序

上面的算法在数据量比较大的时候，可能会出现一些问题。因为在排序的时候，存放了所有的返回字段，增加了排序空间（sort_buffer）的压力。

SET max_length_for_sort_data=16;

max_length_for_sort_data 是MySQL 限制排序行大小的参数。意思是，如果排序行大小超过了这个值，就会另选排序算法。上面 name city age 3 个字段的大小为 36，大于 16 ，在新的算法中将只有 name (排序字段) 和id 参与 sort_buffer 中的排序。过程如下

初始化 sort_buffer，确定放入 name id 这 2 个字段；
从 city 索引中获取到第一个 city='上海' 的记录，也就是 id_x；
到主键索引中获取对应的记录，并取出 name id 的值放入 sort_buffer；
取下一条符合条件的记录，重复 3 4 的操作，直至不符合条件为止；
对 sort_buffer 中的数据按照 name 做快速排序；
取出前 1000 条数据，然后根据 id 取出对应记录的 name city age 3 个字段并返回结果。

这种排序过程，我们称为 rowid 排序，过程如下所示：

全字段排序 VS rowid 排序

从上面 2 个流程看来，如果内存足够时，MySQL 会让返回值中所有字段存放在排序空间。当MySQL 内存过小时，才会考虑使用rowid 排序。但是从上面的流程看来，rowid 排序在返回结果前，还会再一次的回表。因此MySQL 认为内存充足的时候，会优先采用全字段排序。

上面的场景是：city 字段过滤后，name 字段不是有序的。其实我们可以通过联合索引来规避掉 name 字段的排序。

alter table user_info add index idx_city_user(city, name);

下面我们看一下联合索引的示意图：

从上面流程图可以看出，当我们取出 city='上海' 的记录时，name的字段也是有序的。过程如下

从 (city, name)索引中获取到第一个 city='上海' 的记录 id_x；
到主键索引中获取对应的记录，并取出 name city age 的值作为结果集的一部分直接返回；
取下一条符合条件的记录，重复 2 3 的操作，直至不符合条件或者达到 1000 条为止；

从联合索引看来，我们是可以不用排序操作了，那么我们是否可以直接通过索引就直接返回结果呢？也就是不要回表操作。答案是有的，那就是覆盖索引。

alter table user_info add index idx_city_user_age(city, name, age);

当执行查询语句时，不仅 name 中的字段是有序的，并且索引中已经包含了结果集中的所有字段，过程如下：

从 (city, name,age)索引中获取到第一个 city='上海' 的记录，并取出 name city age 的值作为结果集的一部分直接返回；
取下一条符合条件的记录，重复 1 2 的操作，直至不符合条件或者达到 1000 条为止；

参考：《极客时间：MySQL实战》、《高性能MySQL》

Tags：MySQL 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

MySQL 使用 Mysqldump 备份导入数据导致主从异常

作者：雷文霆爱可生华东交付服务部 DBA 成员，主要负责Mysql故障处理及相关技术支持。爱好看书，电影。座右铭，每一个不曾起舞的日子，都是对生命的辜负。本文来源：原创投稿 *爱可生...【详细内容】

2021-12-24　　Tags: MySQL 点击:(7)　　评论:(0)　　加入收藏

Docker如何构建mysql主从？

一、为什么要搭建主从架构呢1.数据安全，可以进行数据的备份。2.读写分离，大部分的业务系统来说都是读数据多，写数据少，当访问压力过大时，可以把读请求给到从服务器。从而缓解数据...【详细内容】

2021-12-15　　Tags: MySQL 点击:(12)　　评论:(0)　　加入收藏

分享MySQL记录锁、间隙锁、临键锁小案例演示，你学废了吗

生成间隙(gap)锁、临键(next-key)锁的前提条件是在 RR 隔离级别下。有关Mysql记录锁、间隙(gap)锁、临键锁(next-key)锁的一些理论知识之前有写过，详细内容可以看这篇文章...【详细内容】

2021-12-14　　Tags: MySQL 点击:(18)　　评论:(0)　　加入收藏

mysqlbinlog基本认识

binlog 基本认识 MySQL的二进制日志可以说是MySQL最重要的日志了，它记录了所有的DDL和DML(除了数据查询语句)语句，以事件形式记录，还包含语句所执行的消耗的时间，MySQL的二...【详细内容】

2021-12-14　　Tags: MySQL 点击:(13)　　评论:(0)　　加入收藏

百万级数据下的mysql深度解析

为查询优化你的查询大多数的MySQL服务器都开启了查询缓存。这是提高性最有效的方法之一，而且这是被MySQL的数据库引擎处理的。当有很多相同的查询被执行了多次的时候，这些查...【详细内容】

2021-12-09　　Tags: MySQL 点击:(15)　　评论:(0)　　加入收藏

Mysql数据库tinyint，int，bigint，char，varchar究竟用哪个？

测试的目的和原因，公司有很多程序员，每个程序员对数据库和表结构都有自己的理解。而且每个程序员的理解往往是以效率考虑。既然都是为了效率考虑，那么我就来测试一下究竟哪种使...【详细内容】

2021-12-08　　Tags: MySQL 点击:(14)　　评论:(0)　　加入收藏

Win下部署多个MySQL数据库实例

当你们考虑项目并发的时候，我在部署环境，当你们在纠结使用ArrayList还是LinkedArrayList的时候，我还是在部署环境。所以啊，技术不止境，我在部环境。今天这篇文章缕一下在同一台服...【详细内容】

2021-12-08　　Tags: MySQL 点击:(17)　　评论:(0)　　加入收藏

MySQL中常用的15个查询子句

对于数据分析来说，MySQL使用最多的是查询，比如对数据进行排序、分组、去重、汇总及字符串匹配等，如果查询的数据涉及多个表，还需要要对表进行连接，本文就来说说MySQL中常用的查询...【详细内容】

2021-12-06　　Tags: MySQL 点击:(21)　　评论:(0)　　加入收藏

15个MySQL常用基本SQL语句

在学习SQL语句之前，首先需要区分几个概念，我们常说的数据库是指数据库软件，例如MySQL、Oracle、SQL Server等，而本文提到的数据库是指数据库软件中的一个个用于存储数据的容器。...【详细内容】

2021-11-24　　Tags: MySQL 点击:(23)　　评论:(0)　　加入收藏

用 MySQL 实现分布式锁，你听过吗？

概述以前参加过一个库存系统，由于其业务复杂性，搞了很多个应用来支撑。这样的话一份库存数据就有可能同时有多个应用来修改库存数据。比如说，有定时任务域xx.cron，和SystemA域...【详细内容】

2021-11-05　　Tags: MySQL 点击:(31)　　评论:(0)　　加入收藏

▌简易百科推荐

MySQL 使用 Mysqldump 备份导入数据导致主从异常

2021-12-24　　爱可生　　　　Tags:MySQL 　点击:(7)　　评论:(0)　　加入收藏

分享MySQL记录锁、间隙锁、临键锁小案例演示，你学废了吗

2021-12-14　　python数据分析　　　　Tags:MySQL记录锁　点击:(18)　　评论:(0)　　加入收藏

mysqlbinlog基本认识

2021-12-14　　linux上的码农　　　　Tags:mysql 　点击:(13)　　评论:(0)　　加入收藏

百万级数据下的mysql深度解析

2021-12-09　　元宇宙iwemeta　　　　Tags:mysql 　点击:(15)　　评论:(0)　　加入收藏

Mysql数据库tinyint，int，bigint，char，varchar究竟用哪个？

2021-12-08　　吴彬的分享　　　　Tags:Mysql数据库　点击:(14)　　评论:(0)　　加入收藏

Win下部署多个MySQL数据库实例

2021-12-08　　秃头码哥　　　　Tags:MySQL数据库　点击:(17)　　评论:(0)　　加入收藏

MySQL中常用的15个查询子句

2021-12-06　　笨鸟学数据分析　　　　Tags:MySQL 　点击:(21)　　评论:(0)　　加入收藏

15个MySQL常用基本SQL语句

2021-11-24　　笨鸟学数据分析　　　　Tags:SQL语句　点击:(23)　　评论:(0)　　加入收藏

用 MySQL 实现分布式锁，你听过吗？

2021-11-05　　Java云海　　　　Tags:分布式锁　点击:(31)　　评论:(0)　　加入收藏

MySQL高级SQL语句

MySQL的进阶查询一、按关键字排序使用ORDERBY语句来实现排序排序可针对一个或多个字段ASC:升序，默认排序方式【升序是从小到大】DESC:降序【降序是从大到小】ORDER BY的...【详细内容】

2021-11-05　　Java热点　　　　Tags:SQL语句　点击:(28)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游