SQL语句是如何执行的
学习一下mysql的基础架构,从一条sql语句是如何执行的来学习。
一般我们写一条查询语句类似下面这样:
select user,password from mysql.user;
这样就可以返回一个结果,但却不知这条语句的内部执行流程。
如下是mysql的逻辑架构图:
Mysql可以分为Server层和存储引擎层二部分。
Server层有连接器/缓存/分析器/优化器/执行器,涵盖了mysql的很多核心功能。
存储引擎层负责数据的存储和读取,支持Innodb,MyIsam,Memory,BlackHole等,Mysql5.5版本后默认的存储引擎是Innodb。
接下来我们一层一层来看SQL语句的执行过程。
1)连接器
首先客户端连接mysql时就是连接到了连接器上,连接器负责跟客户端建立连接/校验用户身份,获取权限。连接命令一般如下:
mysql -h ip地址 -P 端口 -u 用户 -p
当客户端输入完了用户名和密码开始连接时,连接器会校验:
这就意味着一个用户成功建立连接之后,即使你用管理员把这个用户的权限更改了,也是不会影响到已经连接的这个用户,除非这个用户断开重新连接。让连接器重新读取权限才可以。
2)查询缓存
连接建立成功之后,你就能够执行select等语句了,这时就会进行第二步:查询缓存
Mysql收到一个sql请求之后,先检查缓存,看看之前是不是有执行过。如果执行过并缓存没有过期,结果会以key-value的形式存储在内存中,key是查询语句,value是查询结果。如果有缓存,直接把对应的value返回给客户端。
如果语句不在查询缓存中,就会向下执行下面的阶段,执行完成后,会把结果放到缓存中。
查询缓存的失效很平凡,因为只要更新一个表,那么这个表的所有查询缓存结果都会被清空,所以对经常变更的表,查询缓存的命中率很低。除非这个表数据比较稳定,不经常改变,才适合查询缓存。
了解下:Mysql8.0版本之后,查询缓存的功能就被删了。
3)分析器
如果没用命中缓存,分析器就开始工作了,对sql语句进行解析。
首先分析器会做“词法分析”,你输入的多个字符加上空格组成的sql语句,分析器需要分析出来里面字符分别都代表什么。
如从你输入的"select"关键字开始,mysql知道这是一个查询语句,然后分析出那个是表名,那个是你输入的条件等等。
做完了词法分析,开始做“语法分析”,根据词法分析的结果,语法分析会判断你输入的这条sql语句是否符合Mysql语法。
如果你的语句不对,就会收到“You have an error in you SQL syntax”的错误提醒,如果下面这个语句select少打了开头的字母“s”。
mysql> elect * from stu; ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'elect * from stu' at line 1
一般语法错误会提示第一个出现错误的位置,所以你要关注的是紧接着“use near”后面的内容。
4)优化器
经过了分析器,Mysql已经知道你要做什么了,在开始执行之前,还需要经过优化器的处理。
优化器是在表里面有多个索引的时候,决定使用哪个索引;或者在一个语句有多表关联的时候,决定各个表的连接顺序。
5)执行器
Mysql通过分析器知道了你要做什么,通过优化器知道了如何做,接下来就是执行器开始执行语句;
开始执行之前, 会先判断你对要操作的表或库有没有权限,如果没有就返回权限的错误。
如果有权限,就打开表继续执行。打开表的时候,执行器会根据表的引擎定义,去使用这个引擎提供的接口。
比如这个select语句:select * from db1 where ID=100;
至此,这个select语句算是执行完了。
数据库的慢查询日志中会看到rows_examined的字段,表示这个语句执行过程中扫描了多少行。这个值就是在执行器每次调用引擎获取数据行的时候累加的。
有些情况下,执行器调用一次,在引擎内部则扫描了多行,因此引擎扫描行数跟rows_examined并不完全相同。
这样Mysql的逻辑架构和流程过了一遍,我也对整个sql语句的执行过程的各个阶段有了一个初步的认识。也希望能对大家有帮助。