SQL执行顺序
- (8)
SELECT
(9)DISTINCT
column,…
选择字段 、去重- (6)
AGG_FUNC(column or expression)
,…
聚合函数- (1)
FROM [left_table]
选择表- (3)
JOIN
链接- (2)
ON
链接条件- (4)
WHERE
条件过滤- (5)
GROUP BY
分组- (7)
HAVING
分组过滤- (10)
ORDER BY
排序- (11)
LIMIT
count OFFSET count;
分页
可见,SQL执行并不是按照语句的顺序进行的,这点要注意,这个顺序的理解也是后续对SQL优化的一个基础。上面的几个关键点需要注意:
FROM 才是 SQL 语句执行的第一步,并非 SELECT。 数据库在执行 SQL 语句的第一步是将数据从硬盘加载到数据缓冲区中,以便对这些数据进行操作。
SELECT 是在大部分语句执行了之后才执行的,严格的说是在 FROM 和 GROUP BY 之后执行的。理解这一点是非常重要的,这就是你不能在 WHERE 中使用在 SELECT 中设定别名的字段作为判断条件的原因。
无论在语法上还是在执行顺序上, UNION 总是排在 ORDER BY 之前。很多人认为每个 UNION 段都能使用 ORDER BY 排序,但是根据 SQL 语言标准和各个数据库 SQL 的执行差异来看,这并不是真的。尽管某些数据库允许 SQL 语句对子查询(subqueries)或者派生表(derived tables)进行排序,但是这并不说明这个排序在 UNION 操作过后仍保持排序后的顺序。
七个查询命令的特征
- from
- where
- group by
- having
- select
- order by
- limit
from作用
- 将硬盘中的表文件加载到内存中,生成一张全新的临时表
- 定位内存中已经存在的临时表
- 注意
- 一个sql中最先执行的永远都是from
- 如果from定位的是内存中的一个临时表,这个临时表必须手动指定表名
where作用
- where操作的是由from命令生成的临时表
- where会循环遍历当前临时表中的每一个数据行,将满足条件的数据行保存到一个全新的临时表中
- 注意
- 由于where命令每次操作的是一行数据,因此where中无法使用聚合函数(分组函数)作为条件!!!
group by作用
- 首先对临时表中的数据进行一次排序处理,
- 然后将具有相同特征的数据行保存到同一个临时表中
- group by注意
- 多字段分组,分组字段执行顺序对于查询结果来说没有任何影响
- 多字段分组,从第二个分组字段开始,操作的临时表是上一个分组字段生成的临时表
- 如果select操作的是group by提供的临时表,select会遍历生成的每一个临时表
- 在操作具体临时表时,select只会读取指定字段中第一个数据行内容
having作用
- 将group by生成的临时表中不符合条件的数据做删除处理
- having注意
- having不能独立出现,只能出现在group by之后
- having每次操作的是一个临时表,因此选择的判断条件应该是来自聚合函数(分组函数)
select作用
- 如果select操作的临时表是有from或者where命令生成的,select会将字段中左右内容读取出来,生成一张全新的临时表
- 如果select操作的临时表是有group by或者having命令生成的,select会遍历所有临时表,select只会读取指定字段中第一个数据行
order by作用
针对select生成的临时表进行排序,将排序的内容组成一个全新的临时表
order by注意
- 如果order by使用字段名进行排序,字段名可以不出现在select生成的临时表中
- 如果order by使用字段顺序进行排序,索引位置必须在select查询语句中出现
limit作用
对临时表中数据进行截取
查询语句特征(重点)
- 除了having,其他查询命令执行完都会生成全新的临时表
- 除了from,其他查询命令操作的临时表都是上一个命令操作生成的临时表
- 当前命令执行完毕,MySQL自动销毁上一个命令生成的临时表,所以一个查询语句执行完毕,用户只能看到最后一个查询命令生成的临时表
- 进行分组查询时,从第二个字段开始,操作的临时表是上一个字段分组生成的临时表
查询命令执行效率过慢分析(从最慢开始)
- group by
- order by
- where
- limit
- 多表查询
group by执行慢原因
group by会先对临时表中的数据进行一次数据排序,然后进行分组
order by执行慢原因
order by需要对select生成的临时表进行一次排序,然后将排好序的数据行组成一张新的临时表
where执行慢原因
where需要对临时表中所有数据进行遍历,如果临时表中数据过多,就会导致执行速度过慢
limit执行慢原因
如果指定的起始行数过大,导致查询速度变慢
多表查询过慢情况
没有指定表文件加载顺序,会导致查询速度过慢
查询命令执行过慢原因
- 执行时需要对所有数据进行排序
- 执行时需要读表中所有数据进行遍历
- I/O流加载表文件的次数(小表驱动大表的原则)