sql的执行顺序问题.docx
- 文档编号:51517
- 上传时间:2022-10-01
- 格式:DOCX
- 页数:8
- 大小:22.92KB
sql的执行顺序问题.docx
《sql的执行顺序问题.docx》由会员分享,可在线阅读,更多相关《sql的执行顺序问题.docx(8页珍藏版)》请在冰豆网上搜索。
sql的执行顺序问题
查询语句中selectfromwheregroupbyhavingorderbylimit的执行顺序
1.查询中用到的关键词主要包含六个,并且他们的顺序依次为
select--from--where--groupby--having--orderby--limit
其中select和from是必须的,其他关键词是可选的,这六个关键词的执行顺序
与sql语句的书写顺序并不是一样的,而是按照下面的顺序来执行
from--where--groupby--having--select--orderby,
from:
需要从哪个数据表检索数据
where:
过滤表中数据的条件
groupby:
如何将上面过滤出的数据分组
having:
对上面已经分组的数据进行过滤的条件
select:
查看结果集中的哪个列,或列的计算结果
orderby:
按照什么样的顺序来查看返回的数据
limit:
截取出目标页数据
2.from后面的表关联,是自右向左解析的
而where条件的解析顺序是自下而上的。
也就是说,在写SQL文的时候,尽量把数据量大的表放在最右边来进行关联,
而把能筛选出大量数据的条件放在where语句的最下面。
SQLSelect语句完整的执行顺序【从DBMS使用者角度】:
1、from子句组装来自不同数据源的数据;
2、where子句基于指定的条件对记录行进行筛选;
3、groupby子句将数据划分为多个分组;
4、使用聚集函数进行计算;
5、使用having子句筛选分组;
6、计算所有的表达式;
7、使用orderby对结果集进行排序。
8、使用limit截取目标页数据
SQLSelect语句的执行步骤【从DBMS实现者角度,这个对我们用户意义不大】:
1)语法分析,分析语句的语法是否符合规范,衡量语句中各表达式的意义。
2)语义分析,检查语句中涉及的所有数据库对象是否存在,且用户有相应的权限。
3)视图转换,将涉及视图的查询语句转换为相应的对基表查询语句。
4)表达式转换,将复杂的SQL表达式转换为较简单的等效连接表达式。
5)选择优化器,不同的优化器一般产生不同的“执行计划”
6)选择连接方式,ORACLE有三种连接方式,对多表连接ORACLE可选择适当的连接方式。
7)选择连接顺序,对多表连接ORACLE选择哪一对表先连接,选择这两表中哪个表做为源数据表。
8)选择数据的搜索路径,根据以上条件选择合适的数据搜索路径,如是选用全表搜索还是利用索引或是其他的方式。
9)运行“执行计划”。
from子句--执行顺序为从后往前、从右到左
表名(最后面的那个表名为驱动表,执行顺序为从后往前,所以数据量较少的表尽量放后)
oracle的解析器按照从右到左的顺序处理,FROM子句中的表名,FROM子句中写在最后的表(基础表drivingtable)将被最先处理,即最后的表为驱动表,在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表。
如果有3个以上的表连接查询,那就需要选择交叉表(intersectiontable)作为基础表,交叉表是指被其他表所引用的表
多表连接时,使用表的别名并把别名前缀于每个Column上。
可以减少解析的时间并减少那些由Column歧义引起的语法错误.
▼
▼
where子句--执行顺序为自下而上、从右到左
ORACLE采用自下而上从右到左的顺序解析Where子句,根据这个原理,表之间的连接必须写在其他Where条件之前, 可以过滤掉最大数量记录的条件必须写在Where子句的末尾。
▼
▼
groupby--执行顺序从左往右分组
提高GROUPBY语句的效率,可以通过将不需要的记录在GROUPBY之前过滤掉。
即在GROUPBY前使用WHERE来过虑,而尽量避免GROUPBY后再HAVING过滤。
▼
▼
having子句----很耗资源,尽量少用
避免使用HAVING子句, HAVING只会在检索出所有记录之后才对结果集进行过滤.这个处理需要排序,总计等操作.
如果能通过Where子句在GROUPBY前限制记录的数目,那就能减少这方面的开销.
(非oracle中)on、where、having这三个都可以加条件的子句中,on是最先执行,where次之,having最后,因为on是先把不符合条件的记录过滤后才进行统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的,
where也应该比having快点的,因为它过滤数据后才进行sum,在两个表联接时才用on的,所以在一个表的时候,就剩下where跟having比较了。
在这单表查询统计的情况下,如果要过滤的条件没有涉及到要计算字段,那它们的结果是一样的,只是where可以使用rushmore技术,而having就不能,在速度上后者要慢。
如果要涉及到计算的字段,就表示在没计算之前,这个字段的值是不确定的,where的作用时间是在计算之前就完成的,而having就是在计算后才起作用的,所以在这种情况下,两者的结果会不同。
在多表联接查询时,on比where更早起作用。
系统首先根据各个表之间的联接条件,把多个表合成一个临时表后,再由where进行过滤,然后再计算,计算完后再由having进行过滤。
由此可见,要想过滤条件起到正确的作用,首先要明白这个条件应该在什么时候起作用,然后再决定放在那里。
▼
▼
select子句--少用*号,尽量取字段名称。
ORACLE在解析的过程中,会将依次转换成所有的列名,这个工作是通过查询数据字典完成的,使用列名意味着将减少消耗时间。
sql语句用大写的;因为oracle总是先解析sql语句,把小写的字母转换成大写的再执行
▼
▼
orderby子句--执行顺序为从左到右排序,很耗资源
补充:
今天遇到一个问题就是mysql中insertinto和update以及delete语句中能使用as别名吗?
目前还在查看,但是在查阅资料时发现了一些有益的知识,给大家分享一下,就是关于sql以及MySQL语句执行顺序:
sql和mysql执行顺序,发现内部机制是一样的。
最大区别是在别名的引用上。
一、sql执行顺序
(1)from
(3)join
(2)on
(4)where
(5)groupby(开始使用select中的别名,后面的语句中都可以使用)
(6)avg,sum....
(7)having
(8)select
(9)distinct
(10)orderby
从这个顺序中我们不难发现,所有的查询语句都是从from开始执行的,在执行过程中,每个步骤都会为下一个步骤生成一个虚拟表,这个虚拟表将作为下一个执行步骤的输入。
第一步:
首先对from子句中的前两个表执行一个笛卡尔乘积,此时生成虚拟表vt1(选择相对小的表做基础表)
第二步:
接下来便是应用on筛选器,on中的逻辑表达式将应用到vt1中的各个行,筛选出满足on逻辑表达式的行,生成虚拟表vt2
第三步:
如果是outerjoin那么这一步就将添加外部行,leftouterjion就把左表在第二步中过滤的添加进来,如果是rightouterjoin那么就将右表在第二步中过滤掉的行添加进来,这样生成虚拟表vt3
第四步:
如果from子句中的表数目多余两个表,那么就将vt3和第三个表连接从而计算笛卡尔乘积,生成虚拟表,该过程就是一个重复1-3的步骤,最终得到一个新的虚拟表vt3。
第五步:
应用where筛选器,对上一步生产的虚拟表引用where筛选器,生成虚拟表vt4,在这有个比较重要的细节不得不说一下,对于包含outerjoin子句的查询,就有一个让人感到困惑的问题,到底在on筛选器还是用where筛选器指定逻辑表达式呢?
on和where的最大区别在于,如果在on应用逻辑表达式那么在第三步outerjoin中还可以把移除的行再次添加回来,而where的移除的最终的。
举个简单的例子,有一个学生表(班级,姓名)和一个成绩表(姓名,成绩),我现在需要返回一个x班级的全体同学的成绩,但是这个班级有几个学生缺考,也就是说在成绩表中没有记录。
为了得到我们预期的结果我们就需要在on子句指定学生和成绩表的关系(学生.姓名=成绩.姓名)那么我们是否发现在执行第二步的时候,对于没有参加考试的学生记录就不会出现在vt2中,因为他们被on的逻辑表达式过滤掉了,但是我们用leftouterjoin就可以把左表(学生)中没有参加考试的学生找回来,因为我们想返回的是x班级的所有学生,如果在on中应用学生.班级='x'的话,leftouterjoin会把x班级的所有学生记录找回(感谢网友康钦谋__康钦苗的指正),所以只能在where筛选器中应用学生.班级='x'因为它的过滤是最终的。
第六步:
groupby子句将中的唯一的值组合成为一组,得到虚拟表vt5。
如果应用了groupby,那么后面的所有步骤都只能得到的vt5的列或者是聚合函数(count、sum、avg等)。
原因在于最终的结果集中只为每个组包含一行。
这一点请牢记。
第七步:
应用cube或者rollup选项,为vt5生成超组,生成vt6.
第八步:
应用having筛选器,生成vt7。
having筛选器是第一个也是为唯一一个应用到已分组数据的筛选器。
第九步:
处理select子句。
将vt7中的在select中出现的列筛选出来。
生成vt8.
第十步:
应用distinct子句,vt8中移除相同的行,生成vt9。
事实上如果应用了groupby子句那么distinct是多余的,原因同样在于,分组的时候是将列中唯一的值分成一组,同时只为每一组返回一行记录,那么所以的记录都将是不相同的。
第十一步:
应用orderby子句。
按照order_by_condition排序vt9,此时返回的一个游标,而不是虚拟表。
sql是基于集合的理论的,集合不会预先对他的行排序,它只是成员的逻辑集合,成员的顺序是无关紧要的。
对表进行排序的查询可以返回一个对象,这个对象包含特定的物理顺序的逻辑组织。
这个对象就叫游标。
正因为返回值是游标,那么使用orderby子句查询不能应用于表表达式。
排序是很需要成本的,除非你必须要排序,否则最好不要指定orderby,最后,在这一步中是第一个也是唯一一个可以使用select列表中别名的步骤。
第十二步:
应用top选项。
此时才返回结果给请求者即用户。
二、mysql的执行顺序
SELECT语句定义
一个完成的SELECT语句包含可选的几个子句。
SELECT语句的定义如下:
SQL代码
[java] viewplain copy
1.
SELECT子句是必选的,其它子句如WHERE子句、GROUPBY子句等是可选的。
一个SELECT语句中,子句的顺序是固定的。
例如GROUPBY子句不会位于WHERE子句的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- sql 执行 顺序 问题