书签分享收藏举报版权申诉 / 9

立即下载加入VIP,免费下载

当前位置：首页 > 农林牧渔 > 林学 > 写有效率的SQL查询VIWord文档下载推荐.docx

写有效率的SQL查询VIWord文档下载推荐.docx

文档编号：20791650
上传时间：2023-01-25
格式：DOCX
页数：9
大小：140.49KB

《写有效率的SQL查询VIWord文档下载推荐.docx》由会员分享，可在线阅读，更多相关《写有效率的SQL查询VIWord文档下载推荐.docx（9页珍藏版）》请在冰豆网上搜索。

写有效率的SQL查询VIWord文档下载推荐.docx

else

outputrowAandrowsB;

}

MergeJoin:

两个表都按照关联字段排序好之后，mergejoin操作从每个表取一条记录开始匹配，如果符合关联条件，则放入结果集中；

否则，将关联字段值较小的记录抛弃，从这条记录对应的表中取下一条记录继续进行匹配，直到整个循环结束。

我们通过最简单的情况来计算NestedLoop和MergeJoin的消耗：

两张表A、B，分别有m、n行数据（m<

n），占用基础表物理存储空间分别为a、b页，聚集索引树非叶节点都是两层（一层根节点，一层中间级节点），A、B的聚集索引建在A.col1、B.col1上。

一条查询语句：

selectA.col1,B.col2fromAinnerjoinBwhereA.col1=B.col1。

执行NestedLoop操作：

A作为outerinput，B作为innerinput时：

A带来的IO为a；

每次通过clusteredindexseek执行内部循环，花费3（一个根节点、一个中间集结点、一个叶节点。

当然也可能直接从根节点就拿到要的数据，我们只考虑最坏的情况），这样执行整个嵌套循环过程消耗IO为a+3*m。

如果B作为innerinput，A作为outerinput分析类似。

执行MergeJoin:

MergeJoin要把A、B两张表做个Scan，然后进行Merge操作。

所以A、B分别带来IO为a+b就是总的逻辑IO开销。

从上述分析来看，若a+3*m<

<

a+b，即3*m<

b，那么NestedLoop性能是极佳的。

当然，我们比较A表的行和B表所占数据页大小看上去有点夸张，但是量化分析确实如此。

在这里，我们没有计算NestedLoop和MergeJoin本身的cpu计算开销，特别是后者，这部分并不能完全忽略，但是也来得有限。

OK，现在我们试图执行实际的语句验证我们的观点，看看能发现什么。

我有两张表，一张表charge，聚集索引在charge_no上，它是个intidentity（1,1），共10万行，数据页582张，聚集索引非叶节点2层。

一张表A，聚集索引在col1上（唯一），共999行，数据页2张，聚集索引两层。

min（A.col1）=min（charge.charge_no）、Max（A.col1）<

max（charge.charge_no）。

我们在setstatisticsioon和setstatisticstimeon之后，执行语句：

selectA.col1,charge.member_nofromAinnerjoincharge

onA.col1=charge.charge_no

option（loopjoin）-–执行NestedLoop

go

onA.col1=charge.charge_no

option（mergejoin）--执行MergeJoin。

结果集都是999行，而且我们看到消息窗口中输出为：

（图1）

从上图中我们注意到几点比较和最初分析不同的地方：

1.

NestedLoop时，表A的逻辑读是4，而不是预计中的表A数据页大小2；

charge逻辑读2096，而不是预计中的3×

999。

2.

MergeJoin时，表Charge的逻辑读只有8。

对1来说，表A的逻辑读是4是因为clusteredindexscan需要从聚集索引树根节点开始去找最开始的那张数据页，表A的聚集索引树深度为2，所以多了两个非页节点的IO。

不是3×

999是因为有些记录（设为n）直接从根节点就能找到，也就是说有些是2×

n+（999-n）*3

对2来说，MergeJoin时，表Charge并不是从头到尾扫描，而是从A表的最大最小值圈定的范围之内进行扫描，所以实际上它只读取了6张数据页。

OK,为了验证对2的解释，我们在表A中插入一条col1>

max（charge.charge_no）的记录，然后执行：

（图2）

现在charge逻辑读成了582+2=584，验证了我们的想法。

那么如果min（A.col1）>

min（charge.charge_no），max（A.col1）=max（charge.charge_no）时SQLServer会不会聪明到再次选择一个较小的扫描范围呢？

很遗憾，不会-_-….不知道MS这里基于什么考虑。

========================================

我们现在回到图1，实际上我们从图1中还能发现SQL的分析编译占用时间相对执行占用时间不仅不能忽略，还占了很大比重，所以能避免编译、重编译，还是要尽可能的避免。

OK，现在我们开始分析分析执行计划，看看SQLServer如何在不同的执行计划之间做选择。

我们首先把A表truncate掉，然后里面就填充一条数据，updatestatisticsA之后，看看执行计划：

（图3：

NestedLoop的执行计划）

（图4：

MergeJoin的执行计划）

我们把鼠标分别移到图3和图4中A表的ClusteredIndexScan上，会看到完全一样的tip：

这个“I/O开销”就是两个逻辑IO的开销（就一条记录，自然是一个聚集索引根节点页，一个数据页，所以是2）；

估计行数为1，很准确，我们就1行记录。

现在我们把鼠标分别移动到图3、图4中charge表的ClusteredIndexScan上，看到的则略有不同

（图5：

NestedLoop）（图6：

MergeJoin）

NestedLoop中的开销评估看起来还算正常，运算符开销=（估计IO开销+估计CPU开销）×

估计行数。

（注意，NestedLoop中，大表是作为内存循环存在的，计算运算符开销别忘了乘上估计行数）。

但是MergeJoin中我们发现“估计行数”很不正常，居然是总行数（相应的，估计IO开销和估计CPU开销自然都是全表扫描的开销，这个可以跟select*fromcharge的执行计划做个对比）。

显然，执行计划中显示的和实际执行情况非常不同，实际情况按照我们上面的分析，应该就读取3张数据页，估计行数应该为1。

误差是非常巨大的，3IO直接给估算成了584IO。

翻了翻在pk_charge上的统计信息，采样行数10w，和总行数相同，再加上第二个结果集提供的信息，已经足够采取优化算法去评估查询计划。

不知道MS为什么没有做。

好吧，我们假设执行计划的评估总是估算最坏的情况。

由于MergeJoin算法比较简单，后面我们只关注NestedLoop.

我们首先给A表增加一行（值为2），然后再来分析执行计划。

（图7：

A表NestedLoop）（图8：

charge表NestedLoop）

我们从图7上可以看到，IO开销没有增加，CPU开销略微增加，这很容易理解，A表只增加了一行，其占用索引页和数据页和原来一样。

但是由于行数略有增加，cpu消耗一定会略有增加。

奇怪的是图8显示的charge表上的seek.对比图5，运算符开销并没有像我们预料的那样增加一倍，而是增加了0.003412–0.003283=0.000129.这个数值远小于IO开销。

为了多对比一次，这次我们再往A表里面插入一条记录（值为3），再来看看charge表上的运算：

（图9，charge表NestedLoop）

这次我们又发现，这次增加的消耗是0.0035993–0.003412=0.0001873，仍然远远小于一次的IO开销。

好吧，那么我们假设执行计划估算算法认为，如果某一页缓存被读到SQLEngine中之后就不会再被重复读取。

为了验证它，我们试试把A表连续地增加到1000行，然后看看执行计划：

（图10，charge表NestedLoop）

我们假设每次进行clusteredindexseek消耗的cpu是相同的，那么我们可以计算出来查询计划认为的IO共有：

（运算符开销–cpu开销*1000）/IO开销=5.81984。

要知道charge表数据页总数为582，1000行恰好是100000的百分之一，1000行恰好占用了5.82页……（提醒一把，这1000行是连续值）

OMG…这次执行计划算法明显的比实际算法聪明。

看上去像是，NestedLoop在每次Loop时都会缓存本次Loop中读取的数据页，这样当下次Loop时，如果目标数据页已经读取过，就不再读取，而直接从Engine内存中取。

=========================================================

从上面的讨论可以看出，有时候执行计划挺聪明，有时候实际的执行又很聪明，总之，咱是不知道为啥微软不让执行计划和实际的执行一样聪明，或者一样愚蠢。

这样，至少SQL引擎在评估查询计划的时候可以比较准确。

btw:

接着图10的例子，各位安达还可以自己去试试insert一条大于max（charge.charge_no）的记录到表A里，然后试试看看charge表运算符上有什么变化。

==================================================

回到最初的主题，根据我们看到的SQL引擎实际执行看，只有A表行集远远小于charge_no的时候，SQLServer为我们选择的NestedLoop才是非常高效的；

为了保证更小的IO，当（B表索引树深度*A表行数>

B表数据页+B表索引树深度）的时候，就可以考虑是否要指定MergeJoin。

值得一提的是，经过多次的实验，SQL这样评估MergeJoin和NestedLoop，最后选择它认为更优的查询计划，居然多数情况下都是正确的……我是晕了，不知道你晕了没有。

==================

刚才（22:

00）本子待机了一次，然后再开机的时候我没办法重现SQLServer自己选择NestedLoop总是比MergeJoin的cpu占用时间短了。

现在的情况是：

SQLServer每次都错误的选择了NestedLoop，导致的结果是IO相差20～30倍，执行时间多了百分之50。

============================

俺也不知道有多少人读到了这里，呵呵。

So盼望有人可以解释以上这些东西。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 有效率 SQL 查询 VI

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：写有效率的SQL查询VIWord文档下载推荐.docx
链接地址：https://www.bdocx.com/doc/20791650.html

写有效率的SQL查询VIWord文档下载推荐.docx

热门标签