SQL Server Execpt和not in 性能区别

系统 1942 0

网上有很多 except 和 not in的返回结果区别这里就就提了。

主要讲 except 和 not in 的性能上的区别。

      
        CREATE
      
      
        TABLE
      
       tb1(ID 
      
        int
      
      ) 
      

CREATE TABLE tb2(ID int )

BEGIN TRAN
DECLARE @i INT = 500
WHILE @i > 0
begin
INSERT INTO dbo.tb1
VALUES ( @i -- v - int
)
SET @i = @i - 1
end
COMMIT
      
        我测试的时候tb1 是1000,tb2 是500
      
    
      
        DBCC
      
       FREESYSTEMCACHE (
      
        '
      
      
        ALL
      
      
        '
      
      ,
      
        '
      
      
        default
      
      
        '
      
      );
      

SET STATISTICS IO ON
SET STATISTICS TIME on
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
SELECT * FROM tb1 WHERE id NOT IN ( SELECT id FROM tb2); -- 得不到任何值
SET STATISTICS IO OFF
SET STATISTICS TIME OFF

执行计划:

      
        SELECT
      
      
        *
      
      
        FROM
      
       tb1 
      
        EXCEPT
      
      
        SELECT
      
      
        *
      
      
        FROM
      
       tb2;
      
| -- Merge Join(Right Anti Semi Join, MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID]))
| -- Sort(DISTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC))
| | -- Table Scan(OBJECT:([master1].[dbo].[tb2]))
| -- Sort(DISTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC))
| -- Table Scan(OBJECT:([master1].[dbo].[tb1]))
      
        SELECT
      
      
        *
      
      
        FROM
      
       tb1 
      
        WHERE
      
       id 
      
        NOT
      
      
        IN
      
      (
      
        SELECT
      
       id 
      
        FROM
      
       tb2);
      
        --
      
      
        得不到任何值
      
      
        
| -- Hash Match(Right Anti Semi Join, HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID]))
| -- Table Scan(OBJECT:([master1].[dbo].[tb2]))
| -- Nested Loops(Left Anti Semi Join)
| -- Nested Loops(Left Anti Semi Join, WHERE:([master1].[dbo].[tb1].[ID] IS NULL))
| | -- Table Scan(OBJECT:([master1].[dbo].[tb1]))
| | -- Top(TOP EXPRESSION:((1)))
| | -- Table Scan(OBJECT:([master1].[dbo].[tb2]))
| -- Row Count Spool
| -- Table Scan(OBJECT:([master1].[dbo].[tb2]), WHERE:([master1].[dbo].[tb2].[ID] IS NULL))

SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。

(500 行受影响)
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 1,逻辑读取 1 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

(6 行受影响)

(1 行受影响)

SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 528 毫秒。

(500 行受影响)
表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 3,逻辑读取 1002 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

(10 行受影响)

(1 行受影响)

SQL Server 执行时间:
CPU 时间 = 16 毫秒,占用时间 = 498 毫秒。

SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。


结论:通过较多数据 和 较少数据的测试,在较少数据的情况下 not in 比 except 性能好,但是在较多数据情况下 execpt 比 not in 出色。

        看执行计划可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的执行计划开可以得到优化。

        

如果大家有兴趣可以看看 not exists 的执行计划。建议:

大家不要迷信测试结果,因为所有的性能都是和执行计划密切相关的。而执行计划和统计数据又密不可分。

所以过度的迷信测试结果,可能会对生产库造成性能的影响达不到预期的性能效果。

 

 

 

 




SQL Server Execpt和not in 性能区别


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论