《Replication的犄角旮旯》系列导读
Replication的犄角旮旯(一)--变更订阅端表名的应用场景
Replication的犄角旮旯(二)--寻找订阅端丢失的记录
Replication的犄角旮旯(三)--聊聊@bitmap
Replication的犄角旮旯(四)--关于事务复制的监控
Replication的犄角旮旯(五)--关于复制identity列
Replication的犄角旮旯(六)-- 一个DDL引发的血案(上)(如何近似估算DDL操作进度)
Replication的犄角旮旯(七)-- 一个DDL引发的血案(下)(聊聊logreader的延迟)
Replication的犄角旮旯(八)-- 订阅与发布异构的问题
Replication的犄角旮旯(九)-- sp_setsubscriptionxactseqno,赋予订阅活力的工具
---------------------------------------华丽丽的分割线--------------------------------------------
关于replication中的bitmap,貌似介绍的文档不多;本文将从对此参数做一初步的简析,并介绍如何利用这个参数处理一些特定环境下的问题;
再次强调, 本方法虽多次经受验证无误,但多次被MS supporter们建议不要尝试使用此方法,还望各位DBA三思!
先来看看@bitmap在哪里出现
我们先创建一个表的复制订阅,表结构如下
1 USE [ test_aaa ] 2 GO 3 4 /* ***** Object: Table [dbo].[test_b] Script Date: 2014/1/23 16:12:28 ***** */ 5 SET ANSI_NULLS ON 6 GO 7 8 SET QUOTED_IDENTIFIER ON 9 GO 10 11 SET ANSI_PADDING ON 12 GO 13 14 CREATE TABLE [ dbo ] . [ test_b ] ( 15 [ id1 ] [ int ] NOT NULL , 16 [ id2 ] [ int ] NOT NULL , 17 [ id3 ] [ int ] NOT NULL , 18 [ id4 ] [ int ] NOT NULL , 19 [ name ] [ varchar ] ( 10 ) NULL , 20 [ remark1 ] [ varchar ] ( 100 ) NULL , 21 [ remark2 ] [ varchar ] ( 100 ) NULL , 22 [ remark3 ] [ varchar ] ( 100 ) NULL , 23 [ remark4 ] [ varchar ] ( 100 ) NULL , 24 CONSTRAINT [ pk_id1_id2_id3_id4 ] PRIMARY KEY CLUSTERED 25 ( 26 [ id1 ] ASC , 27 [ id2 ] ASC , 28 [ id3 ] ASC , 29 [ id4 ] ASC 30 ) WITH (PAD_INDEX = OFF , STATISTICS_NORECOMPUTE = OFF , IGNORE_DUP_KEY = OFF , ALLOW_ROW_LOCKS = ON , ALLOW_PAGE_LOCKS = ON ) ON [ PRIMARY ] 31 ) ON [ PRIMARY ] 32 33 GO 34 35 SET ANSI_PADDING OFF 36 GO
到订阅库的存储过程中,找到sp_MSupd_dbotest_b,生成脚本
1 USE [ test_byxl1 ] 2 GO 3 /* ***** Object: StoredProcedure [dbo].[sp_MSupd_dbotest_b] Script Date: 2014/1/23 14:28:46 ***** */ 4 SET ANSI_NULLS ON 5 GO 6 SET QUOTED_IDENTIFIER ON 7 GO 8 ALTER procedure [ dbo ] . [ sp_MSupd_dbotest_b ] 9 @c1 int = NULL , 10 @c2 int = NULL , 11 @c3 int = NULL , 12 @c4 int = NULL , 13 @c5 varchar ( 10 ) = NULL , 14 @c6 varchar ( 100 ) = NULL , 15 @c7 varchar ( 100 ) = NULL , 16 @c8 varchar ( 100 ) = NULL , 17 @c9 varchar ( 100 ) = NULL , 18 @pkc1 int = NULL , 19 @pkc2 int = NULL , 20 @pkc3 int = NULL , 21 @pkc4 int = NULL , 22 @bitmap binary ( 2 ) 23 as 24 begin 25 if ( substring ( @bitmap , 1 , 1 ) & 1 = 1 ) or 26 ( substring ( @bitmap , 1 , 1 ) & 2 = 2 ) or 27 ( substring ( @bitmap , 1 , 1 ) & 4 = 4 ) or 28 ( substring ( @bitmap , 1 , 1 ) & 8 = 8 ) 29 begin 30 update [ dbo ] . [ test_b ] 31 set [ id1 ] = case substring ( @bitmap , 1 , 1 ) & 1 when 1 then @c1 else [ id1 ] end , 32 [ id2 ] = case substring ( @bitmap , 1 , 1 ) & 2 when 2 then @c2 else [ id2 ] end , 33 [ id3 ] = case substring ( @bitmap , 1 , 1 ) & 4 when 4 then @c3 else [ id3 ] end , 34 [ id4 ] = case substring ( @bitmap , 1 , 1 ) & 8 when 8 then @c4 else [ id4 ] end , 35 [ name ] = case substring ( @bitmap , 1 , 1 ) & 16 when 16 then @c5 else [ name ] end , 36 [ remark1 ] = case substring ( @bitmap , 1 , 1 ) & 32 when 32 then @c6 else [ remark1 ] end , 37 [ remark2 ] = case substring ( @bitmap , 1 , 1 ) & 64 when 64 then @c7 else [ remark2 ] end , 38 [ remark3 ] = case substring ( @bitmap , 1 , 1 ) & 128 when 128 then @c8 else [ remark3 ] end , 39 [ remark4 ] = case substring ( @bitmap , 2 , 1 ) & 1 when 1 then @c9 else [ remark4 ] end 40 where [ id1 ] = @pkc1 and [ id2 ] = @pkc2 and [ id3 ] = @pkc3 and [ id4 ] = @pkc4 41 if @@rowcount = 0 42 if @@microsoftversion > 0x07320000 43 exec sp_MSreplraiserror 20598 44 end 45 else 46 begin 47 update [ dbo ] . [ test_b ] 48 set [ name ] = case substring ( @bitmap , 1 , 1 ) & 16 when 16 then @c5 else [ name ] end , 49 [ remark1 ] = case substring ( @bitmap , 1 , 1 ) & 32 when 32 then @c6 else [ remark1 ] end , 50 [ remark2 ] = case substring ( @bitmap , 1 , 1 ) & 64 when 64 then @c7 else [ remark2 ] end , 51 [ remark3 ] = case substring ( @bitmap , 1 , 1 ) & 128 when 128 then @c8 else [ remark3 ] end , 52 [ remark4 ] = case substring ( @bitmap , 2 , 1 ) & 1 when 1 then @c9 else [ remark4 ] end 53 where [ id1 ] = @pkc1 and [ id2 ] = @pkc2 and [ id3 ] = @pkc3 and [ id4 ] = @pkc4 54 if @@rowcount = 0 55 if @@microsoftversion > 0x07320000 56 exec sp_MSreplraiserror 20598 57 end 58 end
看到这么多@bitmap,是不是有种升仙的感觉?
@bitmap 是binary类型,即二进制串;简单来说,它是用来表示所操作的字段位置的参数,通过@bitmap,分发代理从distribution.dbo.msrepl_commands中读取命令时(update操作),才会知道哪些列进行了更新;
我们先来解析一下这个存储过程;
1、根据表结构的code,我们知道这个表共有9个字段,其中id1~id4被定义为联合主键;
由于binary(1)表示1个字节(8位的2进制),因此我们表示9个字段的@bitmap就只能用binary(2)来容纳了;
其次,有的童鞋说,他们看到的update存储过程只有一个程序段,而我的例子中有两部分(29行~44行、46行~57行)。这个是由于存在联合主键造成的;即当被订阅的表中含有联合主键(2个或以上的字段一同作为主键)的时候才会出现两段代码,前者是更新主键列,后者则是更新非主键列;
2、根据更新列的位置不同,@bitmap中的对应的值也不同;
substring(@bitmap,1,1) & 1 = 1 表示第一列有更新;
substring(@bitmap,1,1) & 2 = 2 表示第二列有更新;
substring(@bitmap,1,1) & 4 = 4 表示第三列有更新;
以此类推
substring(@bitmap,1,1) & 128 = 128 表示第八列有更新;
那第九位呢? =256么? 由于1个字节只有8位,而128=2^7,当第九位出现时就要进位了
substring(@bitmap,2,1) & 1 = 1
怎么样,不难理解吧?
定义4个字段的联合主键只是为了举例说明的时候方便一些,实际的生产环境中可能不太经常能遇到;
再来看一下@bitmap在哪里可以获取到呢?我先更新一条记录,更新之前先关闭相应的分发代理(此处不需要分发命令应用到订阅端)
我们去distribution里看看具体的分发命令(具体做法请见《 Replication的犄角旮旯(二)--寻找订阅端丢失的记录 》)
从命令中我们可以看出,更新的列位置为第5(name)、7(remark2)、8(remark3)列,按照二进制的表示方法为(注意反取,即←表示第1至第9位)
0 1101 0000
由于第九位没有更新,因此为0,所以bitmap就是 1101 0000,换成十六进制就是0xD0,由于bitmap超出1个字节,因此后面再补0,就是我们看到的0xd000了
可能看到这里,有些童鞋会说,这太麻烦了,遇到一个很宽的表,光数逗号就数死了……尽管我们明白逗号是为了分割字段的,但系统为什么会这样生成呢,这个问题可以参考: http://msdn.microsoft.com/zh-cn/library/ms152489%28v=sql.120%29.aspx
这个和article的属性,调用订阅端存储过程方式有关(SCALL),这个不是本文的重点,在此不做赘述;
根据上面的算法,我们就可以知道,当我们要更新一个表时,可以根据更新列的位置,推算出实际的bitmap值,但这又有什么用呢?
-------------------------------------我是华丽丽的分割线-------------------------------------
应用场景:一个表(还是说商品表吧,比较典型),保存商品信息、简介等内容,都是varchar(max)或text类型;商家在促销活动前通常会大批量的更新这些内容(比如加个促销活动介绍等等),更新大字段是复制环境中最头疼的问题;
由于一条复制命令有长度限制(1K左右),如果一条更新记录中的更新内容过大,就会被拆分成多条命令写到msrepl_commands中(我曾经碰到过1条记录的更新操作被拆成100个复制命令),如果高峰时期有用户大量的进行这种操作,那作为DBA就可以升级为“张三疯”了;
这时候我们就可以根据具体的update命令(一般除了更新必要的字段外,还会捎带更新updatetime这样的时间戳,具体就去找研发兄弟们要吧),计算出相应的bitmap,然后在相应的存储过程中加个判断,屏蔽掉这样的操作;
具体操作就是,在sp_MSupd_dbotest_b这里的第24、25行之间加上
if @bitmap=0xd000
return;
再打开分发代理,这样就屏蔽了@bitmap=0xd000的全部操作;
按照前面的操作,并没有进行下面的更新
而我在此之后又从发布服务器insert了一条主键为2,2,2,2的记录,以证明该操作在update之后已经传到了订阅端,而update被屏蔽了;
需要注意的是,由于按位操作是绝对严格,对于只更新column1和同时更新column1、column2将产生不同的bitmap,操作时一定要谨慎;