关于 ROWID 的介绍参考我的 Blog :
Oracle Rowid 介绍
http://blog.csdn.net/tianlesoftware/archive/2009/12/16/5020718.aspx
关于大表 Update 的一个讨论,参考 itpub :
http://www.itpub.net/viewthread.php?tid=1052077
一 . 在虚拟机上 使用 rowid 进行 update 测试
使用 rowid 进行 update 能提高速度,是因为通过 rowid 能够迅速的进行定位,不用全表进行扫描。
-- 查看表 dave 记录数
SYS@dave2(db2)> select count(*) from dave;
COUNT(*)
----------
3080115 --300 万数据
-- 创建测试表 dba
SYS@dave2(db2)> create table dba as select * from dave;
Table created.
-- 用 dave 表去更新 DBA 表
SYS@dave2(db2)> update dba ta set prov_code=(select area_code from dave tb where ta.id=tb.id);
3080115 rows updated.
Elapsed: 00:16:12.81 -- 整个更新花了 16 分钟
--update 期间查看 session 执行时间:
SQL>select sid, target , time_remaining , elapsed_seconds , message , sql_id from v$session_longops where sid= 138 ;
select * from v$lock where sid= 138 ;
select * from v$session_wait where sid= 138 ;
-- 使用 rowid 进行更新
CURSOR cur IS
SELECT
a. area_code , b . ROWID ROW_ID
FROM dave a, dba b
WHERE a.id = b .id
ORDER BY b . ROWID ; --- 如果表的数据量不是很大 , 可以不用 order by rowid
V_COUNTER NUMBER ;
BEGIN
V_COUNTER := 0 ;
FOR row IN cur LOOP
UPDATE dba
SET prov_code = row. area_code
WHERE ROWID = row. ROW_ID ;
V_COUNTER := V_COUNTER + 1 ;
IF ( V_COUNTER >= 1000 ) THEN
COMMIT;
V_COUNTER := 0 ;
END IF;
END LOOP;
COMMIT;
END;
PL/SQL procedure successfully completed.
Elapsed: 00:14:54.07 -- 执行花了 14 分钟,速度提高不是很多。
在这个更新中, 使用了 ORDER BY b.ROWID 进行了排序 ,每个数据块里面都有多条记录,这样按 rowid 进行排序,那么这样每次访问数据块的时候就会相同,就会减小 block 在调用的次数,从而提高效率。
因为我这是虚拟机上的测试环境,所以内存分配的并不合适, I/O 也不行。
-- 我们把 order by 去掉,在更新看看
CURSOR cur IS
SELECT
a. area_code , b . ROWID ROW_ID
FROM dave a, dba b
WHERE a.id = b .id;
V_COUNTER NUMBER ;
BEGIN
V_COUNTER := 0 ;
FOR row IN cur LOOP
UPDATE dba
SET prov_code = row. area_code
WHERE ROWID = row. ROW_ID ;
V_COUNTER := V_COUNTER + 1 ;
IF ( V_COUNTER >= 1000 ) THEN
COMMIT;
V_COUNTER := 0 ;
END IF;
END LOOP;
COMMIT;
END;
PL/SQL procedure successfully completed.
Elapsed: 00:20:24.43
-- 居然用了 21 分钟,看来对大表还是很有必要进行 order by rowid 的。
二 . 在测试服务器上测试
折腾了半天没有折腾出效果来。将数据 dump 出来,在 imp 到测试服务器, 300w 的数据, dump 文件有 300M 。
-- 在测试服务器上直接 update
SQL> update dba ta set prov_code=(select area_code from dave tb where ta.id=tb.id);
update dba ta set prov_code=(select area_code from dave tb where ta.id=tb.id)
*
ERROR at line 1:
ORA-01013: user requested cancel of current operation
Elapsed: 00:20:45.04
一直的处理中 . 被迫取消。 查看了一下 session 的状态:
SQL>select sid, target , time_remaining , elapsed_seconds , message , sql_id from v$session_longops where sid= 197 ;
等了 20 分钟,才 8 个 blocks ,要处理到 39521 个 blocks ,不知道要到那个猴年马月了。 居然比我虚拟机上测试的还慢。
-- 在测试服务器上使用 rowid + order by
DECLARE
CURSOR cur IS
SELECT
a. area_code , b . ROWID ROW_ID
FROM dave a, dba b
WHERE a.id = b .id
ORDER BY b . ROWID ; --- 如果表的数据量不是很大 , 可以不用 order by rowid
V_COUNTER NUMBER ;
BEGIN
V_COUNTER := 0 ;
FOR row IN cur LOOP
UPDATE dba
SET prov_code = row. area_code
WHERE ROWID = row. ROW_ID ;
V_COUNTER := V_COUNTER + 1 ;
IF ( V_COUNTER >= 1000 ) THEN
COMMIT;
V_COUNTER := 0 ;
END IF;
END LOOP;
COMMIT;
END;
PL/SQL procedure successfully completed.
Elapsed: 00:04:45.98
-- 总算看到效果了, 4 分多钟搞定,如果在生产库上,这个操作应该还会快一点。
-- 在测试服务器上使用 rowid
DECLARE
CURSOR cur IS
SELECT
a. area_code , b . ROWID ROW_ID
FROM dave a, dba b
WHERE a.id = b .id;
V_COUNTER NUMBER ;
BEGIN
V_COUNTER := 0 ;
FOR row IN cur LOOP
UPDATE dba
SET prov_code = row. area_code
WHERE ROWID = row. ROW_ID ;
V_COUNTER := V_COUNTER + 1 ;
IF ( V_COUNTER >= 1000 ) THEN
COMMIT;
V_COUNTER := 0 ;
END IF;
END LOOP;
COMMIT;
END;
PL/SQL procedure successfully completed.
Elapsed: 00:09:06.73 -- 花了 9 分钟
通过以上测试,验证了对于大表的 update ,除了使用 rowid ,还需要根据 rowid 排序一下。
-------------------------------------------------------------------------------------------------------
Blog : http://blog.csdn.net/tianlesoftware
Email: dvd.dba@gmail.com
DBA1 群: 62697716( 满 ); DBA2 群: 62697977( 满 ) DBA3 群: 62697850( 满 )
DBA 超级群: 63306533( 满 ); DBA4 群: 83829929 DBA5 群: 142216823
DBA6 群: 158654907 聊天 群: 40132017 聊天 2 群: 69087192
-- 加群需要在备注说明 Oracle 表空间和数据文件的关系,否则拒绝申请