--=======================
-- Oracle 实例恢复
--=======================
一、Oracle实例失败
Oracle实例失败多为实例非一致性关闭所致,通常称为崩溃 ( crash ) 。实例失败的结果等同于 shutdown abort。
实例失败的原因
电源负载故障
硬件故障
后台进程失败
异常关闭数据库
实例失败后的状况
数据库可能丢失已提交的事务以及存储了未提交的事务,导致数据库出现不一致的情况
解决方案
使用startup重新启动实例。实例实现自动恢复,根据联机日志文件前滚提交的事务,回滚未提交的事务
查看告警日志、跟踪日志等找出出现故障的原因
更多常见的故障请参考: Oracle常见故障及日常规划
二、检查点
检查点在体系结构中已经讨论,实例的恢复与检查点息息相关,因此再次讨论检查点进程
1.什么是检查点
是一个数据库事件,用于减少崩溃恢复时间,检查点位置决定了实例恢复的起始位置
由后台进程触发,触发时ckpt进程通知dbwn进程将数据缓冲区的脏数据写入到数据文件
ckpt进程同时负责更新数据文件的头部信息及控制文件上的检查点信息
2.检查点的触发条件
在日志切换的时候 ( 自动切换或手动切换 )
数据库用immediate, transaction ,normal选项 shutdown 数据库的时候
用户手动触发 ( alter system checkpoint )
alter tablespace tablespace_name begin | end bakcup
alter tablespace tablespace_name offline
alter database datafile '<dir>' offline
alter tablespace | datafile read only
3.检测点队列
是一个脏数据库链表
检查点队列中的每一条修改过的记录包一个唯一的数据块标识符 ( 日志文件号,块编号,偏移量 )
最早队列将被优先写入到数据文件 ( 而不论期间是否被多次修改 )
最早队列被写入完成后将从队列中清除
4.检查点的分类
完全检查点
在Oracle 8i以前,当检查点发生时,Oracle将脏缓冲列表上的数据全部写入到数据文件,称为完全检查点,又称常规检查点
特定的触发条件
alter system switch logfile
shutdown normal , immediate , transactional
alter system checkpoint
增量检查点 ( fast - start checkpoint )
主要是引入了检查点队列机制 , 每s,ckpt将检查点队列中最老的RBA更新到控制文件,RBA ( 重做日志块地址 ) 同时将作为实例恢复的起点
增量检查点则细分了完全检查点,使得数据可以周期性按最老的数据块写入到数据文件
每一个脏块会被移到检查点队列里面去,按照LRBA(Low RBA第一次对此块修改对应的redo block address)来排列
最早写入检查点队列数据块的low rba值是最小的,即便该队列中的最小队列被修改多次,但修改后它在检查点队列里的顺序不会改变
当执行增量检查点时,DBWn从检查点队列按照LRBA的顺序来保证先修改的数据可以按顺序优先被写出来实现检查点的增进
此时ckpt进程使用轻量级的控制文件更新协议,将当前最低的RBA写入控制文件
ckpt在进行轻量级更新时,并不会改写控制文件中数据文件的检查点信息及数据文件头信息
仅仅是记录控制文件检查点SCN并根据增量检查点写出增进RBA信息
通过将完全检查点转变为增量检查点将大大缩短实例的恢复时间
注:更新数据文件头部及控制文件滞后于检查点事件的发生
增量检查点的触发
满足初始话文件log_checkpoint_interval、log_checkpoint_timeout、
fast_start_io_target、fast_start_mttr_target的设置的值
最小的日志文件的大小
Buffer Cacha中脏块的数量
部分检查点
表空间的脏数据写入到磁盘
由 alter tablespace tablespace_name offline触发
5.完全检查点与增量检查点的差异
完全检查点会将检查点的信息同时写入到控制文件及数据文件
增量检查点则只将RBA写入到控制文件
6.查看检查点的信息 , 设置LOG_CHECKPOINTS_TO_ALERT参数为true
ALTER SYSTEM SET LOG_CHECKPOINTS_TO_ALERT = TRUE ;
-- 查看log_checkpoints_to_alert 参数
SQL > SHOW PARAMETER log_checkpoints_to_alert
NAME TYPE VALUE
------------------------------------ ----------- ------------------------------
log_checkpoints_to_alertbooleanFALSE
-- 设置log_checkpoints_to_alert 参数
SQL > ALTER SYSTEM set log_checkpoints_to_alert = TRUE ;
System altered .
-- 清空告警日志文件的内容
SQL > ho cat / dev /null > / u01 / app / oracle / admin / orcl / bdump / alert_orcl . log
-- 查看数据文件头部信息中控制文件的信息为3037172
SQL > SELECT file# , status , tablespace_name ,
2dbms_flashback . get_system_change_number cur_scn ,
3to_char ( resetlogs_time , 'yyyy-mm-dd hh24:mi:ss' ) rst_dt ,
4resetlogs_change# rst_scn ,
5to_char ( checkpoint_time , 'yyyy-mm-dd hh24:mi:ss' ) ckpt_dt ,
6checkpoint_change# ckpt_scn , checkpoint_count ckpt_cnt
7 FROM v$datafile_header ;
FILE# STATUSTABLESPACE_NAMECUR_SCN RST_DTRST_SCN CKPT_DTCKPT_SCNCKPT_CNT
---------- ------- --------------- ---------- ------------------- ---------- ------------------- ---------- ----------
1 ONLINESYSTEM3037641 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 05 : 303037172531
2 ONLINEUNDOTBS13037641 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 05 : 303037172493
3 ONLINESYSAUX3037641 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 05 : 303037172532
4 ONLINEUSERS3037641 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 05 : 303037172534
5 ONLINEEXAMPLE3037641 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 05 : 303037172489
6 ONLINETBS13037641 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 05 : 303037172412
7 ONLINETBS13037641 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 05 : 303037172407
7 rows selected .
SQL > save / u01 / app / oracle / oradata / query_1 . sql ;
Created file / u01 / app / oracle / oradata / query_1 . sql
SQL > ALTER SYSTEM SWITCH LOGFILE ; -- 切换日志
System altered .
SQL > ho cat / u01 / app / oracle / admin / orcl / bdump / alert_orcl . log | more -- 查看告警日志
Sun Jul 25 19 : 14 : 29 2010
Beginning log switch checkpoint up to RBA [0xd.2.10] , SCN : 3037657
Thread 1 advanced to log sequence 13
Current log# 3 seq# 13 mem# 0 : / u01 / app / oracle / oradata / orcl / redo3a . rdo
Current log# 3 seq# 13 mem# 1 : / u01 / app / oracle / oradata / orcl / redo3b . rdo
SQL > @/u01 / app / oracle / oradata / query_1 . sql ; -- 数据文件头部滞后分钟后与告警日志记录的SCN 相同
FILE# STATUSTABLESPACE_NAMECUR_SCN RST_DTRST_SCN CKPT_DTCKPT_SCNCKPT_CNT
---------- ------- --------------- ---------- ------------------- ---------- ------------------- ---------- ----------
1 ONLINESYSTEM3037803 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 14 : 293037657532
2 ONLINEUNDOTBS13037803 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 14 : 293037657494
3 ONLINESYSAUX3037803 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 14 : 293037657533
4 ONLINEUSERS3037803 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 14 : 293037657535
5 ONLINEEXAMPLE3037803 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 14 : 293037657490
6 ONLINETBS13037803 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 14 : 293037657413
7 ONLINETBS13037803 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 14 : 293037657408
SQL > SELECT TO_CHAR ( sysdate , 'yyyy-mm-dd hh24:mi:ss' ) FROM dual ; -- 时间滞后分钟19:19:59 - 19:14:29
TO_CHAR ( SYSDATE , 'YY'
-------------------
2010 - 07 - 25 19 : 19 : 59
SQL > ALTER SYSTEM CHECKPOINT ; -- 产生检查点
System altered .
SQL > ho cat / u01 / app / oracle / admin / orcl / bdump / alert_orcl . log | more -- 查看告警日志中的SCN: 3037881
Sun Jul 25 19 : 14 : 29 2010
Beginning log switch checkpoint up to RBA [0xd.2.10] , SCN : 3037657
Thread 1 advanced to log sequence 13
Current log# 3 seq# 13 mem# 0 : / u01 / app / oracle / oradata / orcl / redo3a . rdo
Current log# 3 seq# 13 mem# 1 : / u01 / app / oracle / oradata / orcl / redo3b . rdo
Sun Jul 25 19 : 19 : 34 2010
Completed checkpoint up to RBA [0xd.2.10] , SCN : 3037657
Sun Jul 25 19 : 21 : 55 2010
Beginning global checkpoint up to RBA [0xd.116.10] , SCN : 3037881
Completed checkpoint up to RBA [0xd.116.10] , SCN : 3037881
SQL > @/u01 / app / oracle / oradata / query_1 . sql ; -- 数据文件头部同步与告警日志记录的SCN 相同,为3037881
FILE# STATUSTABLESPACE_NAMECUR_SCN RST_DTRST_SCN CKPT_DTCKPT_SCNCKPT_CNT
---------- ------- --------------- ---------- ------------------- ---------- ------------------- ---------- ----------
1 ONLINESYSTEM3037890 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 21 : 553037881533
2 ONLINEUNDOTBS13037890 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 21 : 553037881495
3 ONLINESYSAUX3037890 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 21 : 553037881534
4 ONLINEUSERS3037890 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 21 : 553037881536
5 ONLINEEXAMPLE3037890 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 21 : 553037881491
6 ONLINETBS13037890 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 21 : 553037881414
7 ONLINETBS13037890 2010 - 07 - 20 11 : 59 : 232837290 2010 - 07 - 25 19 : 21 : 553037881409
-- 查看完全检查点
SQL > SELECT addr , indx , rtckp_scn ,
2rtckp_tim ,
3rtckp_rba_seq , rtckp_rba_bno
4 FROM x$kccrt ;
ADDRINDX RTCKP_SCNRTCKP_TIMRTCKP_RBA_SEQ RTCKP_RBA_BNO
-------- ---------- ---------------- -------------------- ------------- -------------
B7D59C100 303788107 / 25 / 2010 19 : 21 : 5513278
SQL > show parameter log_check -- 查看log_checkpoint_timeout 的值
NAME TYPE VALUE
------------------------------------ ----------- ------------------------------
log_checkpoint_intervalinteger0
log_checkpoint_timeoutinteger1800
log_checkpoints_to_alertbooleanTRUE
ho cat / u01 / app / oracle / admin / orcl / bdump / alert_orcl . log -- 告警日志文件中Incremental checkpoint
----------------------------------------------------------------------------------
Sun Jul 25 19 : 22 : 46 2010
Incremental checkpoint up to RBA [0xd.119.0] , current log tail at RBA [0xd.119.0]
Sun Jul 25 19 : 52 : 51 2010
Incremental checkpoint up to RBA [0xd.37a.0] , current log tail at RBA [0xd.420.0]
---------------------------------------------------------------------------------
SQL > select CPDRT , CPLRBA_SEQ|| '.' || CPLRBA_BNO|| '.' || CPLRBA_BOF "Low RBA" ,
2CPODR_SEQ|| '.' || CPODR_BNO|| '.' || CPODR_BOF "On disk RBA" , CPODS , CPODT , CPHBT
3 from x$kcccp where indx = 0 ; -- 获得控制文件中增量检查点的信息
CPDRT Low RBA On disk RBACPODSCPODTCPHBT
---------- ------------------- ------------- ------- ----------------------------
97 13.5574.013.6391.03041226 07 / 25 / 2010 22 : 16 : 37725323317
--CPDRT 列是检查点队列中的脏块数目.
--CPODS 列是on disk rba 的scn
--CPODT 列是on disk rba 的时间戳
--CPHBT 列是心跳
7.更详细的检查点介绍: 针对checkpoint的概要分析
三、实例恢复
1.当打开非一致性关闭或 shutdown abort数据库时,将导致实例恢复
2.实例恢复过程为自动
3.使用联机重做日志文件中的信息来同步数据文件
4.涉及到两类不同的操作
前滚:数据文件被还原到实例失败之前的状态
回滚:已修改但未提交的数据将被撤销到修改之前的状态
四、实例恢复的过程
下面的图片来自Oracle官方教材
1.首先Oracle会比较控制文件中检查点与数据文件头部信息,发现数据不一致
2.从最后检查点之后到日志文件尾部将被重新应用到数据文件,同时产生undo信息 ( 回滚 ) ,此阶段也称为cache recovery
3.数据文件中包含已提交或未提交的数据,尽管存在未提交的数据,此时数据库已经被打开,允许用户连接
4.未提交的事务将被回滚
5.数据文件中仅包含已提交的数据
五、调整实例恢复
1.为参数文件中对恢复过程有影响的联机日志记录数量和数据块设置合适的大小
2.调整联机日志文件的大小来影响检查点发生的频率
3.使用SQL命令发生检查点事件
4.使用Fast - start fault recovery
5.几个恢复相关的参数
LOG_CHECKPOINT_TIMEOUT --> 两次checkpoint 之间间隔的时间(单位是秒),该参数现已很少使用
LOG_CHECKPOINT_INTERVAL --> 两次checkpoint 之间redo block数据块的个数(不是db_block),
--redo block size = os block size 该参数现已很少使用
FAST_START_MTTR_TARGET --> 指定多长时间完成实例恢复( 单位是秒) (后面演示中重点讨论)
RECOVERY_PARALLELISM --> 指定前滚时的并发度
FAST_START_PARALLEL_ROLLBACK --> 回滚阶段时预先UNDO 需要使用的块,然后增加回滚并发度
-- 2 路CPU 建议设置为LO,四路CPU建议设置为HI,否则缺省置为false
FAST_START_IO_TARGET --> 数据库宕机所要做的恢复所需的IO 的数量,10g之后很少使用
六、实例恢复相关的视图
V$INSTACE_RECOVERY --> 查看fast_start_mttr_target 设置以及系统MTTR相关信息
V$FAST_START_SERVERS --> 事务回滚时相关并发信息
V$FAST_START_TRANSACTION --> 正在恢复的事务的相关信息
完全检查点
select * from X$KCCRT where indx = 0 ;
增量检查点
SQL > select * from X$KCCCP where indx = 0 ;
七、实例恢复演示
-- 删除告警日志
SQL > ho rm - f / u01 / app / oracle / admin / orcl / bdump / alert_orcl . log
SQL > SELECT * FROM scott . emp WHERE ename = 'SCOTT' ;
EMPNO ENAMEJOBMGR HIREDATESALDEPTNO
---------- ------------------------------ --------- ---------- --------- ---------- ----------
7788 SCOTTANALYST7566 19 - APR - 87710020
-- 更新SCOTT 的薪水且提交事务
SQL > UPDATE scott . emp SET sal = sal / 2 WHERE ename = 'SCOTT' ;
1 row updated .
SQL > COMMIT ;
Commit complete .
-- 插入两条新记录且不提交事务
SQL > INSERT INTO scott . emp ( empno , ename , job ) SELECT '2001' , 'Mark' , 'Develpoer' FROM dual ;
1 row created .
SQL > INSERT INTO scott . emp ( empno , ename , job ) SELECT '2002' , 'Mary' , 'Designer' FROM dual ;
1 row created .
SQL > SELECT * FROM scott . emp WHERE empno IN ( 2001 , 2002 );
EMPNO ENAMEJOBMGR HIREDATESALDEPTNO
---------- ------------------------------ --------- ---------- --------- ---------- ----------
2001 MarkDevelpoer
2002 MaryDesigner
-- 强制关闭实例并重启实例,则实例将自动回滚
SQL > SHUTDOWN ABORT ;
ORACLE instance shut down .
SQL > STARTUP
ORACLE instance started .
Total System Global Area251658240 bytes
Fixed Size 1218796 bytes
Variable Size 88082196 bytes
Database Buffers159383552 bytes
Redo Buffers2973696 bytes
Database mounted .
Database opened .
-- 从告警日志中获得回滚的相关信息
SQL > ho ls / u01 / app / oracle / admin / orcl / bdump
alert_orcl . log orcl_arc0_4016 . trcorcl_arc1_4018 . trcorcl_lgwr_3995 . trc
SQL > ho cat / u01 / app / oracle / admin / orcl / bdump / alert_orcl . log
----------------------------------------------------------------
ALTER DATABASE MOUNT
Thu Jul 22 12 : 44 : 40 2010
Setting recovery target incarnation to 10
Thu Jul 22 12 : 44 : 40 2010
Successful mount of redo thread 1 , with mount id 1252833332
Thu Jul 22 12 : 44 : 40 2010
Database mounted in Exclusive Mode
Completed : ALTER DATABASE MOUNT
Thu Jul 22 12 : 44 : 41 2010
ALTER DATABASE OPEN
Thu Jul 22 12 : 44 : 41 2010
Beginning crash recovery of 1 threads -- 开始crash recovery
Thu Jul 22 12 : 44 : 41 2010
Started redo scan -- 扫描redo
Thu Jul 22 12 : 44 : 42 2010
Completed redo scan
142 redo blocks read , 58 data blocks need recovery
Thu Jul 22 12 : 44 : 42 2010
Started redo application at
Thread 1 : logseq 4 , block 3156
Thu Jul 22 12 : 44 : 42 2010
Recovery of Online Redo Log : Thread 1 Group 3 Seq 4 Reading mem 0
Mem# 0 errs 0 : / u01 / app / oracle / oradata / orcl / redo3a . rdo
Mem# 1 errs 0 : / u01 / app / oracle / oradata / orcl / redo3b . rdo
Thu Jul 22 12 : 44 : 42 2010
Completed redo application
Thu Jul 22 12 : 44 : 43 2010
Completed crash recovery at -- 完成恢复
Thread 1 : logseq 4 , block 3298 , scn 2921577
58 data blocks read , 58 data blocks written , 142 redo blocks read
Thu Jul 22 12 : 44 : 43 2010
LGWR : STARTING ARCH PROCESSES
ARC0 : Archival started
ARC1 : Archival started
LGWR : STARTING ARCH PROCESSES COMPLETE
ARC1 started with pid = 17 , OS id = 4018
ARC0 started with pid = 16 , OS id = 4016
Thu Jul 22 12 : 44 : 45 2010
Thread 1 advanced to log sequence 5
Thread 1 opened at log sequence 5
Current log# 1 seq# 5 mem# 0 : / u01 / app / oracle / oradata / orcl / redo1a . rdo
Current log# 1 seq# 5 mem# 1 : / u01 / app / oracle / oradata / orcl / redo1b . rdo
Successful open of redo thread 1
Thu Jul 22 12 : 44 : 45 2010
MTTR advisory is disabled because FAST_START_MTTR_TARGET is not set --FAST_START_MTTR_TARGET 未设置
--------------------------------------------------------------------------------------------------
-- 对scott 用户已提交,故恢复之后为已提交的状态
SQL > SELECT * FROM scott . emp WHERE ename = 'SCOTT' ;
EMPNO ENAMEJOBMGR HIREDATESALDEPTNO
---------- ------------------------------ --------- ---------- --------- ---------- ----------
7788 SCOTTANALYST7566 19 - APR - 87355020
-- 新增加的两条记录未提交,实例恢复之后被回滚
SQL > SELECT * FROM scott . emp WHERE empno IN ( 2001 , 2002 );
no rows selected
八、设置FAST_START_MTTR_TARGET参数
/*
FAST_START_MTTR_TARGET 参数的作用就是减少cache recovery 的恢复时间。
当设定了FAST_START_MTTR_TARGET 值后,数据库管理增量检查点写入尝试达到设定的目标恢复时间
如果设定的值合理,则整个恢复过程将接近所设定的时间
注:当使用FAST_START_MTTR_TARGET 参数时,应当关闭FAST_START_IO_TARGET, LOG_CHECKPOINT_INTERVAL,
LOG_CHECKPOINT_TIMEOUT 参数。如果设定这些参数将会妨碍cache recovery 满足指定的FAST_START_MTTR_TARGET值
应当为FAST_START_MTTR_TARGET 设置合理的时间值
缺省值为0, 表示关闭检查点自动调整功能
最大值为3600, 当设定值大于3600,将被自动取整为3600
最小值为1, 当设定为时1,事实上不切合实际因此,恢复时间也不能达到设定的目标值*/
更多关于FAST_START_MTTR_TARGET参数的优化: Instance Recovery Performance Tuning : Fast - Start Fault Recovery
-- 将fast_start_mttr_target 的值置为0
SQL > alter system set fast_start_mttr_target = 0 ;
System altered .
SQL > CREATE TABLE tb_test AS SELECT * FROM all_objects WHERE 1 = 2 ; -- 新建一张表
Table created .
SQL > INSERT INTO tb_test SELECT * FROM all_objects ; -- 插入记录到新表
49945 rows created .
-- 下面的查询中可以看到ESTIMATED_MTTR 为28
SQL > SELECT recovery_estimated_ios , actual_redo_blks , target_mttr , estimated_mttr ,
2optimal_logfile_size FROM v$instance_recovery ;
RECOVERY_ESTIMATED_IOS ACTUAL_REDO_BLKS TARGET_MTTR ESTIMATED_MTTR OPTIMAL_LOGFILE_SIZE
---------------------- ---------------- ----------- -------------- --------------------
76211661028
SQL > COMMIT ; -- 提交事务
Commit complete .
SQL > SELECT recovery_estimated_ios , actual_redo_blks , target_mttr , estimated_mttr ,
2optimal_logfile_size FROM v$instance_recovery ;
RECOVERY_ESTIMATED_IOS ACTUAL_REDO_BLKS TARGET_MTTR ESTIMATED_MTTR OPTIMAL_LOGFILE_SIZE
---------------------- ---------------- ----------- -------------- --------------------
76711669028
-- 由上可知,commit 仅仅是将日志缓冲区的内容更新到日志文件
SQL > ALTER SYSTEM CHECKPOINT ; -- 手动更新检查点
System altered .
SQL > SELECT recovery_estimated_ios , actual_redo_blks , target_mttr , estimated_mttr ,
2optimal_logfile_size FROM v$instance_recovery ;
RECOVERY_ESTIMATED_IOS ACTUAL_REDO_BLKS TARGET_MTTR ESTIMATED_MTTR OPTIMAL_LOGFILE_SIZE
---------------------- ---------------- ----------- -------------- --------------------
00028
-- 上面的查询可以看到字段RECOVERY_ESTIMATED_IOS 和ACTUAL_REDO_BLKS的值已经减少到0
-- 检查点的产生将database buffer 中的脏内容写入到了数据文件中
--ESTIMATED_MTTR 没有发生变化,因为该列为非实时更新列
九、更多
Oracle实例和Oracle数据库(Oracle体系结构)
Oracle联机重做日志文件(ONLINE LOG FILE)