一、理解什么是数据库恢复
当
我们使用一个数据库时,总希望数据库的内容是可靠的、正确的,但由于计算机系统的故障(硬件故障、软件故障、网络故障、进程故障和系统故障)影响数据库系
统的操作,影响数据库中数据的正确性,甚至破坏数据库,使数据库中全部或部分数据丢失。因此当发生上述故障后,希望能重构这个完整的数据库,该处理称为数
据库恢复。恢复过程大致可以分为复原(Restore)与恢复(Recover)过程。
数据库恢复可以分为以下两类:
1、实例故障的一致性恢复
当实例意外地(如掉电、后台进程故障等)或预料地(发出SHUTDOUM ABORT语句)中止时出现实例故障,此时需要实例恢复。实例恢复将数据库恢复到故障之前的事务一致状态。如果在在线后备发现实例故障,则需介质恢复。在其它情况ORACLE在下次数据库起动时(对新实例装载和打开),自动地执行实例恢复。如果需要,从装载状态变为打开状态,自动地激发实例恢复,由下列处理:
(1)
为了解恢复数据文件中没有记录的数据,进行向前滚。该数据记录在在线日志,包括对回滚段的内容恢复。
(2) 回滚未提交的事务,按步(1)重新生成回滚段所指定的操作。
(3) 释放在故障时正在处理事务所持有的资源。
(4)
解决在故障时正经历一阶段提交的任何悬而未决的分布事务。
2、介质故障或文件错误的不一致恢复
介质故障是当一个文件、一个文件的部分或磁盘不能读或不能写时出现的故障。
文件错误一般指意外的错误导致文件被删除或意外事故导致文件的不一致。
这种状态下的数据库都是不一致的,需要DBA手工来进行数据库的恢复,这种恢复有两种形式,决定于数据库运行的归档方式和备份方式。
(1)
完全介质恢复可恢复全部丢失的修改。一般情况下需要有数据库的备份且数据库运行在归档状态下并且有可用归档日志时才可能。对于不同类型的错误,有不同类型的完全恢复可使用,其决定于毁坏文件和数据库的可用性。
(2)
不完全介质恢复是在完全介质恢复不可能或不要求时进行的介质恢复。重构受损的数据库,使其恢复介质故障前或用户出错之前的一个事务一致性状态。不完全介质恢复有不同类型的使用,决定于需要不完全介质恢复的情况,有下列类型:基于撤消、基于时间和基于修改的不完全恢复。
基于撤消(CANCEL)恢复:在某种情况,不完全介质恢复必须被控制,DBA可撤消在指定点的操作。基于撤消的恢复地在一个或多个日志组(在线的或归档的)已被介质故障所破坏,不能用于恢复过程时使用,所以介质恢复必须控制,以致在使用最近的、未损的日志组于数据文件后中止恢复操作。
基于时间(TIME)和基于修改(SCN)的恢复:如果DBA希望恢复到过去的某个指定点,是一种理想的不完全介质恢复,一般发生在恢复到某个特定操作之前,恢复到如意外删除某个数据表之前。
二、数据库恢复案例测试环境
1、数据库环境
以下的所有案例都是通过测试经过,环境为:
OS:Microsoft Windows XP [版本 5.1.2600]
DB:Oracle9i Enterprise Edition Release 9.2.0.1.0 - Production
DBNAME:DODO
数据文件:
SQL> select file#,status,enabled,name from
v$datafile;
FILE# STATUS
ENABLED
NAME
------ ------- ----------
----------------------------------------
1 SYSTEM READ WRITE
D:\ORACLE\ORADATA\DODO\SYSTEM01.DBF
2 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\UNDOTBS01.DBF
3 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\DRSYS01.DBF
4 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\INDX01.DBF
5 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\TOOLS01.DBF
6 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\USERS01.DBF
7 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\XDB01.DBF
8 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\WXQ_TBS.ORA
9 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\RECOVERY_TBS.ORA
控制文件:
SQL> select * from v$controlfile;
STATUS NAME
-------
----------------------------------------
D:\ORACLE\ORADATA\DODO\CONTROL01.CTL
D:\ORACLE\ORADATA\DODO\CONTROL02.CTL
D:\ORACLE\ORADATA\DODO\CONTROL03.CTL
联机日志:
SQL> select * from v$logfile;
GROUP# STATUS
TYPE
MEMBER
------
------- ------- --------------------------------------
1
ONLINE D:\ORACLE\ORADATA\DODO\REDO01.LOG
2
ONLINE D:\ORACLE\ORADATA\DODO\REDO02.LOG
3 STALE
ONLINE
D:\ORACLE\ORADATA\DODO\REDO03.LOG
2、数据库备份脚本
冷备份脚本
rem script:coldbak.sql
rem desc:offline full backup database
--connect database
connect sys/sys as sysdba;
--shutdown database
shutdown immediate;
--Copy Data file
host xcopy
D:\ORACLE\ORADATA\DODO\*.DBF D:\DATABASE\BACK /H/R/Y;
--Copy Control file
host xcopy
D:\ORACLE\ORADATA\DODO\*.CTL D:\DATABASE\BACK /H/R/Y;
--Copy Log file
host xcopy
D:\ORACLE\ORADATA\DODO\*.LOG D:\DATABASE\BACK /H/R/Y;
--startup database
startup;
注:unix中使用cp命令;可使用select及spool命令,通过查询自动生成备份脚本
说明:
1、以上脚本在数据库关闭状态下备份数据库所有的数据文件、联机日志、控制文件(在一个目录下),如果成功备份,所有文件是一致的。
2、没有备份参数文件,参数文件可以另外备份,没有必要每次都备份,只需要在改变设置后备份一次。
3、如果以上命令没有成功依次执行,那么备份将是无效的,如连接数据库不成功,那么肯定关闭数据库也不成功,那么备份则无效
4、冷备份建议下人工干预下执行。
数据库OS热全备份脚本
rem script:hotbak.sql
rem desc:backup all database datafile in archive
--connect database
connect sys/sys as sysdba;
--archive
alter system archive log current;
--start
alter tablespace system begin backup;
hostxcopy D:\ORACLE\ORADATA\DODO\SYSTEM01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace system end backup;
alter tablespace undotbs1 begin backup;
hostxcopy D:\ORACLE\ORADATA\DODO\UNDOTBS01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace undotbs1
end backup;
alter tablespace users begin backup;
hostxcopy
D:\ORACLE\ORADATA\DODO\USERS01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace users end backup;
alter tablespace tools begin backup;
hostxcopy D:\ORACLE\ORADATA\DODO\TOOLS01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace tools end backup;
alter tablespace indx begin backup;
hostxcopy D:\ORACLE\ORADATA\DODO\INDX01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace indx end backup;
--end
--bak control file
--binary
alter database backup controlfile to 'D:\DATABASE\BACK\CONTROLFILE\CONTROLBAK.000';
--ascii
alter database backup controlfile to trace;
alter system archive log current;
说明:
1、热备份必须在数据库归档方式下才可以运行
2、以上脚本可以在数据库运行状态下备份数据库所有的数据文件(除了临时数据文件),没有必要备份联机日志。
3、归档日志至少需要一次完整备份之后的所有日志。
4、如果以上命令没有成功依次执行,那么备份也是无效的,如连接数据库不成功,那么备份则无效
RMAN备份只讲叙有恢复目录的情况,如果没有恢复目录,情形大致相似。
以下是RMAN的热备份全备份的脚本:
#
script:bakup.rcv
# desc:backup all database datafile in archive with rman
# connect database
# set
oracle_sid=dodo ;
connect target sys/sys;
# start backup database
run{
allocate channel c1 type disk;
backup full tag 'dbfull' format 'D:\DATABASE\RMAN\full%u_%s_%p' database
include current controlfile;
sql 'alter system archive log current';
release channel c1;
}
# end
说明:
1、 数据库必须运行在归档模式下
2、 RMAN将自动备份数据文件,运行可靠
3、 归档日志另外备份处理,但至少需要保存一次备份来的日志
4、 没有必要用RMAN做冷备份,效果不好
以上举例说明了数据库的恢复案例的测试环境与部分备份测试脚本,其它的备份脚本可以根据以上脚本演变而来或在案例中加以说明。
数据库的自动实例将不加以说明,这里只举例说明媒体错误或人为错误造成的恢复可能。
以上包括以下案例都是在Windows+Oracle9.2上测试验证的,在不同的操作系统与不同的数据库版本中略有差别。
三、了解与恢复相关的信息
1、理解报警日志文件
报
警日志文件一般记载了数据库的启动/关闭信息,归档信息,备份信息,恢复信息,常见错误信息,部分数据库修改记录等。一般令名规则
为<SID>Alrt.log或Alrt<SID>.log,如我的测试数据库的报警日志文件的名称为
alert_dodo.log。
报警日志文件的路径是根据初始化参数background_dump_dest来决定的,如在我的机器上,该参数值为D:\oracle\admin\dodo\bdump,那么,你就可以在该路径下找到该文件
2、后台进程跟踪文件
后台进程跟踪文件的路径与报警日志文件的路径一致,在某些情况下,你可以通过后台跟踪文件的信息了解更多的需要恢复的信息。如在数据库需要恢复的时候,报警日志文件中常有这样的语句:
Errors in file D:\oracle\admin\dodo\bdump\dodo_dbw0.trc:
ORA-01157: cannot identify/lock data file 1 - see DBWR trace
file
通过提示的DBWR跟踪文件,可以查询到更详细的信息。
3、v$recover_file与v$recovery_log
这是两个动态性能视图,可以在mount下查看,通过这两个视图,你可以了解详细的需要恢复的数据文件与需要使用到的归档日志。
(本系列均转自:http://www./wxqxs/archive/2008/12/14/251957.html)
|