Oracle備份與恢復案例.

 

Oracle備份與恢復案例

. 理解什麼是數據庫恢復
 
當我們使用一個數據庫時,總希望數據庫的內容是可靠的、正確的,但由於計算機系統的故障(硬件故障、軟件故障、網絡故障、進程故障和系統故障)影響數據庫系統的操作,影響數據庫中數據的正確性,甚至破壞數據庫,使數據庫中全部或部分數據丟失。因 此當發生上述故障後,希望能重構這個完整的數據庫,該處理稱爲數據庫恢復。恢復過程大致可以分爲復原(Restore)與恢復(Recover)過程。

 數據庫恢復可以分爲以下兩類:

 1.1實例故障的一致性恢復

當實例意外地(如掉電、後臺進程故障等)或預料地(發出SHUTDOUM ABORT語句)中止時出現實例故障,此時需要實例恢復。實例恢復將數據庫恢復到故障之前的事務一致狀態。如果在在線後備發現實例故障,則需介質恢復。在其它情況Oracle在下次數據庫起動時(對新實例裝配和打開),自動地執行實例恢復。如果需要,從裝配狀態變爲打開狀態,自動地激發實例恢復,由下列處理:

  (1) 爲了解恢復數據文件中沒有記錄的數據,進行向前滾。該數據記錄在在線日誌,

包括對回滾段的內容恢復。

  (2) 回滾未提交的事務,按步1重新生成回滾段所指定的操作。

  (3) 釋放在故障時正在處理事務所持有的資源。

  (4) 解決在故障時正經歷一階段提交的任何懸而未決的分佈事務。


1.2
介質故障或文件錯誤的不一致恢復

介質故障是當一個文件、一個文件的部分或磁盤不能讀或不能寫時出現的故障。文件錯誤一般指意外的錯誤導致文件被刪除或意外事故導致文件的不一致。這種狀態下的數據庫都是不一致的,需要DBA手工來進行數據庫的恢復,這種恢復有兩種形式,決定於數據庫運行的歸檔方式和備份方式。

 1) 完全介質恢復可恢復全部丟失的修改。一般情況下需要有數據庫的備份且數據庫運行在歸檔狀態下並且有可用歸檔日誌時纔可能。對於不同類型的錯誤,有不同類型的完全恢復可使用,其決定於毀壞文件和數據庫的可用性。

 2) 不完全介質恢復是在完全介質恢復不可能或不要求時進行的介質恢復。重構受損的數據庫,使其恢復介質故障前或用戶出錯之前的一個事務一致性狀態。不完全介質恢復有不同類型的使用,決定於需要不完全介質恢復的情況,有下列類型:基於撤消、基於時間和基於修改的不完全恢復。

  基於撤消(CANCEL)恢復:在某種情況,不完全介質恢復必須被控制,DBA可撤消在指定點的操作。基於撤消的恢復地在一個或多個日誌組(在線的或歸檔的)已被介質故障所破壞,不能用於恢復過程時使用,所以介質恢復必須控制,以致在使用最近的、未損的日誌組於數據文件後中止恢復操作。

   基於時間(TIME)和基於修改(SCN)的恢復:如果DBA希望恢復到過去的某個指定點,是一種理想的不完全介質恢復,一般發生在恢復到某個特定操作之前,恢復到如意外刪除某個數據表之前。

 第二章. 數據庫恢復案例測試環境

2.1 數據庫環境

以下的所有案例都是通過測試經過,環境爲:

  OSWindows 2000 Server

  DBOracle 816

  DBNAMETEST

數據文件:

SQL> select file#,status,enabled,name from v$datafile;

     FILE# STATUS  ENABLED      NAME

----------------------------------------------------------------

         1 SYSTEM  READ WRITE D:/Oracle/ORADATA/TEST/SYSTEM01.DBF

         2 ONLINE  READ WRITE D:/Oracle/ORADATA/TEST/RBS01.DBF

         3 ONLINE  READ WRITE D:/Oracle/ORADATA/TEST/USERS01.DBF

         4 ONLINE  READ WRITE D:/Oracle/ORADATA/TEST/TEMP01.DBF

         5 ONLINE  READ WRITE D:/Oracle/ORADATA/TEST/TOOLS01.DBF

         6 ONLINE  READ WRITE D:/Oracle/ORADATA/TEST/INDX01.DBF

控制文件:

SQL> select * from v$controlfile;

 STATUS  NAME

---------------------------------------------------------------------

        D:/Oracle/ORADATA/TEST/CONTROL01.CTL

        D:/Oracle/ORADATA/TEST/CONTROL02.CTL

        D:/Oracle/ORADATA/TEST/CONTROL03.CTL


聯機日誌:

SQL> select * from v$logfile;

     GROUP# STATUS      MEMBER

---------------------------------------------------------------------

      1     STALE      D:/Oracle/ORADATA/TEST/REDO01.LOG

      2               D:/Oracle/ORADATA/TEST/REDO02.LOG

      3     STALE      D:/Oracle/ORADATA/TEST/REDO03.LOG

 

2.2 數據庫備份腳本

冷備份腳本:

rem     script:coldbak.sql

rem     creater:chenjiping

rem     date:5.8.2003

rem     desc:offline full backup database

 

--connect database

connect internal/password;

--shutdown database

shutdown immediate;

--Copy Data file

!xcopy d:/Oracle/oradata/test/*.dbf d:/database/H/R;

--Copy Control file

!xcopy d:/Oracle/oradata/test/*.ctl d:/database/H/R;

--Copy Log file

!xcopy d:/Oracle/oradata/test/*.log d:/database/H/R;

--startup database

startup;

 說明:

1、以上腳本在數據庫關閉狀態下備份數據庫所有的數據文件,聯機日誌,控制文件(在一個目

錄下),如果成功備份,所有文件是一致的;

2、沒有備份參數文件,參數文件可以另外備份,沒有必要每次都備份,只需要在改變設置後備份一次;

3、如果以上命令沒有成功依次執行,那麼備份將是無效的,如連接數據庫不成功,那麼肯定關閉數據庫也不成功,那麼備份則無效;

4、冷備份建議下人工干預下執行。

 數據庫OS熱全備份腳本

rem     script:hotbak.sql

rem     creater:chenjiping

rem     date:5.8.2003

rem     desc:backup all database datafile in archive

 

--connect database

connect internal/password;

 --archive

alter system archive log current;

--start

 

alter tablespace system begin backup;

!xcopy d:/Oracle/oradata/test/system01.dbf d:/databak/H/R;

alter tablespace system end backup;

 

alter tablespace rbs begin backup;

!xcopy d:/Oracle/oradata/test/rbs01.dbf d:/databak/H/R;

alter tablespace rbs end backup;

 

alter tablespace users begin backup;

!xcopy d:/Oracle/oradata/test/users01.dbf d:/databak/H/R;

alter tablespace users end backup;

 

alter tablespace tools begin backup;

!xcopy d:/Oracle/oradata/test/tools01.dbf d:/databak/H/R;

alter tablespace tools end backup;

 

alter tablespace indx begin backup;

!xcopy d:/Oracle/oradata/test/indx01.dbf d:/databak/H/R;

alter tablespace indx end backup;

--end

 

--bak control file

--binary

alter database backup controlfile to 'd:/databak/controlbinbak.000';

--ascii

alter database backup controlfile to trace;

 

alter system archive log current;

說明:

1、熱備份必須在數據庫歸檔方式下才可以運行;

2、以上腳本可以在數據庫運行狀態下備份數據庫所有的數據文件(除了臨時數據文件),沒有必要備份聯機日誌;

3、歸檔日誌至少需要一次完整備份之後的所有日誌;

4、如果以上命令沒有成功依次執行,那麼備份也是無效的,如連接數據庫不成功,那麼備份則無效。

 

RMAN備份只講敘有恢復目錄的情況,如果沒有恢復目錄,情形大致相似。以下是RMAN的熱備份全備份的腳本:

#   script:bakup.rcv

#   creater:chenjiping

#   date:5.8.2003

#   desc:backup all database datafile in archive with rman

 

# connect database

connect rcvcat rman/rman@back;

connect target internal/virpure;

 

# start backup database

run{

allocate channel c1 type disk;

backup full tag 'dbfull' format 'd:/backup/full%u_%s_%p' database

include current controlfile;

sql 'alter system archive log current';

release channel c1;

}

# end

 

說明:

1、 數據庫必須運行在歸檔模式下;

2 RMAN將自動備份數據文件,運行可靠;

3、 歸檔日誌另外備份處理,但至少需要保存一次備份來的日誌;

4、 沒有必要用RMAN做冷備份,效果不好。

 

以上舉例說明了數據庫的恢復案例的測試環境與部分備份測試腳本,其它的備份腳本可以根據以上腳本演變而來或在案例中加以說明。

數據庫的自動實例將不加以說明,這裏只舉例說明媒體錯誤或人爲錯誤造成的恢復可能。

以上包括以下案例都是在WINDOWS+Oracle816上測試驗證的,在不同的操作系統與不同的數據庫版本中略有差別。

 

第三章. 瞭解與恢復相關的信息

 

1、 理解報警日誌文件

報警日誌文件一般記載了數據庫的啓動/關閉信息,歸檔信息,備份信息,恢復信息,常見錯誤信息,部分數據庫修改記錄等。一般令名規則爲< SID>Alrt.logAlrt<SID>.log,如我的測試數據庫的報警日誌文件的名稱爲testalrt.log

 

報警日誌文件的路徑是根據初始化參數background_dump_dest來決定的,如在我的機器上,該參數值爲 D:/Oracle/admin/test/bdump,那麼,你就可以在該路徑下找到該文件。

2、 後臺進程跟蹤文件

後臺進程跟蹤文件的路徑與報警日誌文件的路徑一致,在某些情況下,你可以通過後臺跟蹤文件的信息瞭解更多的需要恢復的信息。如在數據庫需要恢復的時候,報警日誌文件中常有這樣的語句:

Errors in file D:/Oracle/admin/test/bdump/testDBW0.TRC:

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

通過提示的DBWR跟蹤文件,可以查詢到更詳細的信息。


3
v$recover_filev$recovery_log

這是兩個動態性能視圖,可以在mount下查看,通過這兩個視圖,你可以瞭解詳細的需要恢復的數據文件與需要使用到的歸檔日誌。

第四章. 數據庫恢復案例


4.1
非歸檔模式下的備份與恢復

備份方案:採用OS冷備份

 

1.  連接數據庫並創建測試表

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2.  備份數據庫

SQL> @coldbak.sql 或在DOS svrmgrl @coldbak.sql

 

3.  再插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

-------------------

                         1

                         2

4.  關閉數據庫

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down.

 

5.  毀壞一個或多個數據文件,如刪除user01.dbf

C:/>del D:/Oracle/ORADATA/TEST/USERS01.DBF

模擬媒體毀壞。

 

6.  重新啓動數據庫,會發現如下錯誤

SQL> startup

Oracle instance started.

 

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:/Oracle/ORADATA/TEST/USERS01.DBF'

 

在報警文件中,會有更詳細的信息

Errors in file D:/Oracle/admin/test/bdump/testDBW0.TRC:

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:/Oracle/ORADATA/TEST/USERS01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的文件。

 

7.  拷貝備份復原到原來位置(restore過程)

C:/>xcopy d:/database/*.* d:/Oracle/oradata/test/H/R/S

 

8.  打開數據庫,檢查數據

SQL> alter database open;

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

 

這裏可以發現,數據庫恢復成功,但在備份之後與崩潰之前的數據丟失了。

說明:

1、非歸檔模式下的恢復方案可選性很小,一般情況下只能有一種恢復方式,就是數據庫的冷備
份的完全恢復,僅僅需要拷貝原來的備份就可以(restore),不需要recover

2、這種情況下的恢復,可以完全恢復到備份的點上,但是可能是丟失數據的,在備份之後與崩潰之前的數據將全部丟失;

3、不管毀壞了多少數據文件或是聯機日誌或是控制文件,都可以通過這個辦法恢復,因爲這個恢復過程是Restore所有的冷備份文件,而這個備份點上的所有文件是一致的,與最新的數據庫沒有關係,就好比把數據庫又放到了一個以前的""上;

4、對於非歸檔模式下,最好的辦法就是採用OS的冷備份,建議不要用RMAN來作冷備份,效果不好,因爲RMAN不備份聯機日誌,restore不能根本解決問題;

5、如果沒有備份聯機日誌,如RMAN的備份,就需要利用不完全恢復(until cancel)的方法來重新創建聯機日誌文件。

4.2歸檔模式下丟失或損壞一個數據文件

4.2.1 OS備份方案

在歸檔方式下損壞或丟失一個數據文件,如果存在相應的備份與該備份以來的歸檔日誌,恢復還是比較簡單的,可以作到儘量少的Down機時間,並能作到數據庫的完全恢復。

1、 連接數據庫,創建測試表並插入記錄

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int) tablespace users;

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2、 備份數據庫

SQL> @hotbak.sql 或在DOS svrmgrl @hotbak.sql

 

3、 繼續在測試表中插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

    --------------------------------------

                         1

                         2

SQL> alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

 

4、 關閉數據庫,模擬丟失數據文件

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

C:/>del D:/Oracle/ORADATA/TEST/USERS01.DBF

模擬媒體毀壞。

 

5、 啓動數據庫錯誤,脫機該數據文件:

SQL> startup

Oracle instance started.

 

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:/Oracle/ORADATA/TEST/USERS01.DBF'

還可以查看報警文件(見上一個恢復案例)或動態視圖v$recover_file

SQL> select * from v$recover_file;

 

     FILE# ONLINE  ERROR                    CHANGE#     TIME

---------- ------- ------------------ ---------- -----------

         3   ONLINE                        1013500    2003-05-07

 

脫機數據文件

SQL> alter database datafile 3 offline drop;

Database altered.

 

6、 打開數據庫,拷貝備份回來(restore),恢復(recover)該數據文件,並聯機:

SQL> alter database open;

Database altered.


拷貝備份從備份處

copy d:/databak/ users01.dbf d:/Oracle/oradata/test;


恢復該數據文件

SQL> recover datafile 3;

ORA-00279: change 1053698 generated at 05/07/2003 17:51:26 needed for

thread 1

ORA-00289: suggestion :
D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00304.ARC

ORA-00280: change 1053698 for thread 1 is in sequence #304

 

Specify log: {<RET>=suggested | filename | AUTO | CANCEL}

AUTO

ORA-00279: change 1053701 generated at 05/07/2003 17:51:39 needed for

thread 1

ORA-00289: suggestion : D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00305.ARC

ORA-00280: change 1053701 for thread 1 is in sequence #305

ORA-00278: log file 'D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00304.ARC' no longer needed for this recovery Log applied.

Media recovery complete.

恢復成功,聯機該數據文件

SQL> alter database datafile 3 online;

Database altered.

 

7、 檢查數據庫的數據(完全恢復)

SQL> select * from test;

                         A

--------------------------------

                         1

                         2

說明:

1、採用熱備份,需要運行在歸檔模式下,可以實現數據庫的完全恢復,也就是說,從備份後到數據庫崩潰時的數據都不會丟失;

2、可以採用全備份數據庫的方式備份,對於特殊情況,也可以只備份特定的數據文件,如只備份用戶表空間(一般情況下對於某些寫特別頻繁的數據文件,可以單獨加大備份頻率);

3、如果在恢復過程中,發現損壞的是多個數據文件,即可以採用一個一個數據文件的恢復方法(第5步中需要對數據文件一一脫機,第6步中需要對數據文件分別恢復),也可以採用整個數據庫的恢復方法;

4、如果是系統表空間的損壞,不能採用此方法。

 

4.2.2 RMAN備份方案

RMAN也可以進行聯機備份,而且備份與恢復方法將比OS備份更簡單可靠。

1、連接數據庫,創建測試表並插入記錄

SQL> connect internal/password as sysdba;

Connected.

 

SQL> create table test(a int) tablespace users;

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2、 備份數據庫表空間users

C:/>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=1788174720)

 

RMAN> run{

2> allocate channel c1 type disk;

3> backup tag 'tsuser' format 'd:/backup/tsuser_%u_%s_%p'

4> tablespace users;

5> release channel c1;

6> }

 

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=16 devtype=DISK

 

RMAN-03022: compiling command: backup

RMAN-03025: performing implicit partial resync of recovery catalog

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03023: executing command: backup

RMAN-08008: channel c1: starting full datafile backupset

RMAN-08502: set_count=5 set_stamp=494177612 creation_time=16-MAY-03

RMAN-08010: channel c1: specifying datafile(s) in backupset

RMAN-08522: input datafile fno=00003 name=D:/Oracle/ORADATA/TEST/USER01.DBF

RMAN-08013: channel c1: piece 1 created

RMAN-08503: piece handle=D:/BACKUP/TSUSER_05EN93AC_5_1 comment=NONE

RMAN-08525: backup set complete, elapsed time: 00:00:01

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

RMAN>

 

3、 繼續在測試表中插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

System altered.

SQL>r

1* alter system switch logfile;

System altered.

 

4、 關閉數據庫,模擬丟失數據文件

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

 

C:/>del D:/Oracle/ORADATA/TEST/USER01.DBF

 

5、 啓動數據庫,檢查錯誤

SQL> startup

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:/Oracle/ORADATA/TEST/USER01.DBF'

 

6、 先打開數據庫

SQL> alter database datafile 3 offline drop;

Database altered.

SQL> alter database open;

Database altered.

 

7、 恢復該表空間

恢復腳本可以是恢復單個數據文件

run{

allocate channel c1 type disk;

restore datafile 3;

recover datafile 3;

sql 'alter database datafile 3 online';

release channel c1;

}

也可以是,恢復表空間

run{

allocate channel c1 type disk;

restore tablespace users;

recover tablespace users;

sql 'alter database datafile 3 online';

release channel c1;

}

過程如下:

C:/>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=1788174720)

 

RMAN> run{

2> allocate channel c1 type disk;

3> restore datafile 3;

4> recover datafile 3;

5> sql 'alter database datafile 3 online';

6> release channel c1;

7> }

 

//輸出內容冗長,省略--編者

RMAN>

 

8、 檢查數據是否完整

SQL> alter database open;

Database altered.

 

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

說明:

1RMAN也可以實現單個表空間或數據文件的恢復,恢復過程可以在mount下或open方式下,如果在open方式下恢復,可以減少down機時間;

2、如果損壞的是一個數據文件,建議offline並在open方式下恢復;

3、這裏可以看到,RMAN進行數據文件與表空間恢復的時候,代碼都比較簡單,而且能保證備份與恢復的可靠性,所以建議採用RMAN的備份與恢復.

 

4.3丟失多個數據文件,實現整個數據庫的恢復.

 

4.3.1 OS備份方案

OS備份歸檔模式下損壞(丟失)多個數據文件,進行整個數據庫的恢復

1、 連接數據庫,創建測試表並插入記錄

SQL> connect internal/password as sysdba;

Connected.

 

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2、 備份數據庫,備份除臨時數據文件後的所數據文件

SQL> @hotbak.sql 或在DOS svrmgrl @hotbak.sql

 

3、 繼續在測試表中插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

 

4、 關閉數據庫,模擬丟失數據文件

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

 

C:/>del D:/Oracle/ORADATA/TEST/SYSTEM01.DBF

C:/>del D:/Oracle/ORADATA/TEST/INDX01.DBF

C:/>del D:/Oracle/ORADATA/TEST/TOOLS01.DBF

C:/>del D:/Oracle/ORADATA/TEST/RBS01.DBF

模擬媒體毀壞(這裏刪除多個數據文件)

 

5、 啓動數據庫,檢查錯誤

SQL> STARTUP

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

ORA-01110: data file 1: 'D:/Oracle/ORADATA/TEST/SYSTEM01.DBF'

 

詳細信息可以查看報警文件

ORA-1157 signalled during: ALTER DATABASE OPEN...

Thu May 08 09:39:36 2003

Errors in file D:/Oracle/admin/test/bdump/testDBW0.TRC:

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

ORA-01110: data file 1: 'D:/Oracle/ORADATA/TEST/SYSTEM01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的文件。

 

Thu May 08 09:39:36 2003

Errors in file D:/Oracle/admin/test/bdump/testDBW0.TRC:

ORA-01157: cannot identify/lock data file 2 - see DBWR trace file

ORA-01110: data file 2: 'D:/Oracle/ORADATA/TEST/RBS01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的文件。

 

Thu May 08 09:39:36 2003

Errors in file D:/Oracle/admin/test/bdump/testDBW0.TRC:

ORA-01157: cannot identify/lock data file 5 - see DBWR trace file

ORA-01110: data file 5: 'D:/Oracle/ORADATA/TEST/TOOLS01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的文件。

 

Thu May 08 09:39:36 2003

Errors in file D:/Oracle/admin/test/bdump/testDBW0.TRC:

ORA-01157: cannot identify/lock data file 6 - see DBWR trace file

ORA-01110: data file 6: 'D:/Oracle/ORADATA/TEST/INDX01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的文件。

 

通過查詢v$recover_file可以看到

SQL> select * from v$recover_file;

 

     FILE# ONLINE  ERROR                 CHANGE# TIME

---------- ------- ------------------ ---------- -----------

         1 ONLINE  FILE NOT FOUND              0

         2 ONLINE  FILE NOT FOUND              0

         5 ONLINE  FILE NOT FOUND              0

         6 ONLINE  FILE NOT FOUND              0

有四個數據文件需要恢復

 

6、 拷貝備份回到原地點(restore),開始恢復數據庫(recover)

restore過程:

C:/>copy D:/DATABAK/SYSTEM01.DBF D:/Oracle/ORADATA/TEST/

C:/>copy D:/DATABAK/TEST/INDX01.DBF D:/Oracle/ORADATA/TEST/

C:/>copy D:/DATABAK/TEST/TOOLS01.DBF D:/Oracle/ORADATA/TEST/

C:/>copy D:/DATABAK/TEST/RBS01.DBF.DBF D:/Oracle/ORADATA/TEST/

 

Recover過程:

SQL> recover database;

 

ORA-00279: change 1073849 generated at 05/08/2003 08:58:35 needed for thread 1

ORA-00289: suggestion : D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00311.ARC

ORA-00280: change 1073849 for thread 1 is in sequence #311

 

Specify log: {<RET>=suggested | filename | AUTO | CANCEL}

auto

ORA-00279: change 1073856 generated at 05/08/2003 09:03:27 needed for thread 1

ORA-00289: suggestion : D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00312.ARC

ORA-00280: change 1073856 for thread 1 is in sequence #312

ORA-00278: log file 'D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00311.ARC' no

longer needed for this recovery

 

ORA-00279: change 1073858 generated at 05/08/2003 09:11:43 needed for thread 1

ORA-00289: suggestion : D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00313.ARC

ORA-00280: change 1073858 for thread 1 is in sequence #313

ORA-00278: log file 'D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00312.ARC' no

longer needed for this recovery

 

ORA-00279: change 1073870 generated at 05/08/2003 09:11:46 needed for thread 1

ORA-00289: suggestion : D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00314.ARC

ORA-00280: change 1073870 for thread 1 is in sequence #314

ORA-00278: log file 'D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00313.ARC' no

longer needed for this recovery

 

Log applied.

Media recovery complete.

 

7、 打開數據庫,檢查數據庫的數據(完全恢復)

SQL> alter database open;

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

 

說明:

1、只要有備份與歸檔存在,就可以實現數據庫的完全恢復(不丟失數據);

2、適合於丟失大量數據文件,或包含系統數據文件在內的數據庫的恢復;

3、恢復過程在mount下進行,如果恢復成功,再打開數據庫,down機時間可能比較長一些。

 

4.3.2 RMAN備份方案

RMAN備份歸檔模式下損壞(丟失)多個數據文件,進行整個數據庫的恢復

1、連接數據庫,創建測試表並插入記錄

 

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2、備份數據庫

DOS C:>/ rman cmdfile=bakup.rcv msglog=backup.log;

 

以下是backup.log內容。

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> #     script:bakup.rcv

2> #     creater:chenjiping

3> #     date:5.8.2003

4> #     desc:backup all database datafile in archive with rman

5>

6> #connect database

7> connect rcvcat rman/rman@back;

8> connect target internal/virpure;

9>

10> #start backup database

11> run{

12> allocate channel c1 type disk;

13> backup full tag 'dbfull' format 'd:/backup/full%u_%s_%p' database

14> include current controlfile;

15> sql 'alter system archive log current';

16> release channel c1;

17> }

18> #end

19>

 

RMAN-06008: connected to recovery catalog database

RMAN-06005: connected to target database: TEST (DBID=1788174720)

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=15 devtype=DISK

RMAN-03022: compiling command: backup

RMAN-03023: executing command: backup

RMAN-08008: channel c1: starting full datafile backupset

RMAN-08502: set_count=4 set_stamp=494074368 creation_time=15-MAY-03

RMAN-08010: channel c1: specifying datafile(s) in backupset

RMAN-08522: input datafile fno=00002 name=D:/Oracle/ORADATA/TEST/RBS01.DBF

RMAN-08522: input datafile fno=00001 name=D:/Oracle/ORADATA/TEST/SYSTEM01.DBF

RMAN-08011: including current controlfile in backupset

RMAN-08522: input datafile fno=00005 name=D:/Oracle/ORADATA/TEST/TOOLS01.DBF

RMAN-08522: input datafile fno=00004 name=D:/Oracle/ORADATA/TEST/TEMP01.DBF

RMAN-08522: input datafile fno=00006 name=D:/Oracle/ORADATA/TEST/INDX01.DBF

RMAN-08522: input datafile fno=00003 name=D:/Oracle/ORADATA/TEST/USER01.DBF

RMAN-08013: channel c1: piece 1 created

RMAN-08503: piece handle=D:/BACKUP/FULL04EN5UG0_4_1 comment=NONE

RMAN-08525: backup set complete, elapsed time: 00:01:16

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: sql

RMAN-06162: sql statement: alter system archive log current

RMAN-03023: executing command: sql

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

Recovery Manager complete.

到這裏表示備份成功。

 

3、 繼續在測試表中插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL>alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

 

4、 關閉數據庫,模擬丟失數據文件

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

C:/>del D:/Oracle/ORADATA/TEST/SYSTEM01.DBF

C:/>del D:/Oracle/ORADATA/TEST/INDX01.DBF

C:/>del D:/Oracle/ORADATA/TEST/TOOLS01.DBF

C:/>del D:/Oracle/ORADATA/TEST/RBS01.DBF

 

5、啓動數據庫,檢查錯誤

SQL> STARTUP

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

ORA-01110: data file 1: 'D:/Oracle/ORADATA/TEST/SYSTEM01.DBF'

 

查詢v$recover_file

SQL> select * from v$recover_file;

 

     FILE# ONLINE  ERROR                 CHANGE# TIME

---------- ------- ------------------ ---------- -----------

         1 ONLINE  FILE NOT FOUND              0

         2 ONLINE  FILE NOT FOUND              0

         5 ONLINE  FILE NOT FOUND              0

         6 ONLINE  FILE NOT FOUND              0

可以知道有四個數據文件需要恢復.

 

6、利用RMAN進行恢復

C:/>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=1788174720)

RMAN> run{

2> allocate channel c1 type disk;

3> restore database;

4> recover database;

5> sql 'alter database open';

6> release channel c1;

7> }

 

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=17 devtype=DISK

RMAN-03022: compiling command: restore

RMAN-03025: performing implicit partial resync of recovery catalog

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: IRESTORE

RMAN-03023: executing command: IRESTORE

RMAN-08016: channel c1: starting datafile backupset restore

RMAN-08502: set_count=4 set_stamp=494074368 creation_time=15-MAY-03

RMAN-08089: channel c1: specifying datafile(s) to restore from backup set

RMAN-08523: restoring datafile 00001 to D:/Oracle/ORADATA/TEST/SYSTEM01.DBF

RMAN-08523: restoring datafile 00002 to D:/Oracle/ORADATA/TEST/RBS01.DBF

RMAN-08523: restoring datafile 00003 to D:/Oracle/ORADATA/TEST/USER01.DBF

RMAN-08523: restoring datafile 00004 to D:/Oracle/ORADATA/TEST/TEMP01.DBF

RMAN-08523: restoring datafile 00005 to D:/Oracle/ORADATA/TEST/TOOLS01.DBF

RMAN-08523: restoring datafile 00006 to D:/Oracle/ORADATA/TEST/INDX01.DBF

RMAN-08023: channel c1: restored backup piece 1

RMAN-08511: piece handle=D:/BACKUP/FULL04EN5UG0_4_1 tag=DBFULL params=NULL

RMAN-08024: channel c1: restore complete

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: recover

RMAN-03022: compiling command: recover(1)

RMAN-03022: compiling command: recover(2)

RMAN-03022: compiling command: recover(3)

RMAN-03023: executing command: recover(3)

RMAN-08054: starting media recovery

RMAN-03022: compiling command: recover(4)

RMAN-06050: archivelog thread 1 sequence 327 is already on disk as file D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00327.ARC

RMAN-06050: archivelog thread 1 sequence 328 is already on disk as file D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00328.ARC

RMAN-06050: archivelog thread 1 sequence 329 is already on disk as file D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00329.ARC

RMAN-06050: archivelog thread 1 sequence 330 is already on disk as file D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00330.ARC

RMAN-03023: executing command: recover(4)

RMAN-08515: archivelog filename=D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00327.ARC thread=1 sequence=327

RMAN-08515: archivelog filename=D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00328.ARC thread=1 sequence=328

RMAN-08055: media recovery complete

RMAN-03022: compiling command: sql

RMAN-06162: sql statement: alter database open

RMAN-03023: executing command: sql

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

RMAN>

 

7、 檢查數據庫的數據(完全恢復)

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

 

說明:

1、只要有備份與歸檔存在,RMAN也可以實現數據庫的完全恢復(不丟失數據);

2、同OS備份數據庫恢復,適合於丟失大量數據文件,或包含系統數據文件在內的數據庫的恢復;

3、目標數據庫在mount下進行,如果恢復成功,再打開數據庫;

4RMAN的備份與恢復命令相對比較簡單並可靠,建議有條件的話,都採用RMAN進行數據庫的備份。

 

4.4 不完全恢復案例

 

4.4.1 OS備份下的基於時間的恢復

 

不完全恢復可以分爲基於時間的恢復,基於改變的恢復與基於撤消的恢復,這裏已基於時間的恢復爲例子來說明不完全恢復過程。

 

基於時間的恢復可以不完全恢復到現在時間之前的某一個時間,對於某些誤操作,如刪除了一個數據表,可以在備用恢復環境上恢復到表的刪除時間之前,然後把該表導出到正式環境,避免一個人爲的錯誤。

 

1、 連接數據庫,創建測試表並插入記錄:

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2、 備份數據庫,這裏最好備份所有的數據文件,包括臨時數據文件:

SQL> @hotbak.sql 或在DOS svrmgrl @hotbak.sql

或冷備份也可以

 

3、 刪除測試表,假定刪除前的時間爲T1,在刪除之前,便於測試,繼續插入數據並應用到歸 

檔。

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

Statement processed.

SQL> alter system switch logfile;

Statement processed.

 

SQL> select to_char(sysdate,'yyyy-mm-dd hh24:mi:ss') from dual;

TO_CHAR(SYSDATE,'YY

-------------------

2003-05-21 14:43:01

SQL> drop table test;

Table dropped.

 

4、 準備恢復到時間點T1,找回刪除的表,先關閉數據庫:

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down.

 

5、 拷貝剛纔備份的所有數據文件回來

C:/>copy D:/DATABAK/*.DBF D:/Oracle/ORADATA/TEST/

 

6、 啓動到mount

SQL> startup mount;

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

 

7、 開始不完全恢復數據庫到T1時間

SQL> recover database until time '2003-05-21:14:43:01';

ORA-00279: change 30944 generated at 05/21/2003 14:40:06 needed for thread 1

ORA-00289: suggestion : D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00191.ARC

ORA-00280: change 30944 for thread 1 is in sequence #191

 

Specify log: {<RET>=suggested | filename | AUTO | CANCEL}

auto

Log applied.

Media recovery complete.

8、 打開數據庫,檢查數據

SQL> alter database open resetlogs;

 

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

 

說明:

1、不完全恢復最好備份所有的數據,冷備份亦可,因爲恢復過程是從備份點往後恢復的,如果因爲其中一個數據文件的時間戳(SCN)大於要恢復的時間點,那麼恢復都是不可能成功的;

2、不完全恢復有三種方式,過程都一樣,僅僅是recover命令有所不一樣,這裏用基於時間的恢復作爲示例;

3、不完全恢復之後,都必須用resetlogs的方式打開數據庫,建議馬上再做一次全備份,因爲resetlogs之後再用以前的備份恢復是很難了;

4、以上是在刪除之前獲得時間,但是實際應用中,很難知道刪除之前的實際時間,但可以採用大致時間即可,或可以採用分析日誌文件(logmnr),取得精確的需要恢復的時間;

5、一般都是在測試機後備用機器上採用這種不完全恢復,恢復之後導出/導入被誤刪的表回生產系統.

 

4.4.2 RMAN備份下的基於改變的恢復

以上用OS備份說明了一個基於時間的恢復,現在用RMAN說明一個基於改變的恢復

 

1、 連接數據庫,創建測試表並插入記錄

 

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2、 備份數據庫

C:/>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=874705288)

 

RMAN> run{

2> allocate channel c1 type disk;

3> backup full tag 'dbfull' format 'd:/backup/full%u_%s_%p' database

4> include current controlfile;

5> sql 'alter system archive log current';

6> release channel c1;

7> }

 

    //屏幕輸出內容冗長,省略--編輯

RMAN>

 

3、 刪除測試表,在刪除之前,便於測試,繼續插入數據並應用到歸檔,並獲取刪除前的scn號。

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

Statement processed.

SQL> alter system switch logfile;

Statement processed.

 

SQL> select max(ktuxescnw * power(2, 32) + ktuxescnb) scn from x$ktuxe;

      SCN

----------

  31014

SQL> drop table test;

Table dropped.

 

4、 準備恢復到SCN 31014,先關閉數據庫,然後啓動到mount

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down.

SQL> startup mount;

 

5、 開始恢復到改變點SCN 31014

RMAN> run{

2>      allocate channel c1 type disk;

3>      restore database;

4>      recover database until scn 31014;

5>      sql 'ALTER DATABASE OPEN RESETLOGS';

6>      release channel c1;

7> }

 

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=10 devtype=DISK

RMAN-03022: compiling command: restore

RMAN-03022: compiling command: IRESTORE

RMAN-03023: executing command: IRESTORE

RMAN-08016: channel c1: starting datafile backupset restore

RMAN-08502: set_count=1 set_stamp=494613682 creation_time=21-MAY-03

RMAN-08089: channel c1: specifying datafile(s) to restore from backup set

RMAN-08523: restoring datafile 00001 to D:/Oracle/ORADATA/TEST/SYSTEM01.DBF

RMAN-08523: restoring datafile 00002 to D:/Oracle/ORADATA/TEST/RBS01.DBF

RMAN-08523: restoring datafile 00003 to D:/Oracle/ORADATA/TEST/USERS01.DBF

RMAN-08523: restoring datafile 00004 to D:/Oracle/ORADATA/TEST/TEMP01.DBF

RMAN-08523: restoring datafile 00005 to D:/Oracle/ORADATA/TEST/TOOLS01.DBF

RMAN-08523: restoring datafile 00006 to D:/Oracle/ORADATA/TEST/INDX01.DBF

RMAN-08023: channel c1: restored backup piece 1

RMAN-08511: piece handle=D:/BACKUP/FULL01ENMD5I_1_1 tag=DBFULL params=NULL

RMAN-08024: channel c1: restore complete

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: recover

RMAN-03022: compiling command: recover(1)

RMAN-03022: compiling command: recover(2)

RMAN-03022: compiling command: recover(3)

RMAN-03023: executing command: recover(3)

RMAN-08054: starting media recovery

RMAN-03022: compiling command: recover(4)

RMAN-06050: archivelog thread 1 sequence 191 is already on disk as file D:/ORACL

E/ORADATA/TEST/ARCHIVE/TESTT001S00191.ARC

RMAN-06050: archivelog thread 1 sequence 192 is already on disk as file D:/ORACL

E/ORADATA/TEST/ARCHIVE/TESTT001S00192.ARC

RMAN-03023: executing command: recover(4)

RMAN-08515: archivelog filename=D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00191.AR

C thread=1 sequence=191

RMAN-08515:archivelog filename=D:/Oracle/ORADATA/TEST/ARCHIVE/TESTT001S00192.ARC

Thread=1 sequence=192

RMAN-08055: media recovery complete

RMAN-03022: compiling command: sql

RMAN-06162: sql statement: ALTER DATABASE OPEN RESETLOGS

RMAN-03023: executing command: sql

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

 

6、 檢查數據

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

可以看到,表依然存在。

 

說明:

1 RMAN也可以實現不完全恢復,方法比OS備份恢復的方法更簡單可靠;

2 RMAN可以基於時間,基於改變與基於日誌序列的不完全恢復,基於日誌序列的恢復可以指定恢復到哪個日誌序列,如

run { 

        allocate channel ch1 type disk; 

        allocate channel ch2 type 'sbt_tape';

        set until logseq 1234 thread 1;

        restore controlfile to '$Oracle_HOME/dbs/cf1.f' ; 

        replicate controlfile from '$Oracle_HOME/dbs/cf1.f';

        alter database mount; 

        restore database; 

        recover database; 

        sql "ALTER DATABASE OPEN RESETLOGS";

}

3、 與所有的不完全恢復一樣,必須在mount下,restore所有備份數據文件,需要resetlogs

4、 基於改變的恢復比基於時間的恢復更可靠,但是可能也更復雜,需要知道需要恢復到哪一個改變號(SCN),在正常生產中,獲取SCN的辦法其實也有很多,如 查詢數據庫字典表(V$archived_log or v$log_history),或分析歸檔與聯機日誌(logmnr)等。

第五章 其它恢復案例

5.1 損壞聯機日誌的恢復方法

5.1.1 損壞非當前聯機日誌

大家都清楚,聯機日誌分爲當前聯機日誌和非當前聯機日誌,非當前聯機日誌的損壞是比較簡單的,一般通過clear命令就可以解決問題。


1
、啓動數據庫,遇到ORA-00312 or ORA-00313錯誤,如

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: 'D:/Oracle/ORADATA/TEST/REDO01.LOG'

從這裏我們知道日誌組1的數據文件損壞了

從報警文件可以看到更詳細的信息

2、 查看V$log視圖

SQL> select group#,sequence#,archived,status from v$log;

 

    GROUP#      SEQUENCE# ARCHIVED STATUS

---------- ---------- -------- ----------------

         1          1     YES      INACTIVE

         2          2     YES      INACTIVE

         3          3     NO       CURRENT

可以知道,該組是非當前狀態,而且已經歸檔。

3、 用CLEAR命令重建該日誌文件

SQL>alter database clear logfile group 1;

如果是該日誌組還沒有歸檔,則需要用

SQL>alter database clear unarchived logfile group 1;

4、 打開數據庫,重新備份數據庫

SQL>alter database open;

 

說明:

1、如果損壞的是非當前的聯機日誌文件,一般只需要clear就可以重建該日誌文件,但是如果該數據庫處於歸檔狀態但該日誌還沒有歸檔,就需要強行clear

2、建議clear,特別是強行clear後作一次數據庫的全備份;

3、此方法適用於歸檔與非歸檔數據庫。

 

5.1.2 損壞當前聯機日誌

 

歸檔模式下當前日誌的損壞有兩種情況,

一、是數據庫是正常關閉,日誌文件中沒有未決的事務需要實例恢復,當前日誌組的損壞就可以直接用alter database clear unarchived logfile group n來重建。

二、是日誌組中有活動的事務,數據庫需要媒體恢復,日誌組需要用來同步,有兩種補救辦法:

A.  最好的辦法就是通過不完全恢復,可以保證數據庫的一致性,但是這種辦法要求在歸檔方式下,並且有可用的備份

B.  通過強制性恢復,但是可能導致數據庫不一致。


下面分別用來說明這兩種恢復方法:

 

5.1.2.1 通過備份來恢復

1、 打開數據庫,會遇到一個類似的錯誤

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: 'D:/Oracle/ORADATA/TEST/REDO01.LOG'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的文件

 

2、 查看V$log,發現是當前日誌

SQL> select group#,sequence#,archived,status from v$log;

 

    GROUP#      SEQUENCE# ARCHIVED STATUS

--------- ---------- -------- ----------------

         1          1     NO       CURRENT

         2          2     YES      INACTIVE

         3          3     YES      INACTIVE

 

3、 發現clear不成功

SQL> alter database clear unarchived logfile group 1;

alter database clear unarchived logfile group 1

*

ERROR at line 1:

ORA-01624: log 1 needed for crash recovery of thread 1

ORA-00312: online log 1 thread 1: 'D:/Oracle/ORADATA/TEST/REDO01.LOG'

 

4、 拷貝有效的數據庫的全備份,並不完全恢復數據庫:

可以採用獲取最近的SCN的辦法用until scn恢復或用until cnacel恢復

recover database until cancel

先選擇auto,儘量恢復可以利用的歸檔日誌,然後重新

recover database until cancel

這次輸入cancel,完成不完全恢復,也就是說恢復兩次。

如:

SQL> recover database until cancel;

Auto

……

SQL> recover database until cancel;

Cancel;

5、 利用alter database open resetlogs打開數據庫.

 

說明:

  1、這種辦法恢復的數據庫是一致的不完全恢復,會丟失當前聯機日誌中的事務數據;

  2、這種方法適合於歸檔數據庫並且有可用的數據庫全備份;

  3、恢復成功之後,記得再做一次數據庫的全備份;

  4、建議聯機日誌文件一定要實現鏡相在不同的磁盤上,避免這種情況的發生,因爲任何數據的丟失對於生產來說都是不容許的。

 

5.1.2.2 如果沒有備份,進行強制性恢復

1、 打開數據庫,會遇到一個類似的錯誤

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: 'D:/Oracle/ORADATA/TEST/REDO01.LOG'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的文件

 

2、 查看V$log,發現是當前日誌

SQL> select group#,sequence#,archived,status from v$log;

 

    GROUP#  SEQUENCE# ARCHIVED STATUS

---------- ---------- -------- ----------------

         1          1 NO       CURRENT

         2          2 YES      INACTIVE

         3          3 YES      INACTIVE

 

3、 發現clear不成功

SQL> alter database clear unarchived logfile group 1;

alter database clear unarchived logfile group 1

*

ERROR at line 1:

ORA-01624: log 1 needed for crash recovery of thread 1

ORA-00312: online log 1 thread 1: 'D:/Oracle/ORADATA/TEST/REDO01.LOG'

 

4、 把數據庫down

    SQL>shutdown immediate

 

5、 在init<sid>.ora中加入如下參數

     _allow_resetlogs_corruption=TRUE

 

6、 重新啓動數據庫,利用until cancel恢復

    SQL>recover database until cancel;

    Cancel

如果出錯,不再理會,發出

SQL>alter database open resetlogs;

 

7、 數據庫被打開後,馬上執行一個full export

 

8 shutdown數據庫,去掉_all_resetlogs_corrupt參數

 

9、 重建庫

 

10import並完成恢復

 

11、建議執行一下ANALYZE TABLE ...VALIDATE STRUCTURE CASCADE;

說明:

1、該恢復方法是沒有辦法之後的恢復方法,一般情況下建議不要採用,因爲該方法可能導致數據庫的不一致;

2、該方法也丟失數據,但是丟失的數據沒有上一種方法的數據多,主要是未寫入數據文件的已提交或未提交數據;

3、建議成功後嚴格執行以上的711步,完成數據庫的檢查與分析;

4、全部完成後做一次數據庫的全備份;

5、建議聯機日誌文件一定要實現鏡相在不同的磁盤上,避免這種情況的發生,因爲任何數據的丟失對於生產來說都是不容許的。

5.2 損壞控制文件的恢復方法

 

5.2.1 損壞單個控制文件

損壞單個控制文件是比較容易恢復的,因爲一般的數據庫系統,控制文件都不是一個,而且所有的控制文件都互爲鏡相,只要拷貝一個好的控制文件替換壞的控制文件就可以了。

 

1、 控制文件損壞,最典型的就是啓動數據庫出錯,不能mount數據庫

SQL>startup

ORA-00205: error in identifying controlfile, check alert log for more info

查看報警日誌文件,有如下信息

alter database  mount

Mon May 26 11:59:52 2003

ORA-00202: controlfile: 'D:/Oracle/oradata/chen/control01.ctl'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的文件。

 

2、 停止數據庫:

SQL>shutdown immediate

 

3、 拷貝一個好的控制文件替換壞的控制文件或修改init.ora中的控制文件參數,取消這個壞的控制文件。

 

4、 重新啓動數據:

SQL>startup

 

說明:

1、損失單個控制文件是比較簡單的,因爲數據庫中所有的控制文件都是鏡相的,只需要簡單的

拷貝一個好的就可以了;

2、建議鏡相控制文件在不同的磁盤上;

3、建議多做控制文件的備份,長期保留一份由alter database backup control file to trace產生的控制文件的文本備份。


5.2.2
損壞全部控制文件

 

損壞多個控制文件,或者人爲的刪除了所有的控制文件,通過控制文件的複製已經不能解決問題,這個時候需要重新建立控制文件。

 

同時注意,alter database backup control file to trace可以產生一個控制文件的文本備份。


以下是詳細重新創建控制文件的步驟:

1、 關閉數據庫

SQL>shutdown immediate;

2、 刪除所有控制文件,模擬控制文件的丟失

 

3、 啓動數據庫,出現錯誤,並不能啓動到mount

SQL>startup

ORA-00205: error in identifying controlfile, check alert log for more info

查看報警日誌文件,有如下信息

alter database  mount

Mon May 26 11:53:15 2003

ORA-00202: controlfile: 'D:/Oracle/oradata/chen/control01.ctl'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的文件。

 

4、 關閉數據庫

SQL>shutdown immediate;

 

5、 在internalsys下運行如下創建控制文件的腳本,注意完整列出聯機日誌或數據文件的路徑,或修改由alter database backup control file to trace備份控制文件時產生的腳本,去掉多餘的註釋即可。

STARTUP NOMOUNT

CREATE CONTROLFILE REUSE DATABASE "TEST" NORESETLOGS NOARCHIVELOG

         MAXLOGFILES 32

         MAXLOGMEMBERS 2

         MAXDATAFILES 254

         MAXINSTANCES 1

         MAXLOGHISTORY 226

LOGFILE

    GROUP 1 'D:/Oracle/ORADATA/TEST/REDO01.LOG'  SIZE 1M,

    GROUP 2 'D:/Oracle/ORADATA/TEST/REDO02.LOG'  SIZE 1M,

    GROUP 3 'D:/Oracle/ORADATA/TEST/REDO03.LOG'  SIZE 1M

DATAFILE

    'D:/Oracle/ORADATA/TEST/SYSTEM01.DBF',

    'D:/Oracle/ORADATA/TEST/RBS01.DBF',

    'D:/Oracle/ORADATA/TEST/USERS01.DBF',

    'D:/Oracle/ORADATA/TEST/TEMP01.DBF',

    'D:/Oracle/ORADATA/TEST/TOOLS01.DBF',

    'D:/Oracle/ORADATA/TEST/INDX01.DBF'

CHARACTER SET ZHS16GBK;

 

-- Recovery is required if any of the datafiles are restored backups,

-- or if the last shutdown was not normal or immediate.

RECOVER DATABASE

--if the last shutdown was not normal or immediate

--noarchive

-- RECOVER DATABASE UNTIL CANCELUSING BACKUP CONTROLFILE

--archive

-- RECOVER DATABASE USING BACKUP CONTROLFILE UNTIL CANCEL

-- Database can now be opened normally.

ALTER DATABASE OPEN;

--if recover database until cancel

--ALTER DATABASE OPEN RESETLOGS;

6、 如果沒有錯誤,數據庫將啓動到open狀態下。

 

說明:

1、重建控制文件用於恢復全部數據文件的損壞,需要注意其書寫的正確性,保證包含了所有的數據文件與聯機日誌;

2、經常有這樣一種情況,因爲一個磁盤損壞,我們不能再恢復(store)數據文件到這個磁盤,因此在store到另外一個盤的時候,我們就必須重新創建控制文件,用於識別這個新的數據文件,這裏也可以用這種方法用於恢復。

 

5.3 損壞回滾數據文件的恢復方法

回滾段表空間中的一個數據文件丟失或者損壞導致數據庫無法識別它,在啓動數據庫的時候會出現ORA-1157, ORA-1110的錯誤,或者操作系統級別的錯誤,例如ORA-7360。在關閉數據庫的時候(normal或者immediate)會出現ORA- 1116, ORA-1110的錯誤,或者操作系統級別的錯誤,例如ORA-7368

 

感謝Coolyl的辛勤工作,關於回滾段的大部分內容都是摘自他在itpub的文章。

 

5.3.1 損壞數據文件,但數據庫處於Open狀態

如果你發現有回滾段的數據文件丟失或者損壞了,而此時的數據庫是處於打開的狀態下並且在運行,就千萬不要關閉數據庫了,因爲在大多數的情況下打開的時候比關閉的時候好解決問題一些。

 

一般也是存在有兩種情況:

A、是offline丟失或損壞的數據文件,然後從一個備份中恢復,執行介質恢復以保持一致性。但是這種情況要求數據庫是歸檔方式下才可以採用的。

B、是offline那個存在丟失或損壞的數據文件所在的整個回滾段表空間,然後刪除整個回滾段表空間並重建,但是你必須要殺掉那些在回滾段中已經激活的用戶進程纔可以offline的。

通常第一種情況就比較簡單實現,但是更多的用戶事務將會出錯並且回滾。

 

A的具體步驟:

1 offline丟失或損壞的數據文件

ALTER DATABASE DATAFILE '<full_path_file_name>' OFFLINE;

2、 從一個有效的備份中恢復。

3、 執行以下查詢:

SELECT V1.GROUP#, MEMBER, SEQUENCE#

FROM V$LOG V1, V$LOGFILE V2

WHERE V1.GROUP# = V2.GROUP# ;

這個將列出你的所有redolog文件以及它們所代表的sequence numbers

4、 恢復數據文件。

RECOVER DATAFILE '<full_path_file_name>'

5、 確信你應用了所有的redolog文件,直至出現提示信息"Media recovery complete"

6 online那個數據文件。

ALTER DATABASE DATAFILE '<full_path_file_name>' ONLINE;

 

B的具體步驟:

1 offline存在丟失或損壞的數據文件的回滾段表空間中的所有回滾段。

ALTER ROLLBACK SEGMENT <rollback_segment> OFFLINE;

2、 檢測當然回滾段的狀態。

SELECT SEGMENT_NAME, STATUS FROM DBA_ROLLBACK_SEGS

WHERE TABLESPACE_NAME = '<TABLESPACE_NAME>';

3、 刪除所有offline的回滾段

DROP ROLLBACK SEGMENT <rollback_segment>;

4、 處理那些online狀態的回滾段。

重新執行第二步的查詢

如果你已經執行過offline操作的回滾段狀態仍然是online,則說明這個回滾段內有活動的事務。你要接着查詢

SELECT SEGMENT_NAME, XACTS ACTIVE_TX, V.STATUS

FROM V$ROLLSTAT V, DBA_ROLLBACK_SEGS

WHERE TABLESPACE_NAME = '<TABLESPACE_NAME>' AND SEGMENT_ID = USN;

如果沒有返回結果,則證明存在丟失或損壞的數據文件的回滾段表空間中的所有回滾段都已經被offline了,然後重新執行第二步,第三步。如果查詢 有結果返回,則狀態應該是"PENDING OFFLINE".接着查看ACTIVE_TX列,如果值爲0,則表明此回滾段中已經沒有未處理的事務了,很快就會被offline的,然後等它 offline後重新執行23步後跳至第六步。如果值大於0,則繼續到第五步。

5、 強制那些包含活動事務的回滾段offline

活動的事務應該被提交或者回滾,執行下面的查詢看看哪些用戶佔用了回滾段:

SELECT S.SID, S.SERIAL#, S.USERNAME, R.NAME "ROLLBACK"

FROM V$SESSION S, V$TRANSACTION T, V$ROLLNAME R

WHERE R.NAME IN ('<PENDING_ROLLBACK_1>', ... ,

'<PENDING_ROLLBACK_N>')

AND S.TADDR = T.ADDR AND T.XIDUSN = R.USN;

最好能直接聯繫到那些user讓他們自己去回滾或者提交事務,如果不能做到的話,那就只能強制性的殺掉進程了。

ALTER SYSTEM KILL SESSION '<SID>, <SERIAL#>';

殺掉進程後再過一段時間後回滾段會自動清除那些事務,然後就可以回到第二步繼續查詢了。

6、 刪除回滾段。

DROP TABLESPACE <tablespace_name> INCLUDING CONTENTS;

7、 重建回滾段並online它們。

 

說明:

1、數據庫如果是open狀態,就可以直接在open狀態下解決問題,沒有必要停下數據庫,增加down機時間;

2、不管上上面那種恢復方法都是正常性的恢復,不會引起數據的不一致或錯誤。

 

5.3.2數據庫關閉,但是數據文件中沒有活動事務

 

這種情況下最簡單的方法就是offline drop掉這個壞了的或者丟失的數據文件,然後以restricted模式打開數據庫然後刪除並且重建包含損壞文件的回滾段表空間。

 

具體步驟如下:

1、 確定數據庫是正常的關閉的。方法是可以去查看alert文件,到最後看是否有如下信息:

"alter database dismount

Completed: alter database dismount"

如果有的話,就證明數據庫是正常關閉的,否則就不能用這個方法去恢復。

2、 修改init參數文件,移去ROLLBACK_SEGMENTS中包含的損壞數據文件的回滾段表空間的回滾段,如果你不能確定哪些回滾段是壞的,簡單的方法是你可以註釋掉整個ROLLBACK_SEGMENTS

3、 以restricted模式去mount數據庫。

STARTUP RESTRICT MOUNT

4 offline drop掉那個壞的數據文件

ALTER DATABASE DATAFILE '<full_path_file_name>' OFFLINE DROP;

5、 打開數據庫

ALTER DATABASE OPEN

如果你看到如下信息"Statement processed",則跳到第7步,如果你看到ORA-604, ORA-376, and ORA-1110的錯誤信息,繼續第6步。

6    正常的關閉數據庫,然後在init文件中註釋掉ROLLBACK_SEGMENTS,並加入隱含參數

_corrupted_rollback_segments = ( <rollback1>,...., <rollbackN> )

然後以restricted模式打開數據庫

STARTUP RESTRICT

7、 刪除掉那個包含損壞文件的回滾段表空間。

DROP TABLESPACE <tablespace_name> INCLUDING CONTENTS;

8、 重建回滾段表空間,記得創建後要把回滾段都online

9、 重新使數據庫對所有用戶可用。

ALTER SYSTEM DISABLE RESTRICTED SESSION;

10、然後正常關閉數據庫,修改init文件,如果開始只是註釋掉了ROLLBACK_SEGMENTS的,就去掉註釋即可,如果加了隱含參數的,註釋掉它,並在ROLLBACK_SEGMENTS加入所有的回滾段。

11、正常啓動數據庫:

Startup

說明:

1、這種方法的前提條件是數據庫是正常關閉(不是abort)可用;

2、這種方法是正常方法,不會引起數據錯誤。

 

5.3.3 數據庫關閉,數據文件中有活動事務,沒有可用備份。

一般造成這種原因的情況是採用了shutdown abort或其它原因異常關機(如斷電)導致的。

 

1、開啓一個事務

SQL> set transaction use rollback segment rbs0;

Transaction set.

SQL> insert into test (a) values (1);

1 row created.

 

2、異常關閉

SQL> shutdown abort;

Oracle instance shut down.

 

3、刪除rbs的一個數據文件

C:>del D:/Oracle/oradata/chen/rbs01.

 

4、修改INIT<sid>.ora :

rollback_segments=(system)

添加_corrupted_rollback_segments=(rbs0,rbs1,rbs2……)

 

5SQL>Startup mount

 

6SQL>alter database datafile 'd:/Oracle/oradata/t8i/rbs01.dbf' offline drop;

數據庫已更改。

 

7SQL>recover database

完成介質恢復。

 

8SQL>alter database open ;

數據庫已更改。

 

9SQL>select * from v$rollname;

 

         USN    NAME

----   -------

         0       SYSTEM

 

10SQL>select segment_name,tablespace_name,status
FROM dba_rollback_segs;

SEGMENT_NAME TABLESPACE_NAME      STATUS

----------- ------ ------------------------------------

SYSTEM        SYSTEM               ONLINE

RBS0          RBS                  NEEDS RECOVERY

RBS1          RBS                   NEEDS RECOVERY

RBS2          RBS                  NEEDS RECOVERY

 

11SQL>drop rollback segment rbs0;

重算段已丟棄。

    SQL>drop rollback segment rbs1;

重算段已丟棄。

    SQL>drop rollback segment rbs2;

重算段已丟棄。

 

12SQL>select segment_name,tablespace_name,status
FROM dba_rollback_segs;

SEGMENT_NAME TABLESPACE_NAME   STATUS

-------------------------------------

SYSTEM        SYSTEM            ONLINE

 

13SQL>drop tablespace rbs including contents;

表空間已丟棄。

 

14、重建新的回滾表空間及回滾段,並聯機。

 

15SQL>shutdown abort

 

16、再修改INIT<sid>.ora

rollback_segments=(rbs0,rbs1,rbs2)

_corrupted_rollback_segments=(rbs0,rbs1,rbs2)去掉。

 

17SQL>startup

 

說明:

1、這種辦法是萬不得以的時候使用的方法,如果有備份,都建議從備份上進行恢復;

2、這種方法恢復的數據庫,可能會引起數據庫的數據錯誤;

3、恢復成功以後,建議exp/imp數據,並重新分析檢查數據庫。


5.3.4
數據庫關閉,數據文件中有活動事務,從備份恢復

1、從一個有效的備份中恢復損壞的數據文件。

2mount數據庫。

3、執行以下查詢:

SELECT FILE#, NAME, STATUS FROM V$DATAFILE;

如果發現要恢復的文件是offline狀態的話,要先online它:

ALTER DATABASE DATAFILE '<full_path_file_name>' ONLINE;

4、執行以下查詢

SELECT V1.GROUP#, MEMBER, SEQUENCE#, FIRST_CHANGE#

FROM V$LOG V1, V$LOGFILE V2

WHERE V1.GROUP# = V2.GROUP# ;

這個將列出redlog文件所代表的sequencefirst change numbers

 

5、如果數據庫是非歸檔情況下,執行以下查詢:

SELECT FILE#, CHANGE# FROM V$RECOVER_FILE;

如果CHANGE#大於最小的redolog文件的FIRST_CHANGE#,則數據文件可以被恢復,記得在應用日誌的時候要把所有redolog文件全部應用一遍。

如果CHANGE#小於最小的redolog文件的FIRST_CHANGE#,則數據文件就不可以被恢復了,這時候你要從一個有效的全備份中去恢 複數據庫了,如果沒有全備份的話,那你就只能把數據庫強制打開到一個不一致的狀態去exp出數據,然後重新建庫導入數據,因爲這種方式的恢復Oracle 是不推薦用戶自己做的,所以這裏我就不詳細說明了。

 

6、恢復數據文件:

RECOVER DATAFILE '<full_path_file_name>'

7、確信你應用了所有的redolog文件,直至出現提示信息"Media recovery complete"

8、打開數據庫。

說明:

1、這種方法要求在歸檔有備份的方式下進行,而且是建議方式;

2、這種方法不會導致數據庫的錯誤。

5.4 損壞臨時數據文件的恢復方法

 

臨時數據文件的恢復是比較簡單的,因爲臨時文件中不涉及到其它的有用的數據,所以可以刪除後重建。

1、關閉數據庫:

SQL>shutdown immediate

2、刪除臨時數據文件,模擬媒體失敗;

 

3、啓動數據庫,檢測到文件錯誤;

 

4、脫機該數據文件:

SQL>alter database datafile '文件名全名' offline drop;

 

5、打開數據庫

SQL>alter database open

 

6、刪除該臨時表空間

SQL>drop tablespace temp(或其它臨時表空間名稱);

 

7、重新創建該表空間,並重新分配給用戶。

說明:

1、臨時數據文件是非重要文件,不保存永久數據,可以隨時刪除重建,不影響數據庫的數據安全;

2、如果重新建立以後,別忘了重新分配給用戶。

第六章. 常見恢復誤區

1、可以不需要備份,只有歸檔就能進行數據庫的向前的恢復

答:這個在Oracle 9i以前起碼是不可能的,在別的數據庫我也沒有聽說過,不完全恢復的主要思路是利用不完全點之前的備份,加上歸檔日誌,恢復到不完全恢復點,9i中出現了一個flashback的特性,這個特性的使用,也是有很多侷限的。

2、進行不完全恢復只需要拷貝一個需要恢復的備份數據文件

答:不完全恢復需要拷貝所有的數據文件,最好包括臨時數據文件在內,否則需要另外的處理,如果有一個數據文件的SCN大於不完全恢復點,那麼這個恢復都將是失敗的。


3
、使用RMAN目錄與目標數據庫在同一數據庫能很好進行數據庫的恢復

答:使用恢復目錄與目標數據庫在同一個數據庫中,將存在很大的恢復侷限,如該數據庫的系統數據文件的損害,數據庫根本不能open,那麼RMAN也就無法連接恢復目錄,也就不存在恢復了。

第七章. 小結


這裏我們反覆演示了多種情況下的恢復方案,通過這些演示,我們應該掌握瞭如下內容:

1、利用OSRMAN進行各種常規備份與恢復。

2、熟悉沒有備份或簡單的非常規備份與恢復的方法。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章