RMAN duplicate恢復數據庫報錯RMAN-06054問題處理

最近生產上要搞大動作，需要把生產庫備份每天都恢復到另外一臺機器上，進行測試。於是想到了用DUPLIDATE的方式，簡單方便，前期配置好目錄，然後一條命令就可以把庫恢復出來。於是寫了恢復腳本，也通過了測試，而且生產上使用一切正常。但一次需要在測試環境恢復數據庫時，使用該腳本卻報錯RMAN-06054。奇怪的是同樣的備份在生產上的另一個環境已經成功恢復了。下面來看看這個問題是怎麼處理的。

先看報錯的圖：

從報錯來看需要找節點1序號爲36615的歸檔，但當前庫的歸檔編號已經到了30多萬了，顯然是要找很早之前的歸檔。於是到MOS去找duplicate RMAN-06054相關的文章，不是很多，而且還有說是BUG的，不會這麼巧又遇到BUG了吧。但這個備份文件在其他環境是已經成功恢復了的，爲什麼到了這個環境就恢復不成功了呢。簡單對比了兩個恢復過程中的日誌，發現報錯的這次恢復日誌與成功的日誌有區別，出現了creating datafile的日誌，感覺比較奇怪，但不知道是什麼原因。結果這是一個關鍵點，如果直接從這個點去排查，可能很快就發現問題了，但就這個問題還是耗費了2天的時間。下圖爲區別：

下面繼續排查問題，既然DUPLICATE語句不能自動recover恢復數據，那嘗試手動recover會是什麼效果呢，看下圖：

看來手動recover還是報錯，要找sequence 36615的歸檔日誌。recover不行那open reseglogs試試。這裏勸各位，我這個是測試環境可以隨意嘗試，如果操作的是生產環境，請敬畏生產，防止事態進一步惡化。open reseglogs的結果仍然是報錯：

查看備份文件中的歸檔日誌的備份，sequence都是30多萬根本沒有報錯要找的36615號歸檔，那這就是個結了，沒有怎麼恢復呢？

恢復不成功怎麼辦呢？測試還等着庫用呢，難道是DUPLICATE的BUG嗎？還是“姿勢”不對？重新再恢復一遍，結果等待兩個小時後依然報同樣的錯。

DUPLICATE恢復不成功，那我用傳紡的方式手動restore recover的方式是不是就可以了呢？結果是理想很豐滿，現實很骨感，依然同樣報錯。那問題在哪呢？

靜下心來想想，recover database想找很早以前的歸檔日誌，是不是備份文件出了問題，進而導致恢復出的文件有問題？於是使用validate把備份文件又驗證了一下，結果是沒有問題。那是不是傳輸過程中出了問題呢？對兩邊機器上的文件做了md5校驗，結果是兩邊的文件又是一致的。那問題到底出在了哪呢？

突然想到可以通過查詢數據字典查文件的scn號，通過這個是不是可以找到問題的答案呢？我們來看一下查詢結果：

從v$datafile中查到的文件的scn號都比報錯中的scn號大幾個數量級，難道問題不在這？又想到，v$datafile應該是contral file中記錄的信息，控制文件是從備份中恢復出來的，那應該記錄的是比較新的scn號，如何找到文件中實際的scn號的，於是想到了v$datafile_header這個數據字典。終於從這個數據字典中找到了一些線索：

從上圖中可以看到有部分文件的scn號比其他的小很多，應該是出問題的數據文件了。而且對比了文件號爲12的scn號爲22575491與RMAN報錯中的scn號是吻合的。那應該就可以解釋問題了，部分數據文件恢復出問題，導致需要更早的歸檔日誌進行恢復，但歸檔日誌已被刪除，無法恢復，所以recover無法進行。

問題找到了，那重新restore出問題的文件不就好了麼，結果還是那句理想很豐滿，現實很骨感。restore datafile時又出現了creating datafile的語句，與最開始發現的問題一樣，再次查詢v$datafile_header這個文件還是有問題的。都已經到這一步了，問題該怎麼解決呢？

查詢datafile爲12的備份文件，也是有的

但是嘗試使用FULLBACKUP的tag進行恢復時，出現了新的報錯no backup of copy of datafile found to restore。這就奇怪了，前面查備份是有的，但restore時報沒有，難道是見“鬼”了嗎？

實在想不出問題解決的辦法，於是又去查恢復成功的日誌，這次有了重大發現，原來datafile 12的備份文件是在20181218這個備份文件中的。

現在想明白了，原來其他同事在傳輸備份文件時，以爲只有20181219的文件是全部的備份文件，而忽略了20181218的10個備份文件。而我就用這少了10個文件的備份嘗試了多次恢復數據庫。想想還是有點好笑，就跟開始說的那樣，如果一開始發現恢復日誌有異常就去詳細對比日誌的話，就不會花了這麼多時間來搗鼓沒有全部備份文件的恢復了。

把漏傳的備份文件重新傳輸後，duplicate成功完成了恢復。

致些，問題解決，最後提醒一下自己，做事情還需要再仔細一些。還有最重要的一點就是敬畏生產。

RMAN duplicate恢復數據庫報錯RMAN-06054問題處理

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

HTML 00 Tutorial

全面系統的AI學習路徑，幫助普通人也能玩轉AI

從零開始：使用 Playwright 腳本錄製實現自動化測試

騰訊面試：什麼鎖比讀寫鎖性能更高？

Hadoop HA 雙namenode搭建

Redis參數彙總

學習Redis Cluster並手動搭建集羣

學習Redis持久化

Oracle 11.2.0.4 RAC安裝數據庫軟件無法識別主機

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結