複製進程abended
GGSCI (jcyqdb02) 2> info RPEYAD
REPLICAT RPEYAD Last Started 2019-09-07 01:15 Status ABENDED
Checkpoint Lag 00:54:28 (updated 05:47:00 ago)
Log Read Checkpoint File /oggfs/dirdat/ad000085
2019-09-09 02:37:34.775694 RBA 764931627
report報錯如下
2019-09-09 02:37:34 ERROR OGG-01028 Incompatible record (102) in /oggfs/dirdat/ad000085, rba 764931627 (getting header).
這個報錯表示可能隊列文件損壞
使用logdump檢查
logdump 1 >open /oggfs/dirdat/ad000085
logdump 2 >pos 764931627
logdump 3 >n
Bad record found at (RBA 764993409, format 5.50 Unknown TokenID ffff)
4701 0216 4800 0035 4504 0041 01b5 05ff 02f2 b842 | G...H..5E..A.......B
6bbd a5d2 0000 0000 5f2a 0de8 0000 4318 0152 0000 | k......._*....C..R..
0001 4550 4d5f 5343 2e41 5243 5f45 5f4d 505f 5051 | ..EPM_SC.ARC_E_MP_PQ
0044 0001 b500 0000 0a00 0000 0000 75cd 7606 9e00 | .D............u.v...
0100 0a00 0000 0000 7556 6ec7 dd00 0200 0a00 0000 | ........uVn.........
0632 3031 3930 3900 0300 0d00 0000 0935 3134 3031 | .201909........51401
3330 3135 0004 0006 a200 000b b03c 07f0 57a0 360c | 3015.........<..W.6.
4401 04c3 5f00 0001 0000 0000 1a59 66f0 4cbf f60c | D..._........Yf.L...
4401 b000 0332 000b b024 1603 0200 1200 069c 2f00 | D....2...$......../.
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 | ....................
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 | ....................
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 | ....................
0000 0000 0000 0000 0000 0000 0100 0fff ff00 3003 | ..................0.
c603 9603 9600 0000 0f1d a11b 8c19 9517 9e15 d414 | ....................
1c12 2e10 3e0e 710c 970a be09 2407 4e05 9203 c600 | ....>.q.....$.N.....
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 | ....................
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 | ....................
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 | ....................
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 | ....................
0000 00ff ffff ffff ffff ffff ffff ffff ffff ffff | ....................
ffff ffff ffff ffff ffff ffff ffff ffff ffff ffff | ....................
ffff ffff ffff ffff ffff ffff ffff ffff ffff ffff | ....................
ffff ffff ffff ffff ffff ffff ffff ffff ffff ffff | ....................
ffff ffff ffff ffff ffff ffff ffff ffff ffff ffff | ....................
ffff ffff ffff ffff ffff ffff ffff ffff ffff ffff | ....................
ffff ffff ffff ffff ffff ffff ffff ffff ffff ffff | ....................
ffff ffff ffff ffff ffff ffff ffff | ..............
紅標表示隊列文件損壞
情況一:這個時候再輸入一次n,沒有出現損壞信息,說明下一個記錄是好的
直接使用alter跳到下個記錄
GGSCI (jcyqdb02) 3> alter replicat RPEYAD,extrba 764993409
REPLICAT altered.
GGSCI (jcyqdb02) 4> start RPEYAD
Sending START request to MANAGER ...
REPLICAT RPEYAD starting
GGSCI (jcyqdb02) 5> info all
REPLICAT RUNNING RPEYAD 00:00:00 00:00:08
情況二:再輸入n,仍然是這條損壞的記錄,說明下一個記錄也是壞的。說明整個隊列文件已經損壞了
--n多次,rba沒變
--trail文件損壞
Logdump 224 >n
Bad record found at (RBA 764993409, format 5.50 Unknown TokenID ffff)
跳過整個trail文件(隊列文件號+1,ad000085=>85+1=86)
alter RPEYAD extrba 86
上述操作可能會導致數據不一致。
如果要保障數據一致性,需要找到源端的抽取隊列文件,如果抽取出來的隊列文件沒壞,重新投遞。
如果源端隊列文件損壞需要重新抽取,重新抽取需要確認事務的時間和歸檔是否還在。