AIX系統errpt詳解


在AIX中,errpt用於報告系統軟硬件相關的錯誤日誌信息

先來看一個實際的輸出,不帶參數簡單列出所有的錯誤

#errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
A2205861 1214144307 P S SYSPROC Excessive interrupt disablement time
F3931284 1213234807 I H ent1 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 1213234807 T H ent1 ETHERNET DOWN
F3931284 1213234807 I H ent1 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 1213233607 T H ent1 ETHERNET DOWN
0873CF9F 1212141207 T S pts/1 TTYHOG OVER-RUN
0873CF9F 1212141207 T S pts/1 TTYHOG OVER-RUN


使用-a參數查看詳細信息

#errpt -a | more
—————————————————————————
LABEL: GOENT_RCVRY_EXIT
IDENTIFIER: F3931284

Date/Time: Thu Dec 13 23:48:47 BEIST 2007
Sequence Number: 162
Machine Id: 00099476D600
Node Id: db158
Class: H
Type: INFO
Resource Name: ent1
Resource Class: adapter
Resource Type: 14108902
Location: U787B.001.DNWA74C-P1-T9
VPD:
Product Specific.( )…….2-Port 10/100/1000 Base-TX PCI-X
Adapter
Network Address………….000D6051A0F6
ROM Level.(alterable)…….DV0210

Description
ETHERNET NETWORK RECOVERY MODE

Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data
FILE NAME
line: 204 file: goent_intr.c
PCI ETHERNET STATISTICS
0001 EF66 0063 0853 0000 0001 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001
0000 0000 0000 A69D 0000 0000 002C B028 0000 0000 0000 A64B 0000 0000 0000 A597
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0001 0000 0001 0000 0001 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 BB83 08F0 0068 0C00 0000 0000 01A0 0000 0000
0000 0000 0000 0000 0000 C9E1 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000
DEVICE DRIVER INTERNAL STATE
5555 5555 0000 0000 0000 0000
SOURCE ADDRESS
0011 25C0 3BDE

其中:
LABLE:事件名稱

IDENTIFIER:事件ID

Date/Time:發生的時間

Sequence Number:事件序列號

Machine ID:機器標識

Node ID:節點標識

Class:事件來源
S-軟件
H-硬件
I-信息
U-未定的

Type:事件類型
PEND-設備或組件的可用性損失是急迫的。
PERF-設備或組件的性能已下降到可接受的級別以下。
PERM-出現了不可恢復的情況。如果錯誤類型爲這個值,那麼通常是最嚴重的錯誤,並且很可能意味着出現了硬件設備或者軟件模塊的故障。如果錯誤類型爲 PERM 之外的其他值,通常並不表示故障,但是對這些錯誤進行了記錄,以便可以使用診斷程序對它們進行分析。
TEMP—在出現多次不成功的嘗試之後,所恢復到的狀態。這種錯誤類型也可以用於記錄信息性條目,如 DASD 設備的數據傳輸統計信息。
UNKN—無法確定錯誤的嚴重程度。
INFO—錯誤日誌條目是信息性的,並且不是某個錯誤所產生的結果。

Resource Name:檢測到錯誤的資源的名稱。對於軟件錯誤,這是某個軟件組件或可執行程序的名稱。對於硬件錯誤,這是某個設備或系統組件的名稱。它並不表示該組件出現故障或者需要更換。相反,它用於確定合適的診斷模塊以用於對錯誤進行分析。

Resource Class:檢測到故障的資源的一般類別(例如,磁盤的設備類別)。

Resource Type:檢測到故障的資源的類型。

Location Code:設備的路徑。最多可能有四個字段,分別是抽屜、插槽、連接器和端口。

VPD:關鍵的產品數據。這個字段的內容(如果存在)可能各不相同。設備的錯誤日誌條目通常返回有關設備製造商、序列號、工程變更級別、以及只讀存儲級別的信息。

Description:錯誤的彙總信息。

Probable Cause:一些可能的錯誤原因的列表。

User Causes:由用戶錯誤所導致錯誤的可能原因的列表。用戶所導致的錯誤可能包括不正確插入的磁盤、未能開啓的外部設備(如調制解調器和打印機)。

Actions:對於糾正用戶所導致的錯誤的推薦操作的描述。

Install Causes:因爲不正確的安裝或者配置過程所導致錯誤的可能原因列表。這種類型的錯誤包括硬件和軟件不匹配、電纜的不正確安裝或電纜連接變鬆,以及未能正確配置的系統。

Actions:對於糾正安裝所導致的錯誤的推薦操作的描述。

Failure Causes:可能的硬件或者軟件故障列表。

Actions:對於糾正故障的推薦操作的描述。對於硬件錯誤,這將導致運行診斷程序。

Detailed Data:針對每個錯誤日誌條目的、唯一的故障數據,如設備檢測數據。

本文主要來自《IBM AIX V5.3 系統管理(Test 222)認證指南系列,第 5 部分:問題的確定和解決(上)》,摘錄於此僅供參考。


轉自:http://www.cnblogs.com/snake-hand/archive/2011/04/06/2452305.html

發佈了47 篇原創文章 · 獲贊 8 · 訪問量 23萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章