MegaCli64查看磁盤損壞,錯誤個數統計情況

 

如下,兩個命令,是磁盤瀕臨崩壞,比如存在扇區損壞之類的事情發生。諮詢的浪潮熱線,報sn。他們的臨界值是500,我們監控腳本是200告警。Predictive Failure Count 這個的數字比Media Error Count 這個嚴重,

 

# /opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL -NoLog| grep -i error
Media Error Count: 0
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0
Media Error Count: 306
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0
Media Error Count: 0
Other Error Count: 0

 

# /opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL -NoLog| grep -C 8 "Media Error Count: 306"

Enclosure Device ID: 20
Slot Number: 3
Drive's position: DiskGroup: 0, Span: 0, Arm: 3
Enclosure position: 1
Device Id: 9
WWN: 500xxxxx45C
Sequence Number: 2
Media Error Count: 306
Other Error Count: 0
Predictive Failure Count: 0
Last Predictive Failure Event Seq Number: 0
PD Type: SAS

Raw Size: 1.090 TB [0x8bba0cb0 Sectors]
Non Coerced Size: 1.090 TB [0x8baa0cb0 Sectors]
Coerced Size: 1.090 TB [0x8baa0000 Sectors]
#

 

 

# /opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL -NoLog| grep 'Predictive Failure Count'
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 499
Predictive Failure Count: 0
Predictive Failure Count: 0
Predictive Failure Count: 0

 

 

“Predictive Failure Count” 是一項磁盤監控指標,用於預測磁盤可能發生的故障。這個數值正常情況下應爲“0”。如果“Predictive Failure Count”不爲“0”,則表示磁盤存在異常,可能即將發生故障。然而,該數值並不能確切地告訴我們磁盤在觸發告警後多久會徹底故障。

當遇到“Predictive Failure Count”不爲“0”的情況時,爲了數據安全考慮,建議儘快備份重要數據,並考慮更換新的磁盤。此外,也可以考慮進行進一步的磁盤診斷,以獲取更多關於磁盤健康狀況的信息,並決定最佳的應對策略。

請注意,不同的磁盤製造商和監控工具可能具有不同的故障預測機制,因此具體的操作和建議可能因實際情況而異。在處理此類問題時,建議參考相關的技術文檔或聯繫技術支持人員以獲取更準確的指導。

 

 

Media Error Count是一個重要的磁盤監控指標,用於表示磁盤介質錯誤的計數。正常情況下,這個數值應爲“0”。當Media Error Count不爲“0”時,這通常意味着磁盤可能存在壞道或其他介質問題。這個數值越大,表明磁盤的風險越高,可能面臨更嚴重的故障或數據損失風險。

在實際應用中,如果檢測到Media Error Count不爲“0”,應該立即對磁盤進行進一步的檢查和評估。可能需要進行磁盤的壞道掃描或數據備份,以避免潛在的數據丟失或硬件故障。同時,考慮更換新的磁盤也是一個明智的選擇,以確保系統的穩定性和數據的安全性。

請注意,處理這類問題時,最好由有經驗的系統管理員或技術支持人員來執行,以避免因操作不當而導致的數據丟失或硬件損壞。同時,定期備份重要數據也是防範數據丟失風險的重要措施之一。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章