服務器更換硬盤之後一定要檢查是否同步

前言

近期再給一個用戶更換服務器硬盤時發現,一是RAID配置錯誤,使用300GB的硬盤給600GB的磁盤做熱備,另外是更換的硬盤型號不對導致數據沒有同步。新近入職的管理員如果接手的有舊的服務器,有時間應重點檢查一下硬盤及RAID信息,看是否有離線的硬盤或配置不合適的地方好及時糾正。

正文

今年4月上旬,有個單位的2臺服務器硬盤壞了3塊硬盤,客戶讓送3塊600GB的硬盤並幫着給換一下。到了現場我看到了這兩臺服務器,其中一臺服務器有2個硬盤亮黃燈(如圖1所示),另一臺服務器有1個硬盤亮黃燈(如圖2所示)。

image

圖1 2塊硬盤亮黃燈

image

圖2 1塊硬盤亮黃燈

仔細一看,這兩臺服務器,每臺都配置了1塊300GB硬盤、3塊600GB硬盤。當時比較奇怪怎麼有這種配置,難道這塊300GB的用來裝系統、另3塊600GB的做RAID-5存數據?

當時我和客戶說,圖1中這種壞了2塊硬盤的可能需要做數據恢復了,因爲3塊硬盤的RAID-5中同時壞2塊,此時換盤是不行了。當時這臺服務器已經不能啓動了(圖2中的服務器還在使用,能進入系統)。

圖1中壞2塊硬盤的服務器,打開電源進入RAID界面,看到01、02槽位的硬盤爲Failed狀態,如圖3所示。

image

圖3 兩塊硬盤失敗

按Ctrl + N組合鍵進入PD Mgmt之後整個人就有點暈了,槽位0的300GB硬盤竟然配置成了熱備磁盤!如圖4所示。

image

圖4 300GB的硬盤被配置成了全局熱備

客戶說這臺服務器已經使用多年,原來也壞過(一塊)硬盤,換了之後就繼續使用了。這次是系統不能用了才發現壞了兩塊硬盤的,以爲換上就能繼續使用了。當時這臺服務器買的時候是1塊300GB的硬盤,財務軟件公司的人說一塊硬盤不安全,又買了3塊600GB的硬盤做的RAID-5,是軟件公司的人給配置的。估計當時這個軟件公司的人也不是很懂硬件,就這樣配置上了。

另外一臺服務器只壞了一塊硬盤,換上硬盤之後數據開始同步。因爲看到的第1臺服務器RAID配置不合適,我重新啓動服務器進入RAID卡配置模塊,果然這塊300GB的硬盤也被配置成了熱備磁盤,如圖5所示。同時新換上的硬盤已經開始重組數據。

image

圖5 數據同步與熱備磁盤配置

這是這臺服務器更換硬盤後的相片,如圖6所示。

image

圖6 第2臺服務器更換硬盤之後

這時客戶說,還有一臺服務器,年前換了一塊硬盤,這次來了順便幫着給檢查一下,這一檢查就又發現新的問題了。

第三臺服務器也是3650 M5,在另一個機房,槽位3的硬盤是年前換的,這個機房明顯環境好一些,服務器硬盤上的灰塵也少一些,如圖7所示。

image

圖7 槽位3的硬盤是年前換上的

重新啓動進入RAID卡,300GB的硬盤還是配成了熱備磁盤,又是熟悉的配方、熟悉的味道。但是,槽位3的硬盤是Unconfigured Good,這塊硬盤沒有同步,如圖8所示。

image

圖8 硬盤沒有同步

仔細看圖7,發現新換上的硬盤托架上的序號和原來的托架序號不同(圖6中新換上的序號和原來的相同)。好在還有2塊新買的硬盤暫時沒有用上,取下年前購買的硬盤,換上這次帶來的硬盤,此時硬盤開始重組數據,此時新換上的硬盤黃燈、綠燈交替閃爍,如圖9所示。

image

圖9 硬盤數據開始同步

在RAID界面中數據開始重組,如圖10所示。

image

圖10 數據重組

一個多小時之後數據重組完成,硬盤綠燈閃爍,此時這臺服務器檢查完成,如圖11所示。

後期建議,如果客戶需要熱備磁盤,應該是每臺取下原來300GB的硬盤,添加一塊600GB的硬盤並重新配置成熱備磁盤。

image

圖11 硬盤狀態正常

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章