常見服務器故障處理方法

一、造成服務器無法啓動的主要原因 :
  市電或電源線故障(斷電或接觸不良)
  電源或電源模組故障
  內存故障(一般伴有報警聲)
  CPU故障(一般也會有報警聲)
  主板故障
  其它插卡造成中斷衝突
二、服務器無法啓動 ?
  檢查電源線和各種I/O接線是否連接正常。
  檢查連接電源線後主板是否加電。
  將服務器設爲最小配置(只接單顆cpu,最少的內存,只連接顯示器和鍵盤)直接短接主板開關跳線,看看是否能夠啓動。
  檢查電源,將所有的電源接口拔下,將電源的主板供電口的綠線和黑線短接,看看電源是否啓動。
  如果判斷電源正常,則需要用替換法來排除故障,替換法是在最小化配置下先由最容易替換的配件開始替換(內存、cpu、主板)
三、系統頻繁重啓 ?
  造成系統頻繁重啓的原因:
  電源故障(替換法判斷解決)
  內存故障(可從BIOS錯誤報告中查出)
  網絡端口數據流量過大(工作壓力過大)
  軟件故障(更新或重裝操作系統解決)
四、服務器死機故障判斷處理:
  服務器死機故障比較難以判斷,一般分爲軟件和硬件兩個方面:
  軟件故障
  硬件故障
  軟件故障
  首先檢查操作系統的系統日誌,可以通過系統日誌來判斷部分造成死機的原因。
  電腦病毒的原因。
  系統軟件的bug或漏洞造成的死機,這種故障需要在判斷硬件無故障後做出,而且需要軟件提供商提供幫助。
  軟件使用不當或系統工作壓力過大,可以請客戶適當降低服務器的工作壓力來看看是否能夠解決
   硬件故障
  硬件衝突
  電源故障或電源供電不足,可以通過對比計算服務器電源所有的負載功率的值來作出判斷。
  硬盤故障(通過掃描硬盤表面來檢查是否有壞道)
  內存故障(可以通過主板BIOS中的錯誤報告和操作系統的報錯信息來判斷)
  主板故障(使用替換法來判斷)
  CPU故障(使用替換法)
  板卡故障(一般是SCSI/RAID卡或其他pci設備也有可能造成系統死機,可用替換法判斷處理)
  注意:系統死機故障需要在處理完後需要在一段時間內進行一定壓力的拷機測試來盡一步檢查故障是否徹底解決。
五、安裝操作系統時提示找不到硬盤?
  故障原因:
  無物理硬盤設備
  硬盤線纜連接問題
  沒有安裝硬盤控制器驅動或驅動不相符
六、如何獲得驅動程序?
  使用隨機光盤製作相應驅動
七、爲什麼用正確的驅動仍然無法加載硬盤控制器驅動?
     查看是否啓用了hostraid功能。
八、新購買的一塊硬盤,安裝到機器上之後,機器自檢無法通過?
  將新的硬盤取下,機器是否可以自檢通過;
  檢查新增加的硬盤的ID號是否與原來的硬盤的ID號相同,如果硬盤的ID號相同的話,自檢將無法通過。
九、如何格式化SCSI硬盤?
  有操作系統的情況:使用磁盤管理工具格式化;
  無操作系統的情況:在SCSI管理控制界面格式化;
  以ADAPTEC Raid卡爲例:開機-出現CTRL+A 信息時,按CTRL+A進 入-選中通道A
  -選中SCSI UTILITY-將檢測到硬盤-選中要檢測的硬盤
  -選中FORMAT可對硬盤進行全面格式化
  選中VERIFY可對硬盤進行檢測,檢查是否有壞道
  注意:在格式化硬盤時不能中斷或停電,不然會損壞磁盤

十、在Aisino 系列中有RAID卡機器,當其中一個硬盤不能正常工作RAID報警,但系統能正常運行,怎麼辦?
  用一個新硬盤,確保容量大於或等於不能正常工作的硬盤,最好用相同型號的硬盤替換即可。
 RAID卡相關常見故障
  第一類: RAID卡本身有問題
  經常表現爲RAID信息丟失,硬盤經常掉線,不能做REBUILD,開機自檢時檢測不到硬盤或時間長。
  典型故障A:
  作完RAID1,安裝操作系統,一切正常,但第二次重啓系統時,發出報警聲,經檢查發現一塊硬盤掉線,REBUILD後,又恢復正常,但重啓後又掉線。懷疑爲硬盤故障,校驗硬盤後均無問題。最後更換RAID卡,故障解決。
  典型故障B:
  機器經常死機,且有時候啓動速度非常慢。觀察系統日誌,發現在系統啓動時有這樣一個錯誤提示:設備/devices/scsi/port0 在傳輸等待的時間內沒有響應。更換RAID卡後,恢復正常。
  第二類: 硬盤本身問題
  表現爲硬盤掉線,在RAID陣列中的狀態爲DEAD,或者在作REBUILD時,作到某一進度就不能繼續
  典型故障:
  硬盤掉線後,做REBUILD時,作到20%時出現錯誤提示無法繼續進行。在確認掉線硬盤,硬盤盒及SCSI電纜都能正常工作後,對在線硬盤進行校驗,發現有壞道,修復硬盤,重做REBUILD,恢復正常。
  第三類: 硬盤盒或模組的接觸問題
  此類問題經常表現爲RAID卡根本檢測不到硬盤,此類問題比較簡單,但在處理硬盤盒相關機器時,需要注意一些問題。
  典型故障:
  RIAD卡中檢測不到硬盤,把SCSI電纜接到主板的ULTRA160接口上,故障依舊,拔出硬盤盒(不包括硬盤盒後面的托架)更換,故障依舊,更換硬盤,還是不行。最後卸下硬盤盒後面的托架(非熱插拔部分),發現後托架上80PIN接口上的一根針彎曲,校直彎針,恢復正常。
十一、在服務器上使用的SCSI硬盤,爲什麼硬盤的ID號不能設置爲7?
  SCSI控制器中,默認將ID=7設置爲硬盤控制器佔,所以硬盤的ID號不能設置爲7
十二、爲什麼開機自檢無法通過?
  解決方法:
  機器切斷電源,將機箱打開,用“COMS CLEAR”跳線的跳線帽將“COMS CLEAR”跳線的另外兩個針短接(跳線參看主板說明書)
  機器加電,自檢,等機器自檢完閉,報CMOS已被清除,然後將機器電源關掉,把跳線復原即可
  機器重新開機
十三、物理內存插槽報錯
  解決方法:
  開機-按F2進入“SETUP”-“ADVANCED”--“MEMORY CONFIGURATION” 回車-“CLEAR DIMM ERRORS” 直接回車
十四、爲什麼處理器報錯或自檢過程中只找到一個處理器?
  解決方法:
  開機--〉按F2鍵,進入"SETUP"
  1、依次"MAIN" --〉"PROCESSOR" --〉"CLEAR PROCESSOR ERRORS [ ]" :將此選項值設置爲"YES" ;
  2、依次"ADVANCED " --〉"RESET CONFIGURATION DATA [ ] ":將此選項的值設置爲" YES" ;
  3、依次"SERVER " --〉"PROCESSOR RESET [ ] ":將此選項的值設置爲" YES" ;
  4、依次"SERVER " --〉"SYSTEM MANAGEMENT ":回車 --〉 "CLEAR EVENTLOG [ ] " :將此選項   的值設置爲" YES"
  5、按F10,保存退出
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章