網絡運維常見交換機故障

   現在交換機已經普及到了各辦公場所,商場,學校,醫院等等幾乎所有的需求上網的地方,各大交換機廠商也加大了研發速度,使得現今的設備在性能上更加優越,價格更加合理,也促使了交換機的普及速度。

交換機房

  但同時大大增加了網絡運維人員的工作難度,常常遇到各種不同品牌的不同型號的交換機,那麼故障情況也各不相同,如何正確快速的找出故障並處理好呢?筆者彙總了一下常見的設備問題供大家參考一下。

  交換機故障一般可以分爲硬件故障和軟件故障兩大類。

一、交換機的硬件故障

  硬件故障重要指交換機電源、背板、模塊、端口等部件的故障,可以分爲以下幾類。

  1. 電源故障

  由於外部供電不穩定,或者電源線路老化或者雷擊等原因導致電源毀壞或者風扇停滯,從而不能正常工作。由於電源緣故而導致機內其他部件毀壞的事情也經常產生。

  如果面板上的POWER指點燈是綠色的,就表示是正常的;如果該指點燈滅了,則解釋交換機沒有正常供電。這類問題很容易發現,也很容易解決,同時也是最容易預防的。

  針對這類故障,首先應該做好外部電源的供應工作,一般通過引入獨立的電力線來供應獨立的電源,並添加穩壓器來避免瞬間高壓或低壓現象。

  如果條件允許,可以添加UPS(不間斷電源)來保證交換機的正常供電,有的UPS供應穩壓功效,而有的沒有,選擇時要注意。在機房內設置專業的避雷方法,來避免雷電對交換機的傷害。現在有很多做避雷工程的專業公司,履行網絡佈線時可以斟酌。

  2. 端口故障

  這是最常見的硬件故障,無論是光纖端口還是雙絞線的RJ-45端口,在插拔接頭時必定要當心。如果不當心把光纖插頭弄髒,可能導致光纖端口污染而不能正常通訊。我們經常看到很多人喜歡帶電插拔接頭,理論上講是可以的,但是這樣也無意中增加了端口的故障產生率。

  此外,在搬運時不當心,也可能導致端口物理毀壞。如果購置的水晶頭尺寸偏大,插入交換機時,也容易毀壞端口。如果接在端口上的雙絞線有一段暴露在室外,萬一這根電纜被雷電擊中,就會導致所連交換機端口被擊壞,或者造成更加不可預見的損傷。

  一般情況下,端口故障是某一個或者幾個端口毀壞。所以,在消除了端口所連計算機的故障後,可以通過更換所連端口,來斷定其是否毀壞。遇到此類故障,可以在電源關閉後,用酒精棉球清洗端口。如果端口確鑿被毀壞,那就只能更換端口了。

  3. 模塊故障

  交換機是由很多模塊組成,比如:堆疊模塊、管理模塊(也叫掌握模塊)、擴張模塊等。這些模塊產生故障的機率很小,不過一旦涌現問題,就會蒙受偉大的經濟喪失。如果插拔模塊時不當心,或者搬運交換機時受到碰撞,或者電源不穩定等情況,都可能導致此類故障的產生。

  當然上面提到的這3個模塊都有外部接口,比擬容易辨認,有的還可以通過模塊上的指點燈來分辨故障。比如:堆疊模塊上有一個扁平的梯形端口,或者有的交換機上是一個相似於USB的接口。

  管理模塊上有一個CONSOLE口,用於和網管計算機建立銜接,便利管理。如果擴張模塊是光纖銜接的話,會有一對光纖接口。

  在消除此類故障時,首先確保交換機及模塊的電源正常供應,然後檢討各個模塊是否插在正確的位置上,最後檢討銜接模塊的線纜是否正常。在銜接受理模塊時,還要斟酌它是否採納規定的銜接速率,是否有奇偶校驗,是否有數據流掌握等因素。

  銜接擴張模塊時,須要檢討是否匹配通訊模式,比如:運用全雙工模式還是半雙工模式。當然如果確認模塊有故障,解決的方法只有一個,那就是該當立即聯繫供應商給以更換。

  4. 背板故障

  交換機的各個模塊都是接插在背板上的。如果環境潮溼,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會造成電路板不能正常工作。比如:散熱性能不好或環境溫度太高導致機內溫度升高,指使元器件燒壞。

  在外部電源正常供電的情況下,如果交換機的各個內部模塊都不能正常工作,那就可能是背板壞了,遇到這種情況即使是電器維修工程師,恐怕也無計可施,惟一的方法就是更換背板了。

  5. 線纜故障

  其實這類故障從理論上講,不屬於交換機本身的故障,但在實際運用中,電纜故障經常導致交換機系統或端口不能正常工作,所以這裏也把這類故障歸入交換機硬件故障。比如接頭接插不緊,線纜製作時次序排列毛病或者不規範,線纜銜接時應該用交叉線卻運用了直連線,光纜中的兩根光纖交錯銜接,毛病的線路銜接導致網絡環路等。

  從上面的幾種硬件故障來看,機房環境不佳極易導致各種硬件故障,所以我們在建設機房時,必須先做好防雷接地及供電電源、室內溫度、室內溼度、防電磁干擾、防靜電等環境的建設,爲網絡設備的正常工作供應良好的環境。

二、交換機的軟件故障

  交換機的軟件故障是指系統及其配置上的故障,它可以分爲以下幾類。

  1. 系統毛病

  交換機系統是硬件和軟件的聯合體。在交換機內部有一個可刷新的只讀存儲器,它保存的是這臺交換機所必須的軟件系統。這類毛病也和我們常見的Windows、Linux一樣,由於當時設計的原因,存在一些漏洞,在條件適宜時,會導致交換機滿載、丟包、錯包等情況的產生。所以交換機系統供應了諸如Web、TFTP等方法來下載並更新系統。當然在升級系統時,也有可能產生毛病。

  對於此類問題,我們須要養成經常閱讀設備廠商網站的習性,如果有新的系統推出或者新的補丁,請及時更新。

  2. 配置不當

  初學者對交換機不熟悉,或者由於各種交換機配置不一樣,管理員往往在配置交換機時會涌現配置毛病。比如VLAN 劃分不正確導致網絡不通,端口被毛病地關閉,交換機和網卡的模式配置不匹配等原因。

  這類故障有時很難發現,須要必定的經驗積累。如果不能確保用戶的配置有問題,請先恢復出廠默認配置,然後再一步一步地配置。最好在配置之前,先閱讀解釋書,這也是網管所要養成的習性之一。

  每臺交換機都有詳細的安裝手冊、用戶手冊,深入到每類模塊都有詳細的講授。由於很多交換機的手冊是用英文編寫的,所以英文不好的用戶可以向供應商的工程師諮詢後再做具體配置。

  3. 密碼喪失

  這可能是每個管理員都曾經閱歷過的。一旦忘懷密碼,都可以通過必定的操作步驟來恢復或者重置系統密碼。有的則比擬簡略,在交換機上按下一個按鈕就可以了。而有的則須要通過必定的操作步驟能力解決。

  此類情況一般在人爲遺忘或者交換機產生故障後導致數據喪失,纔會產生。

  4. 外部因素

  由於病毒或者******等情況的存在,有可能某臺主機向所銜接的端口發送大宗不符合封裝規矩的數據包,造成交換機處理器過甚繁忙,致使數據包來不及轉發,進而導致緩衝區溢出產生丟包現象。

  還有一種情況就是廣播風暴,它不僅會佔用大宗的網絡帶寬,而且還將佔用大宗的CPU處理時間。網絡如果長時間被大宗廣播數據包所佔用,正常的點對通訊就無法正常進行,網絡速度就會變慢或者癱瘓。

  一塊網卡或者一個端口產生故障,都有可能引發廣播風暴。由於交換機只能分割衝突域,而不能分割廣播域(在沒有劃分VLAN 的情況下),所以當廣播包的數量佔到通訊總量的30%時,網絡的傳輸效力就會顯明降落。

三、總結

  總的來說軟件故障應該比硬件故障較難查找,解決問題時,可能不須要破費過多的金錢,而須要較多的時間。

  最好在平時的工作中養成記載日誌的習性。每當產生故障時,及時做好故障現象記載、故障剖析過程、故障解決規劃、故障歸類總結等工作,以積累自己的經驗。

  比如有時在進行配置時,由於種種原因,當時沒有對網絡產生影響或者沒有發現問題,但也許幾天以後問題就會逐漸呈現出來。如果有日誌記載,就可以聯想到是否前幾天的配置有毛病。

  由於很多時候都會疏忽這一點,覺得是在其他方面涌現問題,當走了許多彎路之後,才找到問題所在。所以說記載日誌及保護信息是非常必要的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章