網絡癱瘓分析處理(午飯的一個例子)

拓撲圖:

全部上不了網,排除接入層交換機或者某個VLAN的問題,要從核心開始查

1:用筆記本核心層網關
2:再往上ping核心層和深信服相連的接口,不通
果斷把深信服重啓,再ping,通了,5分鐘後,又掛了,沒辦法,只好先把深信服設備給停掉
直接把核心層的線插到PIX的內網口(甩掉)
3:PING  PIX的內網口,不通,再ping ,丟包
先把深信服放到一邊,不用這個設備,檢查PIX
丟包~~~~~~~~第一反應就是查看CPU,結果一看97%,98%,肯定不正常
眼觀:核心交換和PIX相連的燈閃爍太快,和平時不一樣
把PIX和核心相連的網線給拔掉,再查看CPU,7%,正常
確定問題出在內網裏,(核心交換到內網)
在覈心層做端口映射(把核心交換和PIX相連的這個端口映射到一個平時不用的端口上面,注意要把PIX和核心的網線要連接上,不然沒數據包),用sniffer抓包,打開sniffer,把映射端口的網線插到筆記本上,短短几秒,筆記本竟然CPU100%, 操作sniffer查看,其中一個VLAN裏的一臺服務器向外發送大量連接,拔掉這臺服務器的網線,1分鐘後,PIX  cpu正常,處於7%左右。 

其他方法:

打開交換機和路由器的SNMP功能。用solarwinds,實時可以定位出哪個端口流量大!裝個監控,類似cacti可以監看流量,容易發現異常流量。solarwinds工具可以監控cpu和內存的使用情況。 

如果是連接數多,pix上直接sh conn可以查到問題ip

不是掛了,是流量過大,擁塞了網絡。SNMP一般是五分鐘輪詢一次。
solawinds看實時流量還是可以的。防火牆上開啓syslog日誌,實時查看日誌!

 總結:逐段判斷是那段出了問題,查看網絡設備的實時運行狀態,用特定監控軟件來查詢。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章