我所處的環境就是總部,有兩條線路可以上網而且互爲備份。我的微信突然提示我不能聯網了,當時嚇的我一激靈,難不成斷網了。
然後我打開電腦,已經打不開網頁了,PING一個公網的域名,我去,也訪問不了了。然後就是一堆人過來問爲是不是斷網了,這些信息的反饋是整個公司掛掉了。
當時,我的腦海中想想到了很多種可能,我連的無線WLC死掉了,與WLC連接的交換機死掉了,DNS服務器死掉了,路由器死掉了,火牆死掉了,線路壞了。在這N多種可能的條件下,如果你要排錯,都會讓你忙死。
幸虧我有SolarWinds監控系統,第一時間登錄,看到了火牆的外部接口死掉了。雖然我們設置了一條浮動路由,如果監控到火牆掛掉,會自動走另一條線路,居然沒有起作用,關鍵時掉鏈子,我內心中默唸了N多遍(省略吧)
立即衝進機房,把火牆重啓了,問題就解決了。
經驗總結:問題發生,一定要有監控工具,否則排錯太痛苦。再好的設計也有不工作的時候,關鍵還是靠重啓呀。