帶薪網絡工程日記——銀行斷網記項目

互聯網企業網斷了,這是最嚴重的網絡問題,也是最糟心的事情。

特別是對於那些24小時都不能斷網的銀行客戶,如果銀行網絡癱瘓,引起大客戶資金虧損或者直接客戶電話投訴,老闆會瘋掉的!怎麼快速確定問題,怎麼處理好現場,怎麼樣幫助你的客戶以最快的速度和最有效的方法解決故障,是一名合格的網絡工程師要注意的事情。

帶薪網絡工程日記——銀行斷網記項目

西安今天非常熱,溫度異常高,竟然接近29度,能把我熱暈到馬路牙子上,好我的老天爺呀。

晚上9點左右,突然接到招行的技術部門的人給我電話“喂,老許,不好了,我們所有的無線網絡全部都上不去網了” 接到客戶這樣的反饋。

我通常不太着急,因爲我知道他每次都是這樣,總說整個網絡全部癱瘓,其實一般也就是幾個無線接入信號不好。

我懶洋洋的就接着反問道:“是無線搜索不到信號呢? 還是無線網絡能搜索到信號,但是上不了網呢” 

“是能連上,但是所有的電腦下面都是一個小歎號”  他回答道

我說甭着急,讓我看看我馬上給您回電話。

順手拿起手機,連接客戶的網關路由器的web頁面,同事使用SSL VPN登陸看看發生了什麼問題。。。

但是。。。

R。。。

連不上了!!!

不好

互聯網的出口難道被人動了?

我馬上撥招行人的手機

“程工,是不是機房有人進去了?”

“是不是核心路由器或者交換機斷電了”

“你們的服務器是不是有人碰過?”

“你確定機房有沒有人進去過?”

“你看看機櫃,你確定核心路由器,核心交換機,打標籤的設備的燈是亮的?”

“你確定能聽到風扇聲音,看到燈飾閃爍的嗎?”

 一頓騷操作,之後,程工拿着手機進到了機房中,給我的反饋是機房確實是沒有人進來過,也沒有人動過什麼設備,也沒有斷電,一切都ok啊。

“我CA”

“我崩潰啦,因爲我不想安排人去客戶現場了,但是現在的情況,想想不對,這情況怎麼可能會發生,網關的出口我在手機上都ping不通,web頁面也連接不上”

“斷電?”

“有人配置了shutdown?”

還是有人拔了網線?

 。。。。。。。。。。。。。。。

我馬上給趙打電話

“你離招商客戶的某個服務點有多遠?”

趙回:“我不知道”

“你在哪裏”

“我就在小寨”

“O了,把位置發我微信,我叫滴滴接你到現場,出事了,客戶的網絡全斷了,你到現場看看”。。。 

趙是西安工業大學大四沒有畢業,7月份馬上畢業,學的專業通信工程,也算計算機相關專業,工作已經簽了,某數字廠商,在學校期間學過好像也用過GNS之類的項目,也跟着老徐去咸陽搞了幾回項目,才從項目上下來。想着他應該可以搞定的。 不過我對於他現場處理問題的能力還不知道,微信上專門給他叮囑道,“有什麼問題隨時給王SIR或者趙老師電話,他們給你做遠程技術支持”。這個事情算告一段落。

過了半個多小時左右,銀行那邊打了兩三個電話,問還沒有到現場,說這問題比較着急,客戶現場200多人上網都出問題,不着急纔怪!

我看了一下表,9:40左右了

我給老趙打電話,“到了沒有”

“到了,剛到”

我說“那你就看看現場有什麼問題,網絡是怎麼回事,有問題電話我或者王sir”

但是還是不放心,微信上給趙發幾句語音,抓緊解決,看看什麼問題。

 

銀行的網絡拓撲我完整的還原在了實驗室,就一個生產VLAN還有一個客戶VLAN,一個出口銳捷交換機,幾個核心交換機,40幾個無線AP,4個Poe交換機,還有十幾個華爲的接入層交換機就完事。 

所以招行的這個問題,我估計電信是不是出了問題,只要趙到了現場電腦上敲上幾條命令不就解決了

。。。。。。。。。。。。。。

半個小時又過去了,趙那邊還是沒有反饋,我估計掛在客戶現場了,我實在坐不住了,趕緊打電話過去:“現在什麼情況”

“他們這裏有一個接口是down的”

“哪個接口?” 我心想,難道網關被入侵了?

“好像是g0/2 ”

“你確定是g0/2” ,我正在喫飯,手裏沒有拓撲,g0/2是怎麼來頭,想了想,我在問他 “現在你看網關的出口和內網接口是多少,這兩個接口有沒有好着”

“。。。。。” 他有很長時間沒有回答我

“你看路由器上的外網口是多少,這個幾口有沒有shutdown掉”

“沒有,這個幾口是up的,正常”

“好的,那你現在ping一下外網,通不通”

“不通”

“恩,你ping的什麼地址?”

“我ping百度ping不通”

我心想,如果在路由器上,沒有配置dns解析,ping百度域名不通也正常,我接着問“你ping 百度的網址,還是IP”

“我ping的ip”

“你怎麼知道百度的IP地址的?”

“就是咱們平時用的8.8.8.8啊”

“。。。。 。。。。” 完蛋了,這傢伙和我不在一個頻率上,我給他說“你ping 一下路由器的網關,看通不通”

15s之後他給我說“是xxx.xxx.xxx.42嗎”

“不是,是路由器的網關,路由器有一個默認網關到電信局,電信局的網關,不是客戶內部的網關,用show ip route 看有一個0.0.0.0 0.0.0.0 指到電信的網關的地址,你ping一下”

“是不是這個xxx.xxx.xx.141””

“對,就是這個地址,ping一下通不通”

“還是不通”

“OK,有沒有arp地址”

“有”

“你確定?你確定你看到了?你確定你看到了對方的arp地址,但是你還是ping不通,怎麼可能?!”

趙幾句話,我決定了,立馬和夥計結束喫飯,立即打車到客戶現場,根據趙給我的反饋,我100%確定不是客戶網絡的問題,一定是電信局的問題,上車的時候10000號我進行了保修,大客戶專線,10000號承諾馬上檢查給我回復。趙的問題是,總讓我有一些擔心,我給趙發信息,怕他在客戶面前放出消息,所以專門打字說“你確定網關的g0/0接口的燈是亮的,是網口還是光口?你確定鏈接的沿路的線纜都是亮燈的,你確定嗎?”

突然電話來了

招行客戶的經理來電了

“我們的網絡出什麼問題了?”

“正在排查,我們的人員已經到現場了,現在基本上確定是電信出了問題,咱們現場的設備都沒有任何問題”

“不對,我們的行政說電腦都可以上網,全部的無線不行啊”

“不可能的,現在咱們的環境是總出口的問題,所有的人都不能上網,網絡到電信局的線路出了問題”

“線路怎麼會出問題,我們的行政明明還在上網,你現在打電話問我們的人”

對方的口氣卻來卻不好聽了

算了,我都習慣了

我也不說什麼了,你說什麼就什麼,先解決問題,爭吵沒用

現場技術問題,如果你沒有鐵證是哪裏出了問題,客戶自然認爲是你的問題

所以我剛給趙反覆了4,5次重複讓他把現場的照相,還有重要的那幾條排錯命令照相,這都是現場的證據,也是解決網絡故障的重要信息,排錯的時候非常關鍵。

當我到樓下的時候,趙給我電話,帶來了喜報---------電信局承認是光纖出了問題,馬上派人解決,到底什麼時候搞定,那我就建議客戶直接去和電信寫上了

同時趙說,在機櫃的背面,光纖的盒子有一個燈是紅顏色的。我馬上給趙說:你現在立即把所有的現場設備,檢查的命令,還有出故障的地方,拍照!拍照!拍照!一定要拍照!

這不就是現場的情況,哪裏出問題了,給客戶還有電信直接一看,還有什麼好爭論的!

反覆給趙微信說了不下5次,到了客戶現場,檢查客戶的總出口一直到甩進來的線纜有沒有問題,你確定到底有沒有問題,問了幾次,知道電信承認有問題才知道,其實到客戶現場,5秒鐘線路排查一下,告警等有問題,直接就知道故障在哪裏了

工作中,你的技術爲你的崗位表現非常重要,但是在客戶現場你的處理事情的流程,現場處理壓力,還有你對技術的排錯方法,客戶的溝通,所有的綜合在一起決定你的工資高低!!! 

客戶說什麼情況,從來不覈實,不知道真實情況,客戶說wifi通着,就認爲wifi通着,你記住,你是技術工程師,你的責任是解決客戶的技術問題,一定要動手確定看到技術問題是發生在什麼情況下,自己肉眼看到爲準!

平時在辦公室天天學習的命令不超過10行,但是到了現場不知道怎麼應用,也就是還沒有融會貫通

實驗室我連巡檢表都準備好了,也安排過到客戶現場做過巡檢,但是竟然還沒有巡檢表,巡檢表上用什麼命令,怎麼排錯,怎麼解決故障,一概沒有用,一切提前準備好,千萬不要到現場了說“我不知道,我沒準備“,客戶都會鄙視你的

當然,趙雖然還沒有畢業剛剛入行,白紙一張,到了現場,兩眼發黑,不知道要做什麼,但是之前到過客戶現場,應該還是沒有好好在現場做巡檢,不然也不會像今天這樣的表現,要是這樣的項目什麼都沒有學習到,我估計薪資想搞到哪去都難?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章