活久見的設備連接故障

一大早,用戶打電話說某部門的服務器到天平的連接存在問題,有時可以telnet到8014端口,有時無法telnet。另外現場人員把所有天平都接到一臺8port交換機上進行測試,發現此時電腦可以telnet到每一臺的天平的8014端口,可是一旦接入到網絡中,故障現象又再次出現。爲什麼?

到達用戶現場,把電腦接入到網絡中,PING每一臺天平設備,發現設備都是可以PING通的,但是telnet的時候發現,有的天平可以成功telnet,有的無法登錄。把所有天平都接到8port交換機,然後與網絡斷開,再次測試,的確與客戶說的相同。

檢查接入交換機與匯聚交換機的連接接口以及匯聚交換機與核心交換機的連接接口,都沒有發現明顯的異常。檢查接入交換機、匯聚交換機的CPU、內存使用也沒有發現什麼異常。把能檢查的都檢查了一遍,仍然沒有發現問題。

沒有辦法只能抓包看看,希望能有所發現。在抓包的同時,用另一臺電腦對所有天平發起telnet測試,發現如下問題:

tianping1.jpg

TCP Retransmission,TCP重傳?爲什麼爲出現TCP重傳?只是一臺天平,難道還處理不過來?

再次檢查連接該天平的交換機接口

SDYC-WYLZ#sh int f0/34
FastEthernet0/34 is up, line protocol is up (connected)
  Hardware is Fast Ethernet, address is 001b.0cec.86a2 (bia 001b.0cec.86a2)
  MTU 1500 bytes, BW 100000 Kbit, DLY 100 usec,
     reliability 255/255, txload 1/255, rxload 1/255
  Encapsulation ARPA, loopback not set
  Keepalive set (10 sec)
  Half-duplex, 100Mb/s, media type is 10/100BaseTX
  input flow-control is off, output flow-control is unsupported
  ARP type: ARPA, ARP Timeout 04:00:00
  Last input never, output 00:00:01, output hang never
  Last clearing of "show interface" counters never
  Input queue: 0/75/0/0 (size/max/drops/flushes); Total output drops: 0
  Queueing strategy: fifo
  Output queue: 0/40 (size/max)
  5 minute input rate 0 bits/sec, 0 packets/sec
  5 minute output rate 1000 bits/sec, 1 packets/sec
     5380147 packets input, 374284585 bytes, 0 no buffer
     Received 23 broadcasts (0 multicasts)
     0 runts, 0 giants, 0 throttles
     0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored
     0 watchdog, 0 multicast, 0 pause input
     0 input packets with dribble condition detected
     12089172 packets output, 901723451 bytes, 0 underruns
     0 output errors, 40 collisions, 1 interface resets
     0 babbles, 0 late collision, 0 deferred
     0 lost carrier, 0 no carrier, 0 PAUSE output
     0 output buffer failures, 0 output buffers swapped out

通過檢查發現該接口工作在半雙工模式下,再查看其它天平,發現其它天平的連接接口也工作在半雙工模式下。走到這裏,似乎發現了問題。

分析:

在半雙工模式下,信息既可由A傳到B,也能由B傳A,但同一時刻只能有一個方向進行數據傳輸。當天秤A向終端B發送數據時,終端C是無法telnet到天秤A的。之前把天秤的網線都接到小交換機上單獨進行測試,那種情況下天秤不會向其它天秤或是測試電腦進行主動的數據傳輸,所以當測試電腦對五臺天秤設備進行telnet測試時,都可以測試通過。而當把小交換機同接入交換機或是匯聚交換機進行連接後,網絡中的其它IP再次同天秤進行通信,這時再次telnet,就會出現有的可以telnet上,有的telnet不上的情況。

後來把匯聚交換機上關天平的VLAN刪除再次進行了測試,發現在接入交換機上都可以直接telnet到所有的天平,再次恢復這個VLAN,同時抓包,發現此時有其它IP同天平進行通信,再次測試就會發現有的天平無法telnet成功。

走到這裏,已經找了問題。

不過我唯一不解的是都現在了,爲什麼天平的上網卡還是半雙工的,難道跟天平的工作原理有關,需要半雙工?這個就不得而知了。

半雙工的故障,還真是活久見了!




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章