close_wait連接 配錯

最近web服務器在大流量情況下經常出現假死現象,後臺log報 too many open files 的錯誤,加大linux系統的文件打開數是可以解決部分問題,但是時間長了同樣出問題,通過查詢網絡連接發現是tcp連接不關閉造成的。如下:

  netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

  

  LAST_ACK 1

  SYN_RECV 15

  CLOSE_WAIT 7729 

  ESTABLISHED 471

  FIN_WAIT1 3

  FIN_WAIT2 52

  SYN_SENT 1

  TIME_WAIT 725 


  從結果可以看到有大量的連接處於CLOSE_WAIT狀態。 



要解決這個問題的可以修改系統的參數,系統默認超時時間的是7200秒,也就是2小時。 


默認如下: 


tcp_keepalive_time = 7200 seconds (2 hours)

tcp_keepalive_probes = 9

tcp_keepalive_intvl = 75 seconds 





意思是如果某個TCP連接在idle 2個小時後,內核才發起probe.如果probe 9次(每次75秒)不成功,內核才徹底放棄,認爲該連接已失效 





修改後 





sysctl -w net.ipv4.tcp_keepalive_time=30

sysctl -w net.ipv4.tcp_keepalive_probes=2

sysctl -w net.ipv4.tcp_keepalive_intvl=2 



經過這個修改後,服務器會在短時間裏回收沒有關閉的tcp連接


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章