Nginx服務器出現502錯誤的原因和解決辦法總結

Nginx服務器出現502錯誤的原因和解決辦法總結

整理的一些Nginx 502錯誤的排查方法,供大家參考:

Nginx 502的觸發條件

502錯誤最通常的出現情況就是後端主機當機。在upstream配置裏有這麼一項配置:proxy_next_upstream,這個配置指定了nginx在從一個後端主機取數據遇到何種錯誤時會轉到下一個後端主機,裏頭寫上的就是會出現502的所有情況拉,默認是error timeout。error就是當機、斷線之類的,timeout就是讀取堵塞超時,比較容易理解。我一般是全寫上的:

proxy_next_upstream error timeout invalid_header http_500 http_503;

不過現在可能我要去掉http_500這一項了,http_500指定後端返回500錯誤時會轉一個主機,後端的jsp出錯的話,本來會打印一堆stacktrace的錯誤信息,現在被502取代了。

503錯誤就可以保留,因爲後端通常是apache resin,如果apache死機就是error,但resin死機,僅僅是503,所以還是有必要保留的。

解決辦法

遇到502問題,可以優先考慮按照以下兩個步驟去解決。

1、查看當前的PHP FastCGI進程數是否夠用

netstat -anpo | grep "php-cgi"| wc -l

如果實際使用的“FastCGI進程數”接近預設的“FastCGI進程數”,那麼,說明“FastCGI進程數”不夠用,需要增大。

2、部分PHP程序的執行時間超過了Nginx的等待時間

可以適當增加nginx.conf配置文件中FastCGI的timeout時間,例如:

......

http

{

......

fastcgi_connect_timeout 300;

fastcgi_send_timeout 300;

fastcgi_read_timeout 300;

......

}

......

php.ini中memory_limit設低了會出錯,修改了php.ini的memory_limit爲64M,重啓nginx,發現好了,原來是PHP的內存不足了。

如果這樣修改了還解決不了問題,可以參考下面這些方案:

3、max-children和max-requests

一臺服務器上運行着nginx php(fpm) xcache,訪問量日均 300W pv左右

最近經常會出現這樣的情況: php頁面打開很慢,cpu使用率突然降至很低,系統負載突然升至很高,查看網卡的流量,也會發現突然降到了很低。這種情況只持續數秒鐘就恢復了

檢查php-fpm的日誌文件發現了一些線索:

Sep3008:32:23.289973[NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200, cur:51200

Sep3008:32:23.290212[NOTICE] fpm_sockets_init_main(), line 371:using inherited socket fd=10,“127.0.0.1:9000″

Sep3008:32:23.290342[NOTICE] fpm_event_init_main(), line 109: libevent:using epoll

Sep3008:32:23.296426[NOTICE] fpm_init(), line 47: fpm is running, pid 30587

http://www.server110.com/nginx/201312/4409.html

在這幾句的前面,是1000多行的關閉children和開啓children的日誌

原來,php-fpm有一個參數 max_requests,該參數指明瞭,每個children最多處理多少個請求後便會被關閉,默認的設置是500。因爲php是把請求輪詢給每個children,在大流量下,每個childre到達max_requests所用的時間都差不多,這樣就造成所有的children基本上在同一時間被關閉。

在這期間,nginx無法將php文件轉交給php-fpm處理,所以cpu會降至很低(不用處理php,更不用執行sql),而負載會升至很高(關閉和開啓children、nginx等待php-fpm),網卡流量也降至很低(nginx無法生成數據傳輸給客戶端)

解決問題很簡單,增加children的數量,並且將 max_requests 設置未 0 或者一個比較大的值:

打開 /usr/local/php/etc/php-fpm.conf

調大以下兩個參數(根據服務器實際情況,過大也不行)

5120

600

然後重啓php-fpm。

4、增加緩衝區容量大小

將nginx的error log打開,發現“pstream sent too big header while reading response header from upstream”這樣的錯誤提示。查閱了一下資料,大意是nginx緩衝區有一個bug造成的,我們網站的頁面消耗佔用緩衝區可能過大。參考老外寫的修改辦法增加了緩衝區容量大小設置,502問題徹底解決。後來系統管理員又對參數做了調整隻保留了2個設置參數:client head buffer,fastcgi buffer size。

5、request_terminate_timeout

如果主要是在一些post或者數據庫操作的時候出現502這種情況,而不是在靜態頁面操作中常見,那麼可以查看一下php-fpm.conf設置中的一項:request_terminate_timeout

這個值是max_execution_time,就是fast-cgi的執行腳本時間。

0s爲關閉,就是無限執行下去。(當時裝的時候沒仔細看就改了一個數字)

發現,問題解決了,執行很長時間也不會出錯了。

優化fastcgi中,還可以改改這個值5s 看看效果。

php-cgi進程數不夠用、php執行時間長、或者是php-cgi進程死掉,都會出現502錯誤。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章