php-fpm 與 Nginx優化總結

PHP-fpm

PHP-FPM是一個PHPFastCGI管理器,是隻用於PHP的。
php-fpm 已經在 Linux、MacOSX、Solaris 和 FreeBSD 上測試通過。
確信 libxml2(在某些系統上叫做libxml2-devel)已經安裝。

關於信號處理

SIGINT, SIGTERM 立刻終止
SIGQUIT 平滑終止
SIGUSR1 重新打開日誌文件
SIGUSR2 平滑重載所有worker進程並重新載入配置和二進制模

參數調優

進程數

  • 首先,我們關注一個前提設置: pm = static/dynamic,標識fpm子進程的產生模式
    • static(靜態) :表示在fpm運行時直接fork出pm.max_chindren個worker進程
    • dynamic(動態):表示運行時fork出start_servers個進程,隨着負載的情況,動態的調整,最多不超過max_children個進程。

一般推薦用static,優點是不用動態的判斷負載情況,提升性能,缺點是多佔用些系統內存資源。

static:worker進程 pm.max_children = 300 這個值原則上是越大越好
dynamic:worker進程 pm.start_servers = 20
dynamic:空閒狀態 pm.min_spare_servers = 5 最小php-fpm進程數量
dynamic:空閒狀態 pm.max_spare_servers = 35 最大php-fpm進程數量

max_children

  • 這個值原則上是越大越好,php-cgi的進程多了就會處理的很快,排隊的請求就會很少。
  • 設置”max_children”也需要根據服務器的性能進行設定
  • 一般來說一臺服務器正常情況下每一個php-cgi所耗費的內存在20M左右
    • 假設“max_children”設置成100個,20M*100=2000M
    • 也就是說在峯值的時候所有PHP-CGI所耗內存在2000M以內。
    • 假設“max_children”設置的較小,比如5-10個,那麼php-cgi就會“很累”,處理速度也很慢,等待的時間也較長。
    • 如果長時間沒有得到處理的請求就會出現504 Gateway Time-out這個錯誤,而正在處理的很累的那幾個php-cgi如果遇到了問題就會出現502 Bad gateway這個錯誤。

start_servers

  • pm.start_servers的默認值爲2。並且php-fpm中給的計算方式也爲:
    {(cpu空閒時等待連接的php的最小子進程數) + (cpu空閒時等待連接的php的最大子進程數 - cpu空閒時等待連接的php的最小子進程數)/ 2};
  • 用配置表示就是:min_spare_servers + (max_spare_servers - min_spare_servers) / 2;
  • 一般而言,設置成10-20之間的數據足夠滿足需求了。

最大請求數max_requests

最大處理請求數是指一個php-fpm的worker進程在處理多少個請求後就終止掉,master進程會重新respawn一個新的。
這個配置的主要目的是避免php解釋器或程序引用的第三方庫造成的內存泄露。
pm.max_requests = 10240

  • 當一個 PHP-CGI 進程處理的請求數累積到 max_requests 個後,自動重啓該進程。
    • 502,是後端 PHP-FPM 不可用造成的,間歇性的502一般認爲是由於 PHP-FPM 進程重啓造成的.
  • 但是爲什麼要重啓進程呢?
    • 如果不定期重啓 PHP-CGI 進程,勢必造成內存使用量不斷增長(比如第三方庫有問題等)。因此 PHP-FPM 作爲 PHP-CGI 的管理器,提供了這麼一項監控功能,對請求達到指定次數的 PHP-CGI 進程進行重啓,保證內存使用量不增長。
    • 正是因爲這個機制,在高併發中,經常導致 502 錯誤
  • 目前我們解決方案是把這個值儘量設置大些,減少 PHP-CGI 重新 SPAWN 的次數,同時也能提高總體性能。PS:剛開始我們是500導致內存飆高,現在改成5120,當然可以再大一些,10240等,這個主要看測試結果,如果沒有內存泄漏等問題,可以再大一些。

最長執行時間request_terminate_timeout

max_execution_time和request_terminate_timeout

; The timeout for serving a single request after which the worker process will
; be killed. This option should be used when the ‘max_execution_time’ ini option
; does not stop script execution for some reason. A value of ‘0’ means ‘off’.
; Available units: s(econds)(default), m(inutes), h(ours), or d(ays)
; Default Value: 0
;request_terminate_timeout = 0
============
設置單個請求的超時中止時間. 該選項可能會對php.ini設置中的’max_execution_time’因爲某些特殊原因沒有中止運行的腳本有用. 設置爲 ‘0’ 表示 ‘Off’.當經常出現502錯誤時可以嘗試更改此選項。

  • 這兩項都是用來配置一個PHP腳本的最大執行時間的。當超過這個時間時,PHP-FPM不只會終止腳本的執行,還會終止執行腳本的Worker進程。
  • Nginx會發現與自己通信的連接斷掉了,就會返回給客戶端502錯誤。

內存|CPU排查方法

top

命令格式:

top [-] [d] [p] [q] [c] [C] [S]    [n] 

參數說明:
d: 指定每兩次屏幕信息刷新之間的時間間隔。當然用戶可以使用s交互命令來改變之。
p: 通過指定監控進程ID來僅僅監控某個進程的狀態。
q:該選項將使top沒有任何延遲的進行刷新。如果調用程序有超級用戶權限,那麼top將以儘可能高的優先級運行。
S: 指定累計模式
s : 使top命令在安全模式中運行。這將去除交互命令所帶來的潛在危險。
i: 使top不顯示任何閒置或者僵死進程。、
m:切換顯示內存信息。
t:切換顯示進程和CPU狀態信息。
c:切換顯示命令名稱和完整命令行。
M: 根據駐留內存大小進行排序。
P:根據CPU使用百分比大小進行排序。
T:根據時間/累計時間進行排序。

sar

執行sar -P ALL 1 100。-P ALL表示監控所有核心,1表示每1秒採集,100表示採集100次。

開啓慢日誌

配置輸出php-fpm慢日誌,閥值爲2秒:

request_slowlog_timeout = 2
slowlog = log/$pool.log.slow

利用sort/uniq命令分析彙總php-fpm慢日誌:

grep -v “^$” www.log.slow.tmp | cut -d ” ” -f 3,2 | sort | uniq -c | sort -k1,1nr | head -n 50

參數解釋:
sort: 對單詞進行排序
uniq -c: 顯示唯一的行,並在每行行首加上本行在文件中出現的次數
sort -k1,1nr: 按照第一個字段,數值排序,且爲逆序
head -10: 取前10行數據

用strace跟蹤進程

  • 利用nohup將strace轉爲後臺執行,直到attach上的php-fpm進程死掉爲止:
    nohup strace -T -p 13167 > 13167-strace.log &
    參數說明:
    -c 統計每一系統調用的所執行的時間,次數和出錯的次數等.
    -d 輸出strace關於標準錯誤的調試信息.
    -f 跟蹤由fork調用所產生的子進程.
    -o filename,則所有進程的跟蹤結果輸出到相應的filename
    -F 嘗試跟蹤vfork調用.在-f時,vfork不被跟蹤.
    -h 輸出簡要的幫助信息.
    -i 輸出系統調用的入口指針.
    -q 禁止輸出關於脫離的消息.
    -r 打印出相對時間關於,,每一個系統調用.
    -t 在輸出中的每一行前加上時間信息.
    -tt 在輸出中的每一行前加上時間信息,微秒級.
    -ttt 微秒級輸出,以秒了表示時間.
    -T 顯示每一調用所耗的時間.
    -v 輸出所有的系統調用.一些調用關於環境變量,狀態,輸入輸出等調用由於使用頻繁,默認不輸出.
    -V 輸出strace的版本信息.
    -x 以十六進制形式輸出非標準字符串
    -xx 所有字符串以十六進制形式輸出.
    -a column
    設置返回值的輸出位置.默認爲40.
    -e execve 只記錄 execve 這類系統調用
    -p 主進程號
  • 也可以用利用-c參數讓strace幫助彙總
    strace -cp pid

PHP-fpm配置文件註釋

pid = run/php-fpm.pid
#pid設置,默認在安裝目錄中的var/run/php-fpm.pid,建議開啓

error_log = log/php-fpm.log
#錯誤日誌,默認在安裝目錄中的var/log/php-fpm.log

log_level = notice
#錯誤級別. 可用級別爲: alert(必須立即處理), error(錯誤情況), warning(警告情況), notice(一般重要信息), debug(調試信息). 默認: notice.

emergency_restart_threshold = 60
emergency_restart_interval = 60s
#表示在emergency_restart_interval所設值內出現SIGSEGV或者SIGBUS錯誤的php-cgi進程數如果超過 emergency_restart_threshold個,php-fpm就會優雅重啓。這兩個選項一般保持默認值。

process_control_timeout = 0
#設置子進程接受主進程複用信號的超時時間. 可用單位: s(秒), m(分), h(小時), 或者 d(天) 默認單位: s(秒). 默認值: 0.

daemonize = yes
#後臺執行fpm,默認值爲yes,如果爲了調試可以改爲no。在FPM中,可以使用不同的設置來運行多個進程池。 這些設置可以針對每個進程池單獨設置。

listen = 127.0.0.1:9000
#fpm監聽端口,即nginx中php處理的地址,一般默認值即可。可用格式爲: 'ip:port', 'port', '/path/to/unix/socket'. 每個進程池都需要設置.

listen.backlog = -1
#backlog數,-1表示無限制,由操作系統決定,此行註釋掉就行。backlog含義參考:http://www.3gyou.cc/?p=41

listen.allowed_clients = 127.0.0.1
#允許訪問FastCGI進程的IP,設置any爲不限制IP,如果要設置其他主機的nginx也能訪問這臺FPM進程,listen處要設置成本地可被訪問的IP。默認值是any。每個地址是用逗號分隔. 如果沒有設置或者爲空,則允許任何服務器請求連接

listen.owner = www
listen.group = www
listen.mode = 0666
#unix socket設置選項,如果使用tcp方式訪問,這裏註釋即可。

user = www
group = www
#啓動進程的帳戶和組

pm = dynamic #對於專用服務器,pm可以設置爲static#如何控制子進程,選項有static和dynamic。如果選擇static,則由pm.max_children指定固定的子進程數。如果選擇dynamic,則由下開參數決定:
pm.max_children #,子進程最大數
pm.start_servers #,啓動時的進程數
pm.min_spare_servers #,保證空閒進程數最小值,如果空閒進程小於此值,則創建新的子進程
pm.max_spare_servers #,保證空閒進程數最大值,如果空閒進程大於此值,此進行清理

pm.max_requests = 1000
#設置每個子進程重生之前服務的請求數. 對於可能存在內存泄漏的第三方模塊來說是非常有用的. 如果設置爲 '0' 則一直接受請求. 等同於 PHP_FCGI_MAX_REQUESTS 環境變量. 默認值: 0.

pm.status_path = /status
#FPM狀態頁面的網址. 如果沒有設置, 則無法訪問狀態頁面. 默認值: none. munin監控會使用到

ping.path = /ping
#FPM監控頁面的ping網址. 如果沒有設置, 則無法訪問ping頁面. 該頁面用於外部檢測FPM是否存活並且可以響應請求. 請注意必須以斜線開頭 (/)。

ping.response = pong
#用於定義ping請求的返回相應. 返回爲 HTTP 200 的 text/plain 格式文本. 默認值: pong.

request_terminate_timeout = 0
#設置單個請求的超時中止時間. 該選項可能會對php.ini設置中的'max_execution_time'因爲某些特殊原因沒有中止運行的腳本有用. 設置爲 '0' 表示 'Off'.當經常出現502錯誤時可以嘗試更改此選項。

request_slowlog_timeout = 10s
#當一個請求該設置的超時時間後,就會將對應的PHP調用堆棧信息完整寫入到慢日誌中. 設置爲 '0' 表示 'Off'

slowlog = log/$pool.log.slow
#慢請求的記錄日誌,配合request_slowlog_timeout使用

rlimit_files = 1024
#設置文件打開描述符的rlimit限制. 默認值: 系統定義值默認可打開句柄是1024,可使用 ulimit -n查看,ulimit -n 2048修改。

rlimit_core = 0
#設置核心rlimit最大限制值. 可用值: 'unlimited' 、0或者正整數. 默認值: 系統定義值.

chroot =
#啓動時的Chroot目錄. 所定義的目錄需要是絕對路徑. 如果沒有設置, 則chroot不被使用.

chdir =
#設置啓動目錄,啓動時會自動Chdir到該目錄. 所定義的目錄需要是絕對路徑. 默認值: 當前目錄,或者/目錄(chroot時)

catch_workers_output = yes
#重定向運行過程中的stdout和stderr到主要的錯誤日誌文件中. 如果沒有設置, stdout 和 stderr 將會根據FastCGI的規則被重定向到 /dev/null . 默認值: 空.

總結篇

502

  1. max_children
  2. request_terminate_timeout、max_execution_time
  3. 數據庫
  4. 網關服務是否啓動如php-fpm

504

錯誤主要查看nginx.conf關於網關如fastcgi的配置

request_terminate_timeout設置0或者過長問題(502)

如果設置爲0或者過長的時間,可能會引起file_get_contents的資源問題。

  • 如果file_get_contents請求的遠程資源如果反應過慢,file_get_contents就會一直卡在那裏不會超時
  • 我們知道php.ini 裏面max_execution_time 可以設置 PHP 腳本的最大執行時間,
  • 但是,在 php-cgi(php-fpm) 中,該參數不會起效。真正能夠控制 PHP 腳本最大執行時間的是 php-fpm.conf 配置文件中的request_terminate_timeout參數。
  • 修改該參數,設置 PHP 腳本最大執行時間是必要的,但是,治標不治本。例如改成 30s,如果發生 file_get_contents() 獲取網頁內容較慢的情況,這就意味着 150 個 php-cgi 進程,每秒鐘只能處理 5 個請求,WebServer 同樣很難避免”502 Bad Gateway”。
  • 解決辦法是request_terminate_timeout設置爲10s或者一個合理的值,或者給file_get_contents加一個超時參數。

max_requests參數配置不當,可能會引起間歇性502錯誤

php-fpm的慢日誌,debug及異常排查神

參考資料

1)php-fpm優化方法彙總
http://blog.haohtml.com/archives/11162

2)多Sock文件和php-fpm實例配置
http://xn–ghqyhzj.com/post-21537.html

3) Nginx+PHP-FPM優化技巧總結
http://blog.csdn.net/dc_726/article/details/12340349

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章