PHP內核剖析 Fpm之master進程管理

        以PHP7爲學習基礎,PHP7的源碼爲C編寫的。

        參考書籍:《PHP內核剖析》秦鵬/著

        GitHub網頁:https://github.com/pangudashu/php7-internal/blob/master/1/fpm.md

目錄

1、信號事件:

2 進程檢查定時器


        master進程是Fpm多線程模式下的管理進程,master進程與worker進程之間不會直接進行通信,master通過共享內存獲取worker進程的信息,根據信息作出相應的對策。

        master進程在調用fpm_run後不再返回,而是進入一個事件的循環中,此後master將始終圍繞着幾個事件進行處理。這一節我們來看下master是如何管理worker進程的,首先介紹下三種不同的進程管理方式:

        static: 這種方式比較簡單,在啓動時master按照pm.max_children配置fork出相應數量的worker進程,即worker進程數是固定不變的;

        dynamic: 動態進程管理,首先在fpm啓動時按照pm.start_servers初始化一定數量的worker,運行期間如果master發現空閒worker數低於pm.min_spare_servers配置數(表示請求比較多,worker處理不過來了)則會fork worker進程,但總的worker數不能超過pm.max_children,如果master發現空閒worker數超過了pm.max_spare_servers(表示閒着的worker太多了)則會殺掉一些worker,避免佔用過多資源,master通過這4個值來控制worker數;

        ondemand: 這種方式一般很少用,在啓動時不分配worker進程,等到有請求了後再通知master進程fork worker進程,總的worker數不超過pm.max_children,處理完成後worker進程不會立即退出,當空閒時間超過pm.process_idle_timeout後再退出;

        前面介紹到在fpm_run()master進程將進入fpm_event_loop()

void fpm_event_loop(int err)
{
    //創建一個io read的監聽事件,這裏監聽的就是在fpm_init()階段中通過socketpair()創建管道sp[0]
    //當sp[0]可讀時將回調fpm_got_signal()
    fpm_event_set(&signal_fd_event, fpm_signals_get_fd(), FPM_EV_READ, &fpm_got_signal, NULL);
    fpm_event_add(&signal_fd_event, 0);

    //如果在php-fpm.conf配置了request_terminate_timeout則啓動心跳檢查
    if (fpm_globals.heartbeat > 0) {
        fpm_pctl_heartbeat(NULL, 0, NULL);
    }
    //定時觸發進程管理
    fpm_pctl_perform_idle_server_maintenance_heartbeat(NULL, 0, NULL);
    
    //進入事件循環,master進程將阻塞在此
    while (1) {
        ...
        //等待IO事件
        ret = module->wait(fpm_event_queue_fd, timeout);
        ...
        //檢查定時器事件
        ...
    }
}

        這就是master整體的處理,其進程管理主要依賴註冊的幾個事件,接下來我們詳細分析下這幾個事件的功能。

1、信號事件:

        在fpm_init()階段master曾創建了一個全雙工的管道:sp,然後在這裏創建了一個sp[0]可讀的事件,當sp[0]可讀時將交由fpm_got_signal()處理,向sp[1]寫數據時sp[0]纔會可讀,那麼什麼時機會向sp[1]寫數據呢?前面已經提到了:當master收到註冊的那幾種信號時(事件在下面給出了)會寫入sp[1]端,這個時候將觸發sp[0]可讀事件,回調fpm_got_signal()進行處理,具體代碼在上一個代碼的5、6行,具體流程如下:

        具體的事件如下: 

        SIGINT、SIGTERM(終止進程)、SIGQUIT(停止進程): 退出fpm,在master收到退出信號後將向所有的worker進程發送退出信號,然後master退出;

        SIGUSR1: 重新加載日誌文件,生產環境中通常會對日誌進行切割,切割後會生成一個新的日誌文件,如果fpm不重新加載將無法繼續寫入日誌,這個時候就需要向master發送一個USR1的信號;

        SIGUSR2: 重啓fpm,首先master也是會向所有的worker進程發送退出信號,然後master會調用execvp()重新啓動fpm,最後舊的master退出;

        SIGCHLD: 這個信號是子進程退出時操作系統發送給父進程的,子進程退出時,內核將子進程置爲殭屍狀態,這個進程稱爲殭屍進程,它只保留最小的一些內核數據結構,以便父進程查詢子進程的退出狀態,只有當父進程調用wait或者waitpid函數查詢子進程退出狀態後子進程才告終止,fpm中當worker進程因爲異常原因(比如coredump了)退出而非master主動殺掉時master將受到此信號,這個時候父進程將調用waitpid()查下子進程的退出,然後檢查下是不是需要重新fork新的worker;

2、進程檢查定時器

        fpm_event_loop中調用fpm_pctl_perform_idle_server_maintenance_heartbeat()註冊了一個定時器:

if (!err) {
		fpm_pctl_perform_idle_server_maintenance_heartbeat(NULL, 0, NULL);
           
        //log
		zlog(ZLOG_DEBUG, "%zu bytes have been reserved in SHM", fpm_shm_get_size_allocated());
		zlog(ZLOG_NOTICE, "ready to handle connections");

#ifdef HAVE_SYSTEMD
		fpm_systemd_heartbeat(NULL, 0, NULL);
#endif
	}

       這個定時器是master來定時檢查worker的數量,根據不同的策略(static/dynamic/ondemand)的配置決定是否要fork或kill進程。

void fpm_pctl_perform_idle_server_maintenance_heartbeat(struct fpm_event_s *ev, short which, void *arg) /* {{{ */
{
	static struct fpm_event_s heartbeat;
	struct timeval now;
    //定時器觸發時回調的邏輯
    ...
    //此後的邏輯只在註冊時執行一次,以後不會再到達這裏
    //設置定時器,回調函數也是本函數
	/* first call without setting which to initialize the timer */
	fpm_event_set_timer(&heartbeat, FPM_EV_PERSIST, &fpm_pctl_perform_idle_server_maintenance_heartbeat, NULL);
    //註冊定時器,第二個參數是每隔多少ms觸發
	fpm_event_add(&heartbeat, FPM_IDLE_SERVER_MAINTENANCE_HEARTBEAT);
}

        從代碼中可以看出,這裏註冊了一個定時器,其回調函數也是自己,觸發的時間間隔爲FPM_IDLE_SERVER_MAINTENANCE_HEARTBEAT(即1000ms)。定時器觸發時的邏輯如下:

if (which == FPM_EV_TIMEOUT) { //確認是一個定時事件
		fpm_clock_get(&now);

        //fpm_pctl_can_spawn_children()檢查master當前狀態是否正常,比如master收到了退出信號
        //這個時候就不需要再進行fork、kill操作了
		if (fpm_pctl_can_spawn_children()) {
			fpm_pctl_perform_idle_server_maintenance(&now);
            
            //具體的worker檢查邏輯
			/* if it's a child, stop here without creating the next event
			 * this event is reserved to the master process
			 */
			if (fpm_globals.is_child) {
				return;
			}
		}
		return;
	}

        fpm_pctl_perform_idle_server_maintenance只針對(dynamic/ondemand),檢查的策略就是遍歷所有的worker pool,具體的過程與邏輯如下:

static void fpm_pctl_perform_idle_server_maintenance(struct timeval *now)
{
    for (wp = fpm_worker_all_pools; wp; wp = wp->next) {
        struct fpm_child_s *last_idle_child = NULL; //空閒時間最久的worker
        int idle = 0; //空閒worker數
        int active = 0; //忙碌worker數
        
        for (child = wp->children; child; child = child->next) {
            //根據worker進程的fpm_scoreboard_proc_s->request_stage判斷
            if (fpm_request_is_idle(child)) {
                //找空閒時間最久的worker
                ...
                idle++;
            }else{
                active++;
            }
        }
        ...
        //ondemand模式
        if (wp->config->pm == PM_STYLE_ONDEMAND) {
            if (!last_idle_child) continue;

            fpm_request_last_activity(last_idle_child, &last);
            fpm_clock_get(&now);
            if (last.tv_sec < now.tv_sec - wp->config->pm_process_idle_timeout) {
                //如果空閒時間最長的worker空閒時間超過了process_idle_timeout則殺掉該worker
                last_idle_child->idle_kill = 1;
                fpm_pctl_kill(last_idle_child->pid, FPM_PCTL_QUIT);
            } 
            continue;
        }
        //dynamic
        if (wp->config->pm != PM_STYLE_DYNAMIC) continue;
        if (idle > wp->config->pm_max_spare_servers && last_idle_child) {
            //空閒worker太多了,殺掉
            last_idle_child->idle_kill = 1;
            fpm_pctl_kill(last_idle_child->pid, FPM_PCTL_QUIT);
            wp->idle_spawn_rate = 1;
            continue;
        }
        if (idle < wp->config->pm_min_spare_servers) {
            //空閒worker太少了,如果總worker數未達到max數則fork
            ...
        }
    }
}

        注意:給個週期只會kill/fork一個進程,如果連續fork了幾次進程,則會把fork數翻倍。

3、執行超時檢查定時器

       這個事件是用於限制worker處理單個請求最大耗時的,php-fpm.conf中有一個request_terminate_timeout的配置項,如果worker處理一個請求的總時長超過了這個值那麼master將會向此worker進程發送kill -TERM信號殺掉worker進程,此配置單位爲秒,默認值爲0表示關閉此機制,另外fpm打印的slow log也是在這裏完成的。

//fpm_event_loop
//如果在php-fpm.conf配置了request_terminate_timeout則啓動心跳檢查
    if (fpm_globals.heartbeat > 0) {
        fpm_pctl_heartbeat(NULL, 0, NULL);
    }

fpm_pctl_heartbeat()定義了一個定時器,每隔fpm_globals.heartbeat毫秒觸發一次,回調的也是自己。

//註冊定時器
void fpm_pctl_heartbeat(struct fpm_event_s *ev, short which, void *arg) /* {{{ */
{
	static struct fpm_event_s heartbeat;
	struct timeval now;

	if (which == FPM_EV_TIMEOUT) {
		fpm_clock_get(&now);
		fpm_pctl_check_request_timeout(&now);
		return;
	}

	//設置觸發週期
	fpm_globals.heartbeat = MAX(fpm_globals.heartbeat, FPM_PCTL_MIN_HEARTBEAT);

	/* first call without setting to initialize the timer */
	zlog(ZLOG_DEBUG, "heartbeat have been set up with a timeout of %dms", fpm_globals.heartbeat);

    //下面的邏輯只在註冊時執行一次
    //註冊定時器,回調的是自己,每隔一個觸發週期觸發一次
	fpm_event_set_timer(&heartbeat, FPM_EV_PERSIST, &fpm_pctl_heartbeat, NULL);
	fpm_event_add(&heartbeat, fpm_globals.heartbeat);
}

定時器定時調用fpm_pctl_check_request_timeout。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章