進程與task_struct結構體

  1. 什麼是進程?
    進程是加載到內存中的可執行程序,但進程比程序多了一些結構,其中最主要的是PCB。廣義上,所有的進程信息被放在一個叫做進程控制塊的數據結構中,可以理解爲進程屬性的集合。
  2. 什麼是PCB?
    操作系統要對進程進行管理有兩個步驟:描述進程和組織進程。而PCB就是描述進程的數據結構,每個進程在內核中都有一個進程控制塊(PCB)來維護進程相關的信息,Linux內核的進程控制塊是task_struct結構體。
    task_struct是Linux內核的一種數據結構,它會被裝載到RAM中並且包含着進程的信息。
    每個進程都把它的信息放在 task_struct 這個數據結構內,task_struct 包含了這些內容:
 標示符:描述本進程的唯一標示符,用來區別其他進程。
 狀態:任務狀態,退出代碼,退出信號等。
 優先級:相對於其他進程的優先級。
 程序計數器:程序中即將被執行的下一條指令的地址。
 內存指針:包括程序代碼和進程相關數據的指針,還有和其他進程共享的內存
 塊的指針。
 上下文數據:進程執行時處理器的寄存器中的數據。
 IO狀態信息:包括顯⽰的I/O請求,分配給進程的IO設備和被進程使⽤的⽂件列表。
 記賬信息:可能包括處理器時間總和,使用的時鐘數總和,時間限制,記賬號等。

保存進程信息的數據結構叫做 task_struct,並且可以在include/linux/sched.h 裏找到它。所有運行在系統中的進程都以 task_struct 鏈表的形式存在內核中。
進程的信息可以通過 /proc 系統文件夾查看。要獲取PID爲400的進程信息,你需要查看 /proc/400 這個文件夾。大多數進程信息同樣可以使top和ps這些用戶級工具來獲取。

task_struct結構體註釋:

1. 調度數據成員

(1) volatile long states; 
表示進程的當前狀態: 
*TASK_RUNNING:正在運行或在就緒隊列run-queue中準備運行的進程,實際參與進程調度。 
*TASK_INTERRUPTIBLE:處於等待隊列中的進程,待資源有效時喚醒,也可由其它進程通過信號(signal)或定時中斷喚醒後進入就緒隊列run-queue。 
*TASK_UNINTERRUPTIBLE:處於等待隊列中的進程,待資源有效時喚醒,不可由其它進程通過信號(signal)或定時中斷喚醒。 
*TASK_ZOMBIE:表示進程結束但尚未消亡的一種狀態(僵死狀態)。此時,進程已經結束運行且釋放大部分資源,但尚未釋放進程控制塊。 
*TASK_STOPPED:進程被暫停,通過其它進程的信號才能喚醒。導致這種狀態的原因有二,或者是對收到SIGSTOP、SIGSTP、SIGTTIN或SIGTTOU信號的反應,或者是受其它進程的ptrace系統調用的控制而暫時將CPU交給控制進程。 
*TASK_SWAPPING: 進程頁面被交換出內存的進程。

(2) unsigned long flags; 
進程標誌: 
*PF_ALIGNWARN 打印“對齊”警告信息。 
*PF_PTRACED 被ptrace系統調用監控。 
*PF_TRACESYS 正在跟蹤。 
*PF_FORKNOEXEC 進程剛創建,但還沒執行。 
*PF_SUPERPRIV 超級用戶特權。 
*PF_DUMPCORE dumped core。 
*PF_SIGNALED 進程被信號(signal)殺出。 
*PF_STARTING 進程正被創建。 
*PF_EXITING 進程開始關閉。 
*PF_USEDFPU 該進程使用FPU(SMP only)。 
*PF_DTRACE delayed trace (used on m68k)。

(3) long priority; 
進程優先級。 Priority的值給出進程每次獲取CPU後可使用的時間(按jiffies計)。優先級可通過系統調用sys_setpriorty改變(在kernel/sys.c中)。

(4) unsigned long rt_priority; 
rt_priority 給出實時進程的優先級,rt_priority+1000給出進程每次獲取CPU後可使用的時間(同樣按jiffies計)。實時進程的優先級可通過系統 調用sys_sched_setscheduler()改變(見kernel/sched.c)。

(5) long counter; 
在 輪轉法調度時表示進程當前還可運行多久。在進程開始運行是被賦爲priority的值,以後每隔一個tick(時鐘中斷)遞減1,減到0時引起新一輪調 度。重新調度將從run_queue隊列選出counter值最大的就緒進程並給予CPU使用權,因此counter起到了進程的動態優先級的作用 (priority則是靜態優先級)。

(6) unsigned long policy; 
該進程的進程調度策略,可以通過系統調用sys_sched_setscheduler()更改(見kernel/sched.c)。調度策略有: 
*SCHED_OTHER 0 非實時進程,基於優先權的輪轉法(round robin)。 
*SCHED_FIFO 1 實時進程,用先進先出算法。 
*SCHED_RR 2 實時進程,用基於優先權的輪轉法。

信號處理
(1) unsigned long signal; 
進程接收到的信號。每位表示一種信號,共32種。置位有效。

(2) unsigned long blocked; 
進程所能接受信號的位掩碼。置位表示屏蔽,復位表示不屏蔽。

(3) struct signal_struct *sig; 
因 爲signal和blocked都是32位的變量,Linux最多隻能接受32種信號。對每種信號,各進程可以由PCB的sig屬性選擇使用自定義的處理 函數,或是系統的缺省處理函數。指派各種信息處理函數的結構定義在include/linux/sched.h中。對信號的檢查安排在系統調用結束後,以 及“慢速型”中斷服務程序結束後(IRQ#_interrupt(),參見9。5節“啓動內核”)。

進程隊列指針
(1) struct task_struct *next_task,*prev_task; 
所有進程(以PCB的形式)組成一個雙向鏈表。next_task和就是鏈表的前後指針。鏈表的頭和尾都是init_task(即0號進程)。

(2) struct task_struct *next_run,*prev_run; 
由正在運行或是可以運行的,其進程狀態均爲TASK_RUNNING的進程所組成的一個雙向循環鏈表,即run_queue就緒隊列。該鏈表的前後向指針用next_run和prev_run,鏈表的頭和尾都是init_task(即0號進程)。

(3) struct task_struct *p_opptr,*p_pptr;和struct task_struct *p_cptr,*p_ysptr,*p_osptr; 
以上分別是指向原始父進程(original parent)、父進程(parent)、子進程(youngest child)及新老兄弟進程(younger sibling,older sibling)的指針。

進程標識
(1) unsigned short uid,gid; 
uid和gid是運行進程的用戶標識和用戶組標識。

(2) int groups[NGROUPS]; 
與多數現代UNIX操作系統一樣,Linux允許進程同時擁有一組用戶組號。在進程訪問文件時,這些組號可用於合法性檢查。

(3) unsigned short euid,egid; 
euid 和egid又稱爲有效的uid和gid。出於系統安全的權限的考慮,運行程序時要檢查euid和egid的合法性。通常,uid等於euid,gid等於 egid。有時候,系統會賦予一般用戶暫時擁有root的uid和gid(作爲用戶進程的euid和egid),以便於進行運作。

(4) unsigned short fsuid,fsgid; 
fsuid 和fsgid稱爲文件系統的uid和gid,用於文件系統操作時的合法性檢查,是Linux獨特的標識類型。它們一般分別和euid和egid一致,但在 NFS文件系統中NFS服務器需要作爲一個特殊的進程訪問文件,這時只修改客戶進程的fsuid和fsgid。

(5) unsigned short suid,sgid; 
suid和sgid是根據POSIX標準引入的,在系統調用改變uid和gid時,用於保留真正的uid和gid。

(6) int pid,pgrp,session; 
進程標識號、進程的組織號及session標識號,相關係統調用(見程序kernel/sys.c)有sys_setpgid、sys_getpgid、sys_setpgrp、sys_getpgrp、sys_getsid及sys_setsid幾種。

(7) int leader; 
是否是session的主管,布爾量。

時間數據成員
(1) unsigned long timeout; 
用於軟件定時,指出進程間隔多久被重新喚醒。採用tick爲單位。

(2) unsigned long it_real_value,it_real_iner; 
用 於itimer(interval timer)軟件定時。採用jiffies爲單位,每個tick使it_real_value減到0時向進程發信號SIGALRM,並重新置初值。初值由 it_real_incr保存。具體代碼見kernel/itimer.c中的函數it_real_fn()。

(3) struct timer_list real_timer; 
一種定時器結構(Linux共有兩種定時器結構,另一種稱作old_timer)。數據結構的定義在include/linux/timer.h中,相關操作函數見kernel/sched.c中add_timer()和del_timer()等。

(4) unsigned long it_virt_value,it_virt_incr; 
關 於進程用戶態執行時間的itimer軟件定時。採用jiffies爲單位。進程在用戶態運行時,每個tick使it_virt_value減1,減到0時 向進程發信號SIGVTALRM,並重新置初值。初值由it_virt_incr保存。具體代碼見kernel/sched.c中的函數 do_it_virt()。

(5) unsigned long it_prof_value,it_prof_incr; 
同樣是 itimer軟件定時。採用jiffies爲單位。不管進程在用戶態或內核態運行,每個tick使it_prof_value減1,減到0時向進程發信號 SIGPROF,並重新置初值。初值由it_prof_incr保存。 具體代碼見kernel/sched.c中的函數do_it_prof。

(6) long utime,stime,cutime,cstime,start_time; 
以上分別爲進程在用戶態的運行時間、進程在內核態的運行時間、所有層次子進程在用戶態的運行時間總和、所有層次子進程在覈心態的運行時間總和,以及創建該進程的時間。

信號量數據成員
(1) struct sem_undo *semundo; 
進 程每操作一次信號量,都生成一個對此次操作的undo操作,它由sem_undo結構描述。這些屬於同一進程的undo操作組成的鏈表就由semundo 屬性指示。當進程異常終止時,系統會調用undo操作。sem_undo的成員semadj指向一個數據數組,表示各次undo的量。結構定義在 include/linux/sem.h。

(2) struct sem_queue *semsleeping; 
每一信號量集合對應一 個sem_queue等待隊列(見include/linux/sem.h)。進程因操作該信號量集合而阻塞時,它被掛到semsleeping指示的關 於該信號量集合的sem_queue隊列。反過來,semsleeping。sleeper指向該進程的PCB。

進程上下文環境
(1) struct desc_struct *ldt; 
進程關於CPU段式存儲管理的局部描述符表的指針,用於仿真WINE Windows的程序。其他情況下取值NULL,進程的ldt就是arch/i386/traps.c定義的default_ldt。

(2) struct thread_struct tss; 
任務狀態段,其內容與INTEL CPU的TSS對應,如各種通用寄存器.CPU調度時,當前運行進程的TSS保存到PCB的tss,新選中進程的tss內容複製到CPU的TSS。結構定義在include/linux/tasks.h中。

(3) unsigned long saved_kernel_stack; 
爲MS-DOS的仿真程序(或叫系統調用vm86)保存的堆棧指針。

(4) unsigned long kernel_stack_page; 
在內核態運行時,每個進程都有一個內核堆棧,其基地址就保存在kernel_stack_page中。

文件系統數據成員
(1) struct fs_struct *fs; 
fs 保存了進程本身與VFS的關係消息,其中root指向根目錄結點,pwd指向當前目錄結點,umask給出新建文件的訪問模式(可由系統調用umask更 改),count是Linux保留的屬性,如下頁圖所示。結構定義在include/linux/sched.h中。

(2) struct files_struct *files; 
files包含了進程當前所打開的文件(struct file *fd[NR_OPEN])。在Linux中,一個進程最多隻能同時打開NR_OPEN個文件。而且,前三項分別預先設置爲標準輸入、標準輸出和出錯消息輸出文件。

(3) int link_count; 
文件鏈(link)的數目。

內存數據成員
(1) struct mm_struct *mm; 
在linux 中,採用按需分頁的策略解決進程的內存需求。task_struct的數據成員mm指向關於存儲管理的mm_struct結構。其中包含了一個虛存隊列 mmap,指向由若干vm_area_struct描述的虛存塊。同時,爲了加快訪問速度,mm中的mmap_avl維護了一個AVL樹。在樹中,所有的 vm_area_struct虛存塊均由左指針指向相鄰的低虛存塊,右指針指向相鄰的高虛存塊。 結構定義在include/linux/sched.h中。

頁面管理
(1) int swappable:1; 
進程佔用的內存頁面是否可換出。swappable爲1表示可換出。對該標誌的復位和置位均在do_fork()函數中執行(見kerenl/fork.c)。

(2) unsigned long swap_address; 
虛存地址比swap_address低的進程頁面,以前已經換出或已換出過,進程下一次可換出的頁面自swap_address開始。參見swap_out_process()和swap_out_pmd()(見mm/vmscan.c)。

(3) unsigned long min_flt,maj_flt; 
該 進程累計的minor缺頁次數和major缺頁次數。maj_flt基本與min_flt相同,但計數的範圍比後者廣(參見fs/buffer.c和 mm/page_alloc.c)。min_flt只在do_no_page()、do_wp_page()裏(見mm/memory.c)計數新增的可 以寫操作的頁面。

(4) unsigned long nswap; 
該進程累計換出的頁面數。

(5) unsigned long cmin_flt,cmaj_flt,cnswap; 
以本進程作爲祖先的所有層次子進程的累計換入頁面、換出頁面計數。

(6) unsigned long old_maj_flt,dec_flt;

(7) unsigned long swap_cnt; 
下一次信號最多可換出的頁數。

支持對稱多處理器方式(SMP)時的數據成員
(1) int processor; 
進程正在使用的CPU。

(2) int last_processor; 
進程最後一次使用的CPU。

(3) int lock_depth; 
上下文切換時系統內核鎖的深度。

其它數據成員
(1) unsigned short used_math; 
是否使用FPU。

(2) char comm[16]; 
進程正在運行的可執行文件的文件名。

(3) struct rlimit rlim[RLIM_NLIMITS]; 
結 構rlimit用於資源管理,定義在linux/include/linux/resource.h中,成員共有兩項:rlim_cur是資源的當前最大 數目;rlim_max是資源可有的最大數目。在i386環境中,受控資源共有RLIM_NLIMITS項,即10項,定義在 linux/include/asm/resource.h中,見下表:

(4) int errno; 
最後一次出錯的系統調用的錯誤號,0表示無錯誤。系統調用返回時,全程量也擁有該錯誤號。

(5) long debugreg[8]; 
保存INTEL CPU調試寄存器的值,在ptrace系統調用中使用。

(6) struct exec_domain *exec_domain; 
Linux可以運行由80386平臺其它UNIX操作系統生成的符合iBCS2標準的程序。關於此類程序與Linux程序差異的消息就由exec_domain結構保存。

(7) unsigned long personality; 
Linux 可以運行由80386平臺其它UNIX操作系統生成的符合iBCS2標準的程序。 Personality進一步描述進程執行的程序屬於何種UNIX平臺的“個性”信息。通常有PER_Linux、PER_Linux_32BIT、 PER_Linux_EM86、PER_SVR3、PER_SCOSVR3、PER_WYSEV386、PER_ISCR4、PER_BSD、 PER_XENIX和PER_MASK等,參見include/linux/personality.h。

(8) struct linux_binfmt *binfmt; 
指向進程所屬的全局執行文件格式結構,共有a。out、script、elf和java等四種。結構定義在include/linux/binfmts.h中(core_dump、load_shlib(fd)、load_binary、use_count)。

(9) int exit_code,exit_signal; 
引起進程退出的返回代碼exit_code,引起錯誤的信號名exit_signal。

(10) int dumpable:1; 
布爾量,表示出錯時是否可以進行memory dump。

(11) int did_exec:1; 
按POSIX要求設計的布爾量,區分進程是正在執行老程序代碼,還是在執行execve裝入的新代碼。

(12) int tty_old_pgrp; 
進程顯示終端所在的組標識。

(13) struct tty_struct *tty; 
指向進程所在的顯示終端的信息。如果進程不需要顯示終端,如0號進程,則該指針爲空。結構定義在include/linux/tty.h中。

(14) struct wait_queue *wait_chldexit; 
在進程結束時,或發出系統調用wait4後,爲了等待子進程的結束,而將自己(父進程)睡眠在該隊列上。結構定義在include/linux/wait.h中。

進程隊列的全局變量
(1) current; 
當前正在運行的進程的指針,在SMP中則指向CPU組中正被調度的CPU的當前進程: 
#define current(0+current_set[smp_processor_id()])/sched.h/ 
struct task_struct *current_set[NR_CPUS];

(2) struct task_struct init_task; 
即0號進程的PCB,是進程的“根”,始終保持初值INIT_TASK。

(3) struct task_struct *task[NR_TASKS]; 
進 程隊列數組,規定系統可同時運行的最大進程數(見kernel/sched.c)。NR_TASKS定義在include/linux/tasks.h 中,值爲512。每個進程佔一個數組元素(元素的下標不一定就是進程的pid),task[0]必須指向init_task(0號進程)。可以通過 task[]數組遍歷所有進程的PCB。但Linux也提供一個宏定義for_each_task()(見 include/linux/sched.h),它通過next_task遍歷所有進程的PCB: 
#define for_each_task(p) \ 
for(p=&init_task;(p=p->next_task)!=&init_task;)

(4) unsigned long volatile jiffies; 
Linux的基準時間(見kernal/sched.c)。系統初始化時清0,以後每隔10ms由時鐘中斷服務程序do_timer()增1。

(5) int need_resched; 
重新調度標誌位(見kernal/sched.c)。當需要Linux調度時置位。在系統調用返回前(或者其它情形下),判斷該標誌是否置位。置位的話,馬上調用schedule進行CPU調度。

(6) unsigned long intr_count; 
記 錄中斷服務程序的嵌套層數(見kernal/softirq.c)。正常運行時,intr_count爲0。當處理硬件中斷、執行任務隊列中的任務或者執 行bottom half隊列中的任務時,intr_count非0。這時,內核禁止某些操作,例如不允許重新調度。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章