Linux zombie進程

在Linux進程的5種狀態:(選自《深入理解Linux內核》)
1. 可運行(正在運行或在運行隊列中等待)
2. 可中斷的等待(休眠中, 受阻, 在等待某個條件的形成或接受到信號)
3. 不可中斷的等待(不可中斷睡眠是不可以用信號的方式來使它停止的,只有內核程序使用wake_up()函數明確地喚醒它們從不可中斷睡眠狀態轉換出來)
4. 僵死(進程已終止, 但進程描述符存在, 直到父進程調用wait4()系統調用後釋放)
5. 暫停(進程收到SIGSTOP, SIGSTP, SIGTIN, SIGTOU信號後停止運行運行)

其中殭屍進程是非常特殊的一種,它已經放棄了幾乎所有內存空間,沒有任何可執行代碼,也不能被調度,僅僅在進程列表中保留一個位置,記載該進程的退出狀態等信息供其他進程收集,除此之外,殭屍進程不再佔有任何內存空間。殭屍進程“除了留下一些供人憑弔的信息,對系統毫無作用”。
 
怎樣產生殭屍進程的:

一個進程在調用exit命令結束自己的生命的時候,其實它並沒有真正的被銷燬,而是留下一個稱爲殭屍進程(Zombie)的數據結構(系統調用exit,它的作用是使進程退出,但也僅僅限於將一個正常的進程變成一個殭屍進程,並不能將其完全銷燬)。在Linux進程的狀態中,殭屍進程是非常特殊的一種,它已經放棄了幾乎所有內存空間,沒有任何可執行代碼,也不能被調度,僅僅在進程列表中保留一個位置,記載該進程的退出狀態等信息供其他進程收集,除此之外,殭屍進程不再佔有任何內存空間。它需要它的父進程來爲它收屍,如果他的父進程沒安裝SIGCHLD信號處理函數調用wait或waitpid()等待子進程結束,又沒有顯式忽略該信號,那麼它就一直保持殭屍狀態,如果這時父進程結束了,那麼init進程自動
會接手這個子進程,爲它收屍,它還是能被清除的。但是如果如果父進程是一個循環,不會結束,那麼子進程就會一直保持殭屍狀態,這就是爲什麼系統中有時會有很多的殭屍進程。
怎麼查看殭屍進程:
利用命令ps,可以看到有標記爲Z的進程就是殭屍進程。
怎樣來清除殭屍進程:
1.改寫父進程,在子進程死後要爲它收屍。具體做法是接管SIGCHLD信號。子進程死後,會發送SIGCHLD信號給父進程,父進程收到此信號後,執行waitpid()函數爲子進程收屍。這是基於這樣的原理:就算父進程沒有調用wait,內核也會向它發送SIGCHLD消息,儘管對的默認處理是忽略,如果想響應這個消息,可以設置一個處理函數。
2.把父進程殺掉。父進程死後,殭屍進程成爲"孤兒進程",過繼給1號進程init,init始終會負責清理殭屍進程.它產生的所有殭屍進程也跟着消失。

===========================================
在Linux中可以用
ps auwx  
發現殭屍進程

a all w/ tty, including other users 所有窗口和終端,包括其他用戶的進程
u user-oriented 面向用戶(用戶友好)
-w,w wide output 寬格式輸出
x processes w/o controlling ttys  

在殭屍進程後面 會標註
ps axf  
看進程樹,以樹形方式現實進程列表

ps axm  
會把線程列出來,在linux下進程和線程是統一的,是輕量級進程的兩種方式。

ps axu  
顯示進程的詳細狀態
===========================================
killall
kill -15
kill -9
一般都不能殺掉 defunct進程
用了kill -15,kill -9以後 之後反而會多出更多的殭屍進程

kill -kill pid
fuser -k pid  

可以考慮殺死他的parent process,
kill -9 他的parent process
===========================================
一個已經終止,但是其父進程尚未對其進行善後處理(獲取終止子進程的有關信息、釋放它仍佔用的資源)的進程被稱爲僵死進程(Zombie Process)。

避免zombie的方法:
1)在SVR4中,如果調用signal或sigset將SIGCHLD的配置設置爲忽略,則不會產生僵死子進程。另外,使用SVR4版的sigaction,則可設置SA_NOCLDWAIT標誌以避免子進程僵死。

Linux中也可使用這個,在一個程序的開始調用這個函數

signal(SIGCHLD,SIG_IGN);  
  
2)調用fork兩次。程序8 - 5 實現了這一點。
3)用waitpid等待子進程返回.  

===========================================

zombie進程是僵死進程。防止它的辦法,一是用wait,waitpid之類的函數獲得

進程的終止狀態,以釋放資源。另一個是fork兩次  
===========================================
defunct進程只是在process table裏還有一個記錄,其他的資源沒有佔用,除非你的系統的process個數的限制已經快超過了,zombie進程不會有更多的壞處。
可能唯一的方法就是reboot系統可以消除zombie進程。
===========================================


任何程序都有殭屍狀態,它佔用一點內存資源(也就是進程表裏還有一個記錄),僅僅是表象而已不必害怕。如果程序有問題有機會遇見,解決大批量殭屍簡單有效的辦法是重起。kill是無任何效果的


fork與zombie/defunct"

在Unix下的一些進程的運作方式。當一個進程死亡時,它並不是完全的消失了。進程終止,它不再運行,但是還有一些殘留的小東西等待父進程收回。這些殘留的東西包括子進程的返回值和其他的一些東西。當父進程 fork() 一個子進程後,它必須用 wait() 或者 waitpid() 等待子進程退出。正是這個 wait() 動作來讓子進程的殘留物消失。

自然的,在上述規則之外有個例外:父進程可以忽略 SIGCLD 軟中斷而不必要 wait()。可以這樣做到(在支持它的系統上,比如Linux):

main()
{
signal(SIGCLD, SIG_IGN); /* now I don't have to wait()! */
.
.
fork();
fork();
fork(); /* Rabbits, rabbits, rabbits! */



現在,子進程死亡時父進程沒有 wait(),通常用 ps 可以看到它被顯示爲“”。它將永遠保持這樣 直到 父進程 wait(),或者按以下方法處理。

這裏是你必須知道的另一個規則:當父進程在它wait()子進程之前死亡了(假定它沒有忽略 SIGCLD),子進程將把 init(pid 1)進程作爲它的父進程。如果子進程工作得很好並能夠控制,這並不是問題。但如果子進程已經是 defunct,我們就有了一點小麻煩。看,原先的父進程不可能再 wait(),因爲它已經消亡了。這樣,init 怎麼知道 wait() 這些 zombie 進程。

答案:不可預料的。在一些系統上,init週期性的破壞掉它所有的defunct進程。在另外一些系統中,它乾脆拒絕成爲任何defunct進程的父進程,而是馬上毀滅它們。如果你使用上述系統的一種,可以寫一個簡單的循環,用屬於init的defunct進程填滿進程表。這大概不會令你的系統管理員很高興吧?

你的任務:確定你的父進程不要忽略 SIGCLD,也不要 wait() 它 fork() 的所有進程。不過,你也未必 要 總是這樣做(比如,你要起一個 daemon 或是別的什麼東西),但是你必須小心編程,如果你是一個 fork() 的新手。另外,也不要在心理上有任何束縛。

總結:
子進程成爲 defunct 直到父進程 wait(),除非父進程忽略了 SIGCLD 。
更進一步,父進程沒有 wait() 就消亡(仍假設父進程沒有忽略 SIGCLD )的子進程(活動的或者 defunct)成爲 init 的子進程,init 用重手法處理它們。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章