Linux任務調度(二)—cron

本文是《Linux任務調度》的第二部分,主要說明Linux中週期性任務調度的實現方法。

循環運行的週期性工作排程

相對於 at 是僅運行一次的工作,循環運行的週期性工作排程則是由 cron (crond) 這個系統服務來控制的。剛剛談過 Linux 系統上面原本就有非常多的週期性工作,因此這個系統服務是默認啓動的。另外, 由於使用者自己也可以進行週期性工作排程,所以, Linux 也提供使用者控制週期性工作排程的命令 (crontab)。

使用者的配置

使用者想要創建循環型工作排程時,使用的是 crontab 這個命令。爲了安全性的問題, 與 at 同樣的,我們可以限制使用 crontab 的使用者帳號。使用的限制數據有:

  • /etc/cron.allow
    將可以使用 crontab 的帳號寫入其中,若不在這個文件內的使用者則不可使用 crontab;
  • /etc/cron.deny
    將不可以使用 crontab 的帳號寫入其中,若未記錄到這個文件當中的使用者,就可以使用 crontab 。

與 at 很像吧。同樣的,以優先順序來說, /etc/cron.allow 比 /etc/cron.deny 要優先, 而判斷上面,這兩個文件只選擇一個來限制而已,因此,建議你只要保留一個即可, 免得影響自己在配置上面的判斷。一般來說,系統默認是保留 /etc/cron.deny , 你可以將不想讓他運行 crontab 的那個使用者寫入 /etc/cron.deny 當中,一個帳號一行。

當使用者使用 crontab 這個命令來創建工作排程之後,該項工作就會被紀錄到/var/spool/cron/ 裏面去了,而且是以帳號來作爲判別的。舉例來說, dmtsai 使用 crontab 後, 他的工作會被紀錄到/var/spool/cron/dmtsai 裏頭去。但請注意,不要使用 vi 直接編輯該文件,因爲可能由於輸入語法錯誤,會導致無法運行 cron 。另外, cron 運行的每一項工作都會被紀錄到 /var/log/cron 這個登錄檔中。所以,如果你的 Linux 不知道有否被植入木馬時,也可以搜尋一下 /var/log/cron 這個登錄檔。

下面說明一下crontab的語法:

[root@www ~]# crontab [-u username] [-l|-e|-r]

選項與參數:

-u  :只有 root 才能進行這個任務,亦即幫其他使用者創建/移除 crontab 工作排程;

-e  :編輯 crontab 的工作內容

-l  :查閱 crontab 的工作內容

-r  :移除所有的 crontab 的工作內容,若僅要移除一項,請用 -e 去編輯。

 範例一:用 dmtsai 的身份在每天的 12:00 發信給自己

[dmtsai@www ~]$ crontab -e

此時會進入 vi 的編輯畫面讓您編輯工作。注意到,每項工作都是一行。

0   12  *  *  * mail dmtsai -s "at 12:00" < /home/dmtsai/.bashrc

#分時日月周 |<==============命令========================>|

默認情況下,任何使用者只要不被列入 /etc/cron.deny 當中,那麼他就可以直接下達『 crontab -e 』去編輯自己的週期性命令了。整個過程就如同上面提到的,會進入 vi 的編輯畫面, 然後以一個工作一行來編輯,編輯完畢之後輸入『 :wq 』儲存後離開 vi 就可以了。 而每項工作 (每行) 的格式都是具有六個欄位,這六個欄位的意義爲:

代表意義

分鐘

小時

日期

月份

命令

數字範圍

0-59

0-23

1-31

1-12

0-7

呀就命令啊

 

比較有趣的是那個『周』。周的數字爲 0 或 7 時,都代表『星期天』。另外, 還有一些輔助的字符,如下所示:

特殊字符

代表意義

*(星號)

代表任何時刻都接受的意思。舉例來說,範例一內那個日、月、周都是 * , 就代表著『不論何月、何日的禮拜幾的 12:00 都運行後續命令』的意思。

,(逗號)

代表分隔時段的意思。舉例來說,如果要下達的工作是 3:00 與 6:00 時,就會是:

0 3,6 * * * command

時間參數還是有五欄,不過第二欄是 3,6 ,代表 3 與 6 都適用。

-(減號)

代表一段時間範圍內,舉例來說, 8 點到 12 點之間的每小時的 20 分都進行一項工作:

20 8-12 * * * command

仔細看到第二欄變成 8-12 。代表 8,9,10,11,12 都適用的意思。

/n(斜線)

那個 n 代表數字,亦即是『每隔 n 單位間隔』的意思,例如每五分鐘進行一次,則:

*/5 * * * * command

很簡單吧。用 * 與 /5 來搭配,也可以寫成 0-59/5 ,相同意思。

我們就來搭配幾個例子練習看看吧。底下的案例請實際用 dmtsai 這個身份作看看。後續的動作才能夠搭配起來。

例題:

假若你的女朋友生日是 5 月 2 日,你想要在 5 月 1 日的 23:59 發一封信給他,這封信的內容已經寫在 /home/dmtsai/lover.txt 內了,該如何進行?

答:

直接下達 crontab -e 之後,編輯成爲:

59 23 1 5 * mail kiki < /home/dmtsai/lover.txt

那樣的話,每年 kiki 都會收到你的這封信。(當然,信的內容就要每年變一變。)

 

例題:

假如每五分鐘需要運行 /home/dmtsai/test.sh 一次,又該如何?

答:

同樣使用 crontab -e 進入編輯:

*/5 * * * * /home/dmtsai/test.sh

那個 crontab 每個人都只有一個文件存在,就是在 /var/spool/cron 裏面啊。 還有建議您:『命令下達時,最好使用絕對路徑,這樣比較不會找不到運行檔。』

例題:

假如你每星期六都與朋友有約,那麼想要每個星期五下午 4:30 告訴你朋友星期六的約會不要忘記,則:

答:

還是使用 crontab -e 啊。

30 16 * * 5 mail [email protected] < /home/dmtsai/friend.txt

 

真的是很簡單吧。呵呵。那麼,該如何查詢使用者目前的 crontab 內容?我們可以這樣來看看:

[dmtsai@www ~]$ crontab -l

59 23 1 5 * mail kiki < /home/dmtsai/lover.txt

*/5 * * * * /home/dmtsai/test.sh

30 16 * * 5 mail [email protected] < /home/dmtsai/friend.txt

 注意,若僅想要移除一項工作而已的話,必須要用 crontab -e 去編輯~

如果想要全部的工作都移除,才使用 crontab -r 

[dmtsai@www ~]$ crontab -r

[dmtsai@www ~]$ crontab -l

no crontab for dmtsai

看到了嗎? crontab 『整個內容都不見了。』所以請注意:『如果只是要刪除某個 crontab 的工作項目,那麼請使用 crontab -e 來重新編輯即可。』如果使用 -r 的參數,是會將所有的 crontab 數據內容都刪掉的。千萬注意了。


系統的配置檔: /etc/crontab

這個『 crontab -e 』是針對使用者的 cron 來設計的,如果是『系統的週期性任務』時, 該怎麼辦?是否還是需要以 crontab -e 來管理你的週期性工作排程?當然不需要,你只要編輯 /etc/crontab 這個文件就可以。有一點需要特別注意。那就是 crontab -e 這個 crontab 其實是 /usr/bin/crontab 這個運行檔,但是 /etc/crontab 可是一個『純文字檔』。你可以 root 的身份編輯一下這個文件哩。

基本上, cron 這個服務的最低偵測限制是『分鐘』,所以『 cron 會每分鐘去讀取一次 /etc/crontab  /var/spool/cron裏面的數據內容 』,因此,只要你編輯完 /etc/crontab 這個文件,並且將他儲存之後,那麼 cron 的配置就自動的會來運行了。

Tips:
 Linux 底下的 crontab 會自動的幫我們每分鐘重新讀取一次 /etc/crontab 的例行工作事項,但是某些原因或者是其他的 Unix 系統中,由於 crontab 是讀到內存當中的,所以在你修改完 /etc/crontab 之後,可能並不會馬上運行,這個時候請重新啓動 crond 這個服務吧。『/etc/init.d/crond restart

廢話少說,我們就來看一下這個 /etc/crontab 的內容吧。

[root@www ~]# cat /etc/crontab

SHELL=/bin/bash                     <==使用哪種 shell 介面

PATH=/sbin:/bin:/usr/sbin:/usr/bin  <==運行檔搜尋路徑

MAILTO=root                         <==若有額外STDOUT,以 email將數據送給誰

HOME=/                              <==默認此 shell 的家目錄所在

 # run-parts

01  *  *  *  *   root      run-parts /etc/cron.hourly   <==每小時

02  4  *  *  *   root      run-parts /etc/cron.daily    <==每天

22  4  *  *  0   root      run-parts /etc/cron.weekly   <==每週日

42  4  1  *  *   root      run-parts /etc/cron.monthly  <==每個月 1 

分時日月周運行者身份  命令串

看到這個文件的內容你大概就瞭解了吧。呵呵,沒錯。這個文件與將剛剛我們下達 crontab -e 的內容幾乎完全一模一樣。只是有幾個地方不太相同:

  • MAILTO=root

    這個項目是說,當 /etc/crontab 這個文件中的週期性工作的命令發生錯誤時,或者是該工作的運行結果有 STDOUT/STDERR 時,會將錯誤信息或者是螢幕顯示的信息傳給誰?默認當然是由系統直接寄發一封 mail 給 root。
  • PATH=....
    這裏就是輸入運行檔的搜尋路徑。使用默認的路徑配置就已經很足夠了。
  • 01 * * * * root run-parts /etc/cron.hourly
    這個 /etc/crontab 裏面預配置義出四項工作任務,分別是每小時、每天、每週及每個月分別進行一次的工作。 但是在五個欄位後面接的並不是命令,而是一個新的欄位,那就是『運行後面那串命令的身份』爲何。這與使用者的 crontab -e 不相同。由於使用者自己的 crontab 並不需要指定身份,但 /etc/crontab 裏面當然要指定身份。以上表的內容來說,系統默認的週期性工作是以 root 的身份來進行的。

    那麼後面那串命令是什麼?你可以使用『 which run-parts 』搜尋看看,其實那是一個 bash script 。如果你直接進入 /usr/bin/run-parts 去看看, 會發現這支命令會將後面接的『目錄』內的所有文件捉出來運行。這也就是說『 如果你想讓系統每小時主動幫你運行某個命令,將該命令寫成 script,並將該文件放置到 /etc/cron.hourly/目錄下即可』的意思。

    現在你知道系統是如何進行他默認的一堆週期性工作排程了嗎?如果你下達『 ll /etc/cron.daily 』就可以看到一堆文件, 那些文件就是系統提供的 script ,而這堆 scripts 將會在每天的凌晨 4:02 開始運行。這也是爲啥如果你是夜貓族, 就會發現奇怪的是,Linux 系統爲何早上 4:02 開始會很忙碌的發出一些硬盤跑動的聲音。因爲他必須要進行 makewhatis, updatedb, rpm rebuild 等等的任務。

由於 CentOS 提供的 run-parts 這個 script 的輔助,因此 /etc/crontab 這個文件裏面支持兩種下達命令的方式, 一種是直接下達命令,一種則是以目錄來規劃,例如:

  • 命令型態
    01 * * * * dmtsai mail -s "testing" kiki < /home/dmtsai/test.txt
    以 dmtsai 這個使用者的身份,在每小時運行一次 mail 命令。
  • 目錄規劃
    */5 * * * * root run-parts /root/runcron
    創建一個 /root/runcron 的目錄,將要每隔五分鐘運行的『可運行檔』都寫到該目錄下, 就可以讓系統每五分鐘運行一次該目錄下的所有可運行檔。

假設你現在要作一個目錄,讓系統可以每 2 分鐘去運行這個目錄下的所有可以運行的文件,你可以寫下如下的這一行在 /etc/crontab 中:

*/2* * * * rootrun-parts /etc/cron.min

當然, /etc/cron.min 這個目錄是需要存在的。那如果我需要運行的是一個『程序』而已, 不需要用到一個目錄?該如何是好?例如在偵測網絡流量時,我們希望每五分鐘偵測分析一次, 可以這樣寫:

*/5* * * * root/bin/mrtg /etc/mrtg/mrtg.cfg

如何。創建週期性命令很簡單吧。如果你是系統管理員而且你的工作又是系統維護方面的例行任務時, 直接修改/etc/crontab 這個文件即可。又便利,又方便管理。

Tips

有的時候,我們以系統的 cron 來進行例行性工作的創建時,要注意一些使用方面的特性。

 舉例來說,如果我們有四個工作都是五分鐘要進行一次的,那麼是否這四個動作全部都在同一個時間點進行? 

如果同時進行,該四個動作又很耗系統資源,如此一來,每五分鐘不是會讓系統忙得要死?

此時好好的分配一些運行時間就 OK。所以,注意一下:

  • 資源分配不均的問題

當大量使用 crontab 的時候,總是會有問題發生的,最嚴重的問題就是『系統資源分配不均』的問題,包括:

  • 流量
  • 區域內其他 PC 的流量偵測
  • CPU 使用率
  • RAM 使用率
  • 線上人數即時偵測

如果每個流程都在同一個時間啓動的話,那麼在某個時段時,我的系統會變的相當的繁忙, 所以,這個時候就必須要分別配置啦!我可以這樣做:

[root@www ~]# vi /etc/crontab

1,6,11,16,21,26,31,36,41,46,51,56 * * * * root  CMD1

2,7,12,17,22,27,32,37,42,47,52,57 * * * * root  CMD2

3,8,13,18,23,28,33,38,43,48,53,58 * * * * root  CMD3

4,9,14,19,24,29,34,39,44,49,54,59 * * * * root  CMD4

看到了沒?那個『 , 』分隔的時候,請注意,不要有空白字節!(連續的意思)如此一來, 則可以將每五分鐘工作的流程分別在不同的時刻來工作!則可以讓系統的運行較爲順暢。

  • 取消不要的輸出項目

另外一個困擾發生在『 當有運行成果或者是運行的項目中有輸出的數據時,該數據將會 mail MAILTO 配置的帳號』,好啦,那麼當有一個排程一直出錯(例如 DNS 的偵測系統當中,若 DNS 上一級主機掛掉,那麼你就會一直收到錯誤信息!)怎麼辦? 直接將輸出的結果輸出到 /dev/null這個垃圾桶當中就好了!

  • 安全的檢驗

很多時候被植入木馬都是以例行命令的方式植入的,所以可以藉由檢查 /var/log/cron 的內容來視察是否有『非您配置的 cron 被運行了?』這個時候就需要小心一點!

  • 周與日月不可同時並存

另一個需要注意的地方在於:『你可以分別以周或者是日月爲單位作爲循環,但你不可使用「幾月幾號且爲星期幾」的模式工作』。 這個意思是說,你不可以這樣編寫一個工作排程:

30 12 11 9 5 root echo "just test"   <==這是錯誤的寫法

本來你以爲九月十一號且爲星期五纔會進行這項工作,無奈的是,系統可能會判定每個星期五作一次,或每年的 9 月 11 號分別進行,如此一來與你當初的規劃就不一樣了~所以羅,得要注意這個地方!上述的寫法是不對的。

發佈了33 篇原創文章 · 獲贊 6 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章