APScheduler

簡介

https://apscheduler.readthedocs.io/en/latest/
APScheduler的全稱是Advanced Python Scheduler。它是一個輕量級的 Python 定時任務調度框架。APScheduler 支持三種調度任務:固定時間間隔,固定時間點(日期),Linux 下的 Crontab 命令。同時,它還支持異步執行、後臺執行調度任務。

安裝

pip install APScheduler

使用步驟

APScheduler 使用起來還算是比較簡單。運行一個調度任務只需要以下三部曲。

新建一個 schedulers (調度器) 。
添加一個調度任務(job stores)。
運行調度任務。

下面是執行每 2 秒報時的簡單示例代碼:

import datetime
import time
from apscheduler.schedulers.background import BackgroundScheduler

def timedTask():
    print(datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])

if __name__ == '__main__':
    # 創建後臺執行的 schedulers
    scheduler = BackgroundScheduler()  
    # 添加調度任務
    # 調度方法爲 timedTask,觸發器選擇 interval(間隔性),間隔時長爲 2 秒
    scheduler.add_job(timedTask, 'interval', seconds=2)
    # 啓動調度任務
    scheduler.start()

    while True:
        print(time.time())
        time.sleep(5)

基礎組件

APScheduler 有四種組件,分別是:調度器(scheduler),作業存儲(job store),觸發器(trigger),執行器(executor)。

  • schedulers(調度器)
    它是任務調度器,屬於控制器角色。它配置作業存儲器和執行器可以在調度器中完成,例如添加、修改和移除作業。

  • triggers(觸發器)
    描述調度任務被觸發的條件。不過觸發器完全是無狀態的。

  • job stores(作業存儲器)
    任務持久化倉庫,默認保存任務在內存中,也可將任務保存都各種數據庫中,任務中的數據序列化後保存到持久化數據庫,從數據庫加載後又反序列化。

  • executors(執行器)

負責處理作業的運行,它們通常通過在作業中提交指定的可調用對象到一個線程或者進城池來進行。當作業完成時,執行器將會通知調度器。

4.1 schedulers(調度器)
我個人覺得 APScheduler 非常好用的原因。它提供 7 種調度器,能夠滿足我們各種場景的需要。例如:後臺執行某個操作,異步執行操作等。調度器分別是:

BlockingScheduler : 調度器在當前進程的主線程中運行,也就是會阻塞當前線程。
BackgroundScheduler : 調度器在後臺線程中運行,不會阻塞當前線程。
AsyncIOScheduler : 結合 asyncio 模塊(一個異步框架)一起使用。
GeventScheduler : 程序中使用 gevent(高性能的Python併發框架)作爲IO模型,和 GeventExecutor 配合使用。
TornadoScheduler : 程序中使用 Tornado(一個web框架)的IO模型,用 ioloop.add_timeout 完成定時喚醒。
TwistedScheduler : 配合 TwistedExecutor,用 reactor.callLater 完成定時喚醒。
QtScheduler : 你的應用是一個 Qt 應用,需使用QTimer完成定時喚醒。

4.2 triggers(觸發器)
APScheduler 有三種內建的 trigger:
1)date 觸發器
date 是最基本的一種調度,作業任務只會執行一次。它表示特定的時間點觸發。它的參數如下:

參數  說明
run_date (datetime 或 str)   作業的運行日期或時間
timezone (datetime.tzinfo 或 str)    指定時區

date 觸發器使用示例如下:

from datetime import datetime
from datetime import date
from apscheduler.schedulers.background import BackgroundScheduler

def job_func(text):
    print(text)

scheduler = BackgroundScheduler()
# 在 2017-12-13 時刻運行一次 job_func 方法
scheduler .add_job(job_func, 'date', run_date=date(2017, 12, 13), args=['text'])
# 在 2017-12-13 14:00:00 時刻運行一次 job_func 方法
scheduler .add_job(job_func, 'date', run_date=datetime(2017, 12, 13, 14, 0, 0), args=['text'])
# 在 2017-12-13 14:00:01 時刻運行一次 job_func 方法
scheduler .add_job(job_func, 'date', run_date='2017-12-13 14:00:01', args=['text'])

scheduler.start()

interval 觸發器
固定時間間隔觸發。interval 間隔調度,參數如下:

參數  說明
weeks (int)     間隔幾周
days (int)  間隔幾天
hours (int)     間隔幾小時
minutes (int)   間隔幾分鐘
seconds (int)   間隔多少秒
start_date (datetime 或 str)     開始日期
end_date (datetime 或 str)   結束日期
timezone (datetime.tzinfo 或str)     時區

interval 觸發器使用示例如下:

import datetime
from apscheduler.schedulers.background import BackgroundScheduler

def job_func(text):
    print(datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])

scheduler = BackgroundScheduler()
# 每隔兩分鐘執行一次 job_func 方法
scheduler .add_job(job_func, 'interval', minutes=2)
# 在 2017-12-13 14:00:01 ~ 2017-12-13 14:00:10 之間, 每隔兩分鐘執行一次 job_func 方法
scheduler .add_job(job_func, 'interval', minutes=2, start_date='2017-12-13 14:00:01' , end_date='2017-12-13 14:00:10')

scheduler.start()

cron 觸發器
在特定時間週期性地觸發,和Linux crontab格式兼容。它是功能最強大的觸發器。
我們先了解 cron 參數:

參數  說明
year (int 或 str)    年,4位數字
month (int 或 str)(範圍1-12)
day (int 或 str)(範圍1-31
week (int 或 str)(範圍1-53)
day_of_week (int 或 str)     周內第幾天或者星期幾 (範圍0-6 或者 mon,tue,wed,thu,fri,sat,sun)
hour (int 或 str)(範圍0-23)
minute (int 或 str)(範圍0-59)
second (int 或 str)(範圍0-59)
start_date (datetime 或 str)     最早開始日期(包含)
end_date (datetime 或 str)   最晚結束時間(包含)
timezone (datetime.tzinfo 或str)     指定時區

這些參數是支持算數表達式,取值格式有如下:
這裏寫圖片描述

cron 觸發器使用示例如下:

import datetime
from apscheduler.schedulers.background import BackgroundScheduler

def job_func(text):
    print("當前時間:", datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])

scheduler = BackgroundScheduler()
# 在每年 1-3、7-9 月份中的每個星期一、二中的 00:00, 01:00, 02:00 和 03:00 執行 job_func 任務
scheduler .add_job(job_func, 'cron', month='1-3,7-9',day='0, tue', hour='0-3')

scheduler.start()

作業存儲(job store)
該組件是對調度任務的管理。
1)添加 job
有兩種添加方法,其中一種上述代碼用到的 add_job(), 另一種則是scheduled_job()修飾器來修飾函數。

這個兩種辦法的區別是:第一種方法返回一個 apscheduler.job.Job 的實例,可以用來改變或者移除 job。第二種方法只適用於應用運行期間不會改變的 job。

第二種添加任務方式的例子:

import datetime
from apscheduler.schedulers.background import BackgroundScheduler

@scheduler.scheduled_job(job_func, 'interval', minutes=2)
def job_func(text):
    print(datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])

scheduler = BackgroundScheduler()
scheduler.start()

2)移除 job
移除 job 也有兩種方法:remove_job() 和 job.remove()。
remove_job() 是根據 job 的 id 來移除,所以要在 job 創建的時候指定一個 id。
job.remove() 則是對 job 執行 remove 方法即可

scheduler.add_job(job_func, 'interval', minutes=2, id='job_one')
scheduler.remove_job(job_one)

job = add_job(job_func, 'interval', minutes=2, id='job_one')
job.remvoe()

3)獲取 job 列表
通過 scheduler.get_jobs() 方法能夠獲取當前調度器中的所有 job 的列表

修改 job
如果你因計劃改變要對 job 進行修改,可以使用Job.modify() 或者 modify_job()方法來修改 job 的屬性。但是值得注意的是,job 的 id 是無法被修改的。

scheduler.add_job(job_func, 'interval', minutes=2, id='job_one')
scheduler.start()
# 將觸發時間間隔修改成 5分鐘
scheduler.modify_job('job_one', minutes=5)

job = scheduler.add_job(job_func, 'interval', minutes=2)
# 將觸發時間間隔修改成 5分鐘
job.modify(minutes=5)

5)關閉 job
默認情況下調度器會等待所有正在運行的作業完成後,關閉所有的調度器和作業存儲。如果你不想等待,可以將 wait 選項設置爲 False。

scheduler.shutdown()
scheduler.shutdown(wait=false)

4.4 執行器(executor)

執行器顧名思義是執行調度任務的模塊。最常用的 executor 有兩種:ProcessPoolExecutor 和 ThreadPoolExecutor

下面是顯式設置 job store(使用mongo存儲)和 executor 的代碼的示例。

from pymongo import MongoClient
from apscheduler.schedulers.blocking import BlockingScheduler
from apscheduler.jobstores.mongodb import MongoDBJobStore
from apscheduler.jobstores.memory import MemoryJobStore
from apscheduler.executors.pool import ThreadPoolExecutor, ProcessPoolExecutor


def my_job():
    print 'hello world'
host = '127.0.0.1'
port = 27017
client = MongoClient(host, port)

jobstores = {
    'mongo': MongoDBJobStore(collection='job', database='test', client=client),
    'default': MemoryJobStore()
}
executors = {
    'default': ThreadPoolExecutor(10),
    'processpool': ProcessPoolExecutor(3)
}
job_defaults = {
    'coalesce': False,
    'max_instances': 3
}
scheduler = BlockingScheduler(jobstores=jobstores, executors=executors, job_defaults=job_defaults)
scheduler.add_job(my_job, 'interval', seconds=5)

try:
    scheduler.start()
except SystemExit:
    client.close()

實戰使用

from apscheduler.schedulers.tornado import TornadoScheduler
from tornado_executor.tornado_tasks import TornadoTasks
scheduler = TornadoScheduler()
    # the hour is local time
    # scheduler.add_job(TornadoTasks.coroutine_test, "cron", second="*/30")
    # scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute=1, hour=1, day=1)
    scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute="*/5")
    scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute=0, hour=23)
    scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute=59, hour=23)
    scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute=30, hour="*/3")
    # scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute=0, hour="*/3")
    scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute=40, hour=7)
    scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute=30, hour=1)
    scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute=30, hour=2)
    scheduler.add_job(TornadoTasks.coroutine_test, "cron", minute=59, hour=23)  # 每天0點

    # scheduler.add_job(TornadoTasks.coroutine_my_test, "cron", minute="*/2")
    scheduler.start()
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章