生產環境的分佈式任務調度框架如何選擇?quartz、xxl-job、Elastic-Job、Saturn

一、Quartz

支持集羣和分佈式,但是沒有友好的管理界面,功能單一,對於管理調用的任務比較困難。

quartz使用數據庫鎖。在quartz的集羣解決方案裏有張表scheduler_locks,quartz採用了悲觀鎖的方式對triggers表進行行加鎖,以保證任務同步的正確性。一旦某一個節點上面的線程獲取了該鎖,那麼這個Job就會在這臺機器上被執行,同時這個鎖就會被這臺機器佔用。同時另外一臺機器也會想要觸發這個任務,但是鎖已經被佔用了,就只能等待,直到這個鎖被釋放。

quartz的分佈式調度策略是以數據庫爲邊界資源的一種異步策略。各個調度器都遵守一個基於數據庫鎖的操作規則從而保證了操作的唯一性。同時多個節點的異步運行保證了服務的可靠。但這種策略有自己的侷限性:集羣特性對於高CPU使用率的任務效果很好,但是對於大量的短任務,各個節點都會搶佔數據庫鎖,這樣就出現大量的線程等待資源。這種情況隨着節點的增加會越來越嚴重。

缺點:

quartz的分佈式只是解決了高可用的問題,並沒有解決任務分片的問題,還是會有單機處理的極限。

二、Xxl-job

輕量級分佈式任務調度平臺,其核心設計目標是開發迅速、學習簡單、輕量級、易擴展。目前擁有大量的it企業使用該框架,文檔齊全,教程很多,遇到問題也比較容易找到解決方案。

主要特性

簡單:支持通過Web頁面對任務進行CRUD操作,操作簡單,一分鐘上手;
調度中心HA(中心式):調度採用中心式設計,“調度中心”基於集羣Quartz實現並支持集羣部署,可保證調度中心HA;
執行器HA(分佈式):任務分佈式執行,任務"執行器"支持集羣部署,可保證任務執行HA;
彈性擴容縮容:一旦有新執行器機器上線或者下線,下次調度時將會重新分配任務;
分片廣播任務:執行器集羣部署時,任務路由策略選擇"分片廣播"情況下,一次任務調度將會廣播觸發集羣中所有執行器執行一次任務,可根據分片參數開發分片任務;
動態分片:分片廣播任務以執行器爲維度進行分片,支持動態擴容執行器集羣從而動態增加分片數量,協同進行業務處理;在進行大數據量業務操作時可顯著提升任務處理能力和速度。
動態:支持動態修改任務狀態、暫停/恢復任務,以及終止運行中任務,即時生效;
註冊中心: 執行器會週期性自動註冊任務, 調度中心將會自動發現註冊的任務並觸發執行。同時,也支持手動錄入執行器地址;
一致性:“調度中心”通過DB鎖保證集羣分佈式調度的一致性, 一次任務調度只會觸發一次執行;

其他特性

路由策略:執行器集羣部署時提供豐富的路由策略,包括:第一個、最後一個、輪詢、隨機、一致性HASH、最不經常使用、最近最久未使用、故障轉移、忙碌轉移等;
故障轉移:任務路由策略選擇"故障轉移"情況下,如果執行器集羣中某一臺機器故障,將會自動Failover切換到一臺正常的執行器發送調度請求。
阻塞處理策略:調度過於密集執行器來不及處理時的處理策略,策略包括:單機串行(默認)、丟棄後續調度、覆蓋之前調度;
任務超時控制:支持自定義任務超時時間,任務運行超時將會主動中斷任務;
任務失敗重試:支持自定義任務失敗重試次數,當任務失敗時將會按照預設的失敗重試次數主動進行重試;其中分片任務支持分片粒度的失敗重試;
任務失敗告警;默認提供郵件方式失敗告警,同時預留擴展接口,可方面的擴展短信、釘釘等告警方式;
事件觸發:除了"Cron方式"和"任務依賴方式"觸發任務執行之外,支持基於事件的觸發任務方式。調度中心提供觸發任務單次執行的API服務,可根據業務事件靈活觸發。
任務進度監控:支持實時監控任務進度;
腳本任務:支持以GLUE模式開發和運行腳本任務,包括Shell、Python、NodeJS、PHP、PowerShell等類型腳本;
調度線程池:調度系統多線程觸發調度運行,確保調度精確執行,不被堵塞;
數據加密:調度中心和執行器之間的通訊進行數據加密,提升調度信息安全性;
郵件報警:任務失敗時支持郵件報警,支持配置多郵件地址羣發報警郵件;
運行報表:支持實時查看運行數據,如任務數量、調度次數、執行器數量等;以及調度報表,如調度日期分佈圖,調度成功分佈圖等;
全異步:任務調度流程全異步化設計實現,如異步調度、異步運行、異步回調等,有效對密集調度進行流量削峯,理論上支持任意時長任務的運行;
功能齊全,文檔也很齊全,有使用教程,但是上手門檻稍微高了;

三、Elastic-Job

分佈式調度解決方案,由兩個相互獨立的子項目Elastic-Job-Lite和Elastic-Job-Cloud組成。Elastic-Job-Lite定位爲輕量級無中心化解決方案,使用jar包的形式提供分佈式任務的協調服務。選擇該項目可以滿足大多數it企業的需求。

Elastic-Job-Cloud使用Mesos + Docker的解決方案,額外提供資源治理、應用分發以及進程隔離等服務。輕量級無中心化:Elastic-Job-Lite並無作業調度中心節點,而是基於部署作業框架的程序在到達相應時間點時各自觸發調度。
靈活的增刪改查作業,集中式管理調度作業
支持高可用:一旦執行作業的服務器崩潰,等待執行的服務器將會在下次作業啓動時替補執行。開啓失效轉移功能效果更好,可以保證在本次作業執行時崩潰,備機立即啓動替補執行。
支持分片:作業分片一致性,保證同一分片在分佈式環境中僅一個執行實例
任務監控:通過監聽Elastic-Job-Lite的zookeeper註冊中心的幾個關鍵節點即可完成作業運行狀態監控功能
一致性:使用zookeeper作爲註冊中心,爲了保證作業的在分佈式場景下的一致性,一旦作業與註冊中心無法通信,運行中的作業會立刻停止執行,但作業的進程不會退出,這樣做的目的是爲了防止作業重分片時,將與註冊中心失去聯繫的節點執行的分片分配給另外節點,導致同一分片在兩個節點中同時執行。
同時支持動態擴容,將任務拆分爲n個任務項後,各個服務器分別執行各自分配到的任務項。一旦有新的服務器加入集羣,或現有服務器下線,elastic-job將在保留本次任務執行不變的情況下,下次任務開始前觸發任務重分片

四、Saturn

基於噹噹Elastic Job代碼基礎上自主研發的任務調度系統,是唯品會開源的分佈式作業調度平臺,取代傳統的Linux Cron/Spring Batch Job的方式,做到統一配置,統一監控,任務高可用以及分片併發處理。主要是去中心化,高可用,可分片,動態擴容,有認證和授權功能。

主要特性

支持多種語言作業,語言無關(Java/Go/C++/PHP/Python/Ruby/shell)
支持秒級調度
支持作業分片並行執行
支持依賴作業串行執行
支持作業高可用和智能負載均衡
支持異常檢測和自動失敗轉移
支持異地容災
支持多個集羣部署
支持跨機房區域部署
支持彈性動態擴容
支持優先級和權重設置
支持docker容器,容器化友好
支持cron時間表達式
支持多個時間段暫停執行控制
支持超時告警和超時強殺控制
支持灰度發佈
支持異常、超時和無法高可用作業監控告警和簡易的故障排除
支持失敗率最高、最活躍和負荷最重的各域各節點TOP10的作業統計

優點:

源碼清晰,學習入手容易。應用部署簡單,提供運維控制檯,集中管理作業,運維控制檯功能強大,提供作業統計報表 ,告警,增刪改查作業,作業統一配置。

建議:以上是各個分佈式任務調度框架技術的對比,建議使用Saturn,saturn是elastic的升級版本。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章