Azkaban 問題總結
1、azkaban 服務進程一直刪除 temp 目錄下的文件,但文件所佔空間並沒有釋放,導致系統磁盤不夠用。
問題描述
運行 df -h
命令看到系統磁盤使用率已達到92%,然後用命令du -sh
排查那些目錄佔用的空間比較多時,並沒有發現。
運行 lsof | grep deleted
命令後如圖:
問題解決
將 temp 目錄改到 數據磁盤目錄下
修改 executor 結點的配置,重啓
project.temp.dir=/data9/var/log/azkaban/temp
重啓azkaban後,後臺刪除文件的進程已經釋放,運行新的任務後臺依然有刪除文件的進程如:
該問題目前並沒有解決