磁盤清理工作分2步進行
每日巡檢:我們自己的監控地址
。。。。。。。。。。。。 。。。。。。。。。。。。。。。。。
最好超過80%提前進行清理,可有效避免大部分的HM報警。
移動方HM監控報警處理
閥值爲90%
一般磁盤報警主要有5種情況
/ (根目錄)
/usr (/usr/local/爲應用安裝點)
/var (此目錄已經腳本解決,基本不會出現報警)
/nas (此爲存儲掛載點)
數據庫及其他
清理前注意(重要的事情說三遍):
慎用rm -rf!
慎用rm -rf!!
慎用rm -rf!!!
1、
/ 根目錄
查看哪個目錄佔空間最大。
一般情況,是腳本運行失敗,導致/logs/exchange/下的日誌沒壓縮或者超期日誌沒及時刪除導致(保留3個月)
ll /logs/exchange
drwxr-xr-x 2 root root 4096 05-05 00:03 201504
drwxr-xr-x 2 root root 4096 06-05 00:03 201505
drwxr-xr-x 2 root root 12288 06-29 00:02 201506
drwx------ 2 root root 45056 06-29 06:43 recent
刪除3個月前的,並壓縮日誌(除了當天的)即可。
也有可能是一些人爲操作不當導致,比如抓包後沒有及時停掉進程,導致抓包日誌不停打印,將本地磁盤撐爆。
需要運用du命令仔細分析。
du -sh * 常用
2、
/usr
一般爲 /usr/local/apache/logs 和/usr/local/tomcat/logs 2個應用的日誌沒有及時壓縮或者清理導致。
有幾種情況
a 刷量導致的當日日誌過大,不可壓縮
訪問及訂購日誌不可動(不可清空),可以清空localhost日誌或者mod_jk日誌。如果還是告警,先將舊日誌轉移其他目錄,待明日日誌壓縮後移回。
b 舊日誌沒有壓縮
gzip 當日之前的日誌即可
c 應用備份過多
一般爲tomcat/webapps/,刪除最老的備份(注意查看軟鏈接和mount點是否取消)
3 、
/var
一般爲/var/spool/clientmqueue下垃圾文件過多導致,也有可能是/var/spool/mail/root 郵件數量太多。
現在大部分服務器已經實現了腳本自動清理。
前者進行刪除操作,後者進行清空操作.
4、
/nas
此處爲存儲默認掛載點
root@SHYQ-PS-MV-SV03-IPADCS-02 ~]# ll /nas
total 96
drwxr-xr-x 102 root root 8192 Jun 26 17:58 nas_log
drwxr-xrwt 39 root root 8192 Jun 11 17:53 nas_preview
drwxr-xr-x 13 root root 4096 Jun 2 15:14 nas_sup
drwxr-xr-x 28 root root 4096 Jan 30 16:36 nas_wap
drwxrwxrwx 147 root root 8192 Jun 27 21:19 nas_www
由於是數據共享目錄,不可擅自進行操作,請聯繫相關研發人員進行商議,或者擴容或者清理過期數據。
5、
數據庫及其它
數據庫請在分析目錄情況後聯繫DBA進行協助清理,比如hadoop和oracle ,不可擅自操作。一般爲監聽日誌未及時清空導致。
以下目錄重點關注
/home/oracle/app/oracle/diag/tnslsnr/*/listener/trace
/home/oracle/app/oracle/diag/tnslsnr/*/listener/alert
另一種情況、
df -h 查看本地磁盤沒有超過閥值 卻導致磁盤告警No space left on device,同時應用也無法正常啓動。
使用df -i 查看inodes是否已經沒有剩餘。
此時多爲文件數目過多,導致索引節點被用盡,需要進行文件清理。
謹記:
慎重,及時,仔細。