two-days

磁盤清理工作分2步進行

每日巡檢:我們自己的監控地址

        。。。。。。。。。。。。 。。。。。。。。。。。。。。。。。

            最好超過80%提前進行清理,可有效避免大部分的HM報警。

移動方HM監控報警處理

            閥值爲90%

一般磁盤報警主要有5種情況

/     (根目錄)

/usr  (/usr/local/爲應用安裝點)

/var  (此目錄已經腳本解決,基本不會出現報警)

/nas  (此爲存儲掛載點)

數據庫及其他

清理前注意(重要的事情說三遍):

慎用rm -rf!

慎用rm -rf!!

慎用rm -rf!!!

1、

/ 根目錄

查看哪個目錄佔空間最大。

一般情況,是腳本運行失敗,導致/logs/exchange/下的日誌沒壓縮或者超期日誌沒及時刪除導致(保留3個月)

ll /logs/exchange

drwxr-xr-x 2 root root  4096 05-05 00:03 201504

drwxr-xr-x 2 root root  4096 06-05 00:03 201505

drwxr-xr-x 2 root root 12288 06-29 00:02 201506

drwx------ 2 root root 45056 06-29 06:43 recent

刪除3個月前的,並壓縮日誌(除了當天的)即可。

也有可能是一些人爲操作不當導致,比如抓包後沒有及時停掉進程,導致抓包日誌不停打印,將本地磁盤撐爆。

需要運用du命令仔細分析。

du -sh * 常用

2、

/usr 

一般爲 /usr/local/apache/logs 和/usr/local/tomcat/logs 2個應用的日誌沒有及時壓縮或者清理導致。

有幾種情況

a 刷量導致的當日日誌過大,不可壓縮

訪問及訂購日誌不可動(不可清空),可以清空localhost日誌或者mod_jk日誌。如果還是告警,先將舊日誌轉移其他目錄,待明日日誌壓縮後移回。

b 舊日誌沒有壓縮

gzip 當日之前的日誌即可

c 應用備份過多

一般爲tomcat/webapps/,刪除最老的備份(注意查看軟鏈接和mount點是否取消)

3 、

/var

一般爲/var/spool/clientmqueue下垃圾文件過多導致,也有可能是/var/spool/mail/root 郵件數量太多。

現在大部分服務器已經實現了腳本自動清理。

前者進行刪除操作,後者進行清空操作.

4、

/nas

此處爲存儲默認掛載點

root@SHYQ-PS-MV-SV03-IPADCS-02 ~]# ll /nas

total 96

drwxr-xr-x 102 root root  8192 Jun 26 17:58 nas_log

drwxr-xrwt  39 root root  8192 Jun 11 17:53 nas_preview

drwxr-xr-x  13 root root  4096 Jun  2 15:14 nas_sup

drwxr-xr-x  28 root root  4096 Jan 30 16:36 nas_wap

drwxrwxrwx 147 root root  8192 Jun 27 21:19 nas_www

由於是數據共享目錄,不可擅自進行操作,請聯繫相關研發人員進行商議,或者擴容或者清理過期數據。

5、

數據庫及其它

數據庫請在分析目錄情況後聯繫DBA進行協助清理,比如hadoop和oracle ,不可擅自操作。一般爲監聽日誌未及時清空導致。

以下目錄重點關注

 /home/oracle/app/oracle/diag/tnslsnr/*/listener/trace

/home/oracle/app/oracle/diag/tnslsnr/*/listener/alert

另一種情況、

df -h 查看本地磁盤沒有超過閥值 卻導致磁盤告警No space left on device,同時應用也無法正常啓動。

使用df -i 查看inodes是否已經沒有剩餘。

此時多爲文件數目過多,導致索引節點被用盡,需要進行文件清理。

謹記:

慎重,及時,仔細。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章