centos7 systemctl status servicename執行慢的問題

一,這個問題和systemd-journald有關,故我們先簡單瞭解下:

    過去只有 rsyslogd 的年代中,由於 rsyslogd 必須要開機完成並且執行了 rsyslogd 這個 daemon 之後,登錄文件纔會開始記錄。所以,核心還得要自己產生一個 klogd 的服務, 才能將系統在開機過程、啓動服務的過程中的信息記錄下來,然後等 rsyslogd 啓動後才傳送給它來處理。

    現在有了 systemd 之後,systemd 使用systemd-journald統一管理所有 Unit 的啓動日誌。由於systemd是kernel喚醒的,然後又是第一個執行的軟件,它可以主動調用 systemd-journald 來協助記載登錄信息。因此在開機過程中的所有信息,包括啓動服務與服務若啓動失敗的情況等等,都可以直接被記錄到 systemd-journald 裏頭去!

    不過 systemd-journald 由於是使用於內存的登錄文件記錄方式,因此重新開機過後,開機前的登錄文件信息當然就不會被記載了。 爲此,我們還是建議啓動 rsyslogd 來協助分類記錄!也就是說, systemd-journald 用來管理與查詢這次開機後的登錄信息,而 rsyslogd 可以用來記錄以前及現在的所以數據到磁盤文件中,方便未來進行查詢!


二,問題場景:

一臺centos7系統有load高的報警,故登錄上去查看,發現系統很卡,系統磁盤io吃的比較多。之後,發現很多systemctl status的進程,並且這種進程佔用系統io很多。  


問題分析定位:

1,centos7的bug

2,systemctl的問題  


三,解決過程:

1,centos7已經用了很長時間,目前處於穩定,並且翻看centos7的bug list未發現有類似異常。故排除了系統bug。

2,開始查找systemctl的問題,果不其然發現是systemd-journald的問題。

1)strace命令查看問題,發現是讀取systemd-journald日誌比較慢

# strace -s 1024 systemctl status nginx


2)查看status輸出:

# systemctl status nginx

● nginx.service - nginx - high performance web server

   Loaded: loaded (/usr/lib/systemd/system/nginx.service; disabled; vendor preset: disabled)

   Active: active (running) since 一 2018-01-08 18:25:37 CST; 2h 20min ago

     Docs: http://nginx.org/en/docs/

 Main PID: 22403 (nginx)

   CGroup: /system.slice/nginx.service

           ├─22403 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf

           ├─22404 nginx: worker process

           ├─22405 nginx: worker process

           ├─22408 nginx: worker process


1月 08 18:25:37 test systemd[1]: Starting nginx - high performance web server...

1月 08 18:25:37 test nginx[22398]: nginx: the configuration file /etc/nginx/nginx.conf syntax is ok

1月 08 18:25:37 test nginx[22398]: nginx: configuration file /etc/nginx/nginx.conf test is successful

1月 08 18:25:37 test systemd[1]: Started nginx - high performance web server.


可以看到systemctl有的輸出有nginx啓動時候相關的信息。而這些輸出是從systemd-journald中讀取的。


3)systemd-journald的日誌默認是存儲在/run/log/journal目錄,發現這個目錄已經有4G了。查看網上相關資料,發現也有其它人遇見過類似的問題。可以通過修改systemd-journald的配置來解決問題:

# vim /etc/systemd/journald.conf

SystemMaxUse=100M

RuntimeMaxUse=100M

###

SystemMaxUse= 與 RuntimeMaxUse= 限制全部日誌文件加在一起最多可以佔用多少空間。而SystemMaxUse= 與 RuntimeMaxUse= 的默認值是10%空間與4G空間兩者中的較小者,故把這兩個配置調小了。


重啓systemd-journald:

# systemctl restart systemd-journald


4)操作完成之後發現系統load慢慢降了下來,systemctl status命令也變快了。


四,結論:

1,通過限制systemd-journald日誌的大小來解決這個問題。副作用是保存的日誌變少,但是可接受,目前沒有發現有異常。


五,參考:

http://shouce.jb51.net/vbird-linux-basic-4/160.html

http://www.jinbuguo.com/systemd/journald.conf.html

http://www.codekoala.com/posts/systemctl-status-foo-was-too-slow/



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章