【Linux性能優化2】平均負載

原創

2020-06-26 11:22

什麼是平均負載

當系統響應變慢時，一般使用top或者uptime來查看系統負載情況。運行uptime命令的輸出信息如下：

其中 23:12:21 爲當前系統時間
up 42 min：爲系統已經運行的時間
2 users：當前登錄的用戶數
load average：則是過去 1 分鐘、5 分鐘、15 分鐘的平均負載。
***平均負載***是單位時間內系統處於可運行狀態和不可中斷狀態的平均進程數，也就是平均活躍的進程數。
可運行狀態是指正在使用cpu或者正在等待cpu的進程。也就是使用ps命令看到的處於R狀態的進程。
不可中斷狀態的進程則是處於內核態關鍵流程中的進程，且這些進程是不可以被打斷的，比如常見的等待硬件設備的IO響應。也就是使用ps命令處於D狀態的進程。不可中斷狀態是系統對進程和硬件設備的一種保護機制。
平均活躍進程數最理想的狀態就是每個CPU上剛好運行一個進程，這樣每個CPU都得到了充分的利用，也就是說平局負載剛好等於系統CPU的個數。
如果平均負載爲2意味着什麼呢？
也就是單位時間平均活躍進程數爲2.那麼對於只有2個CPU的系統來說，CPU剛好被得到了充分的利用。
而在有4個CPU的系統上，有50%的CPU會處於空閒狀態。
而在只有一個CPU的系統上則進程需要競爭CPU才能被運行會有50%的進程因爲競爭不到CPU而處於等待狀態。

如何查看系統有幾個CPU：

上面的命令顯示系統cpu數目爲2

平均負載與CPU使用率

平均負載代表代表的是平均活躍進程數，是不是平均負載升高了CPU使用率就高了呢？
首先平均負載是單位時間內系統處於可運行狀態和不可中斷狀態的平均進程數，它不僅包括了正在使用CPU的進程，還包括了等待CPU和等待I/O的進程。CPU使用率則是單位時間內CPU的繁忙情況統計，跟平均負載不一定對應

分析工具

tress 是一個 Linux 系統壓力測試工具，可以用於模擬異常的平均負載升高的情況
sysstat包含了linux性能分析的常用工具用於監控和分析系統性能，其中就包含了mpstat和pidstat兩個命令。
mpstat 是一個常用的多核 CPU 性能分析工具，用來實時查看每個cpu的性能指標以及每個CPU的平均指標
pidstat是一個常用的進程性能分析工具用來實時查看cpu 內存 io以及上下文切換等性能指標。
場景1 CPU密集型進程
在終端1中運行下面的命令 stress –cpu 1 –timeout 600 模擬cpu使用率100%的場景

在終端2中繼續運行下面的命令：watch –d uptime
大概1-2分鐘以後平均負載逐漸上升到1