CPU監控

CPU 的佔用主要取決於什麼樣的資源正在 CPU 上面運行，比如拷貝一個文件通常佔用較少 CPU，因爲大部分工作是由 DMA（Direct Memory Access）完成，只是在完成拷貝以後給一箇中斷讓 CPU 知道拷貝已經完成；科學計算通常佔用較多的 CPU，大部分計算工作都需要在 CPU 上完成，內存、硬盤等子系統只做暫時的數據存儲工作。要想監測和理解 CPU 的性能需要知道一些的操作系統的基本知識，比如：中斷、進程調度、進程上下文切換、可運行隊列等。這裏 VPSee 用個例子來簡單介紹一下這些概念和他們的關係，CPU 很無辜，是個任勞任怨的打工仔，每時每刻都有工作在做（進程、線程）並且自己有一張工作清單（可運行隊列），由老闆（進程調度）來決定他該幹什麼，他需要和老闆溝通以便得到老闆的想法並及時調整自己的工作（上下文切換），部分工作做完以後還需要及時向老闆彙報（中斷），所以打工仔（CPU）除了做自己該做的工作以外，還有大量時間和精力花在溝通和彙報上。

CPU 也是一種硬件資源，和任何其他硬件設備一樣也需要驅動和管理程序才能使用，我們可以把內核的進程調度看作是 CPU 的管理程序，用來管理和分配 CPU 資源，合理安排進程搶佔 CPU，並決定哪個進程該使用 CPU、哪個進程該等待。操作系統內核裏的進程調度主要用來調度兩類資源：進程（或線程）和中斷，進程調度給不同的資源分配了不同的優先級，優先級最高的是硬件中斷，其次是內核（系統）進程，最後是用戶進程。每個 CPU 都維護着一個可運行隊列，用來存放那些可運行的線程。線程要麼在睡眠狀態（blocked 正在等待 IO）要麼在可運行狀態，如果 CPU 當前負載太高而新的請求不斷，就會出現進程調度暫時應付不過來的情況，這個時候就不得不把線程暫時放到可運行隊列裏。VPSee 在這裏要討論的是性能監測，上面談了一堆都沒提到性能，那麼這些概念和性能監測有什麼關係呢？關係重大。如果你是老闆，你如何檢查打工仔的效率（性能）呢？我們一般會通過以下這些信息來判斷打工仔是否偷懶：

打工仔接受和完成多少任務並向老闆彙報了（中斷）；

打工仔和老闆溝通、協商每項工作的工作進度（上下文切換）；

打工仔的工作列表是不是都有排滿（可運行隊列）；

打工仔工作效率如何，是不是在偷懶（CPU 利用率）。

現在把打工仔換成 CPU，我們可以通過查看這些重要參數：中斷、上下文切換、可運行隊列、CPU 利用率來監測 CPU 的性能。

底線

上一篇 Linux 性能監測：介紹提到了性能監測前需要知道底線，那麼監測 CPU 性能的底線是什麼呢？通常我們期望我們的系統能到達以下目標：

CPU 利用率，如果 CPU 有 100％利用率，那麼應該到達這樣一個平衡：65％－70％ User Time，30％－35％ System Time，0％－5％ Idle Time；

上下文切換，上下文切換應該和 CPU 利用率聯繫起來看，如果能保持上面的 CPU 利用率平衡，大量的上下文切換是可以接受的；

可運行隊列，每個可運行隊列不應該超過3個線程（每處理器），比如：雙處理器系統的可運行隊列裏不應該超過6個線程。

vmstat

vmstat 是個查看系統整體性能的小工具，小巧、即使在很 heavy 的情況下也運行良好，並且可以用時間間隔採集得到連續的性能數據。

$ vmstat 1

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------

r b swpd free buff cache si so bi bo in cs us sy id wa st

2 1 140 2787980 336304 3531996 0 0 0 128 1166 5033 3 3 70 25 0

0 1 140 2788296 336304 3531996 0 0 0 0 1194 5605 3 3 69 25 0

0 1 140 2788436 336304 3531996 0 0 0 0 1249 8036 5 4 67 25 0

0 1 140 2782688 336304 3531996 0 0 0 0 1333 7792 6 6 64 25 0

3 1 140 2779292 336304 3531992 0 0 0 28 1323 7087 4 5 67 25 0

參數介紹：

r，可運行隊列的線程數，這些線程都是可運行狀態，只不過 CPU 暫時不可用；

b，被 blocked 的進程數，正在等待 IO 請求；

in，被處理過的中斷數

cs，系統上正在做上下文切換的數目

us，用戶佔用 CPU 的百分比

sy，內核和中斷佔用 CPU 的百分比

wa，所有可運行的線程被 blocked 以後都在等待 IO，這時候 CPU 空閒的百分比

id，CPU 完全空閒的百分比

舉兩個現實中的例子來實際分析一下：

$ vmstat 1

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------

r b swpd free buff cache si so bi bo in cs us sy id wa st

4 0 140 2915476 341288 3951700 0 0 0 0 1057 523 19 81 0 0 0

4 0 140 2915724 341296 3951700 0 0 0 0 1048 546 19 81 0 0 0

4 0 140 2915848 341296 3951700 0 0 0 0 1044 514 18 82 0 0 0

4 0 140 2915848 341296 3951700 0 0 0 24 1044 564 20 80 0 0 0

4 0 140 2915848 341296 3951700 0 0 0 0 1060 546 18 82 0 0 0

從上面的數據可以看出幾點：

interrupts（in）非常高，context switch（cs）比較低，說明這個 CPU 一直在不停的請求資源；

system time（sy）一直保持在 80％以上，而且上下文切換較低（cs），說明某個進程可能一直霸佔着 CPU（不斷請求資源）；

run queue（r）剛好在4個。

$ vmstat 1

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------

r b swpd free buff cache si so bi bo in cs us sy id wa st

14 0 140 2904316 341912 3952308 0 0 0 460 1106 9593 36 64 1 0 0

17 0 140 2903492 341912 3951780 0 0 0 0 1037 9614 35 65 1 0 0

20 0 140 2902016 341912 3952000 0 0 0 0 1046 9739 35 64 1 0 0

17 0 140 2903904 341912 3951888 0 0 0 76 1044 9879 37 63 0 0 0

16 0 140 2904580 341912 3952108 0 0 0 0 1055 9808 34 65 1 0 0

從上面的數據可以看出幾點：

context switch（cs）比 interrupts（in）要高得多，說明內核不得不來回切換進程；

進一步觀察發現 system time（sy）很高而 user time（us）很低，而且加上高頻度的上下文切換（cs），說明正在運行的應用程序調用了大量的系統調用（system call）；

run queue（r）在14個線程以上，按照這個測試機器的硬件配置（四核），應該保持在12個以內。

mpstat

mpstat 和 vmstat 類似，不同的是 mpstat 可以輸出多個處理器的數據，下面的輸出顯示 CPU1 和 CPU2 基本上沒有派上用場，系統有足夠的能力處理更多的任務。

$ mpstat -P ALL 1

Linux 2.6.18-164.el5 (vpsee) 11/13/2009

02:24:33 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s

02:24:34 PM all 5.26 0.00 4.01 25.06 0.00 0.00 0.00 65.66 1446.00

02:24:34 PM 0 7.00 0.00 8.00 0.00 0.00 0.00 0.00 85.00 1001.00

02:24:34 PM 1 13.00 0.00 8.00 0.00 0.00 0.00 0.00 79.00 444.00

02:24:34 PM 2 0.00 0.00 0.00 100.00 0.00 0.00 0.00 0.00 0.00

02:24:34 PM 3 0.99 0.00 0.99 0.00 0.00 0.00 0.00 98.02 0.00

如何查看某個程序、進程佔用了多少 CPU 資源呢？下面是 Firefox 在 VPSee 的一臺 Sunray 服務器上的運行情況，當前只有2個用戶在使用 Firefox：

$ while :; do ps -eo pid,ni,pri,pcpu,psr,comm | grep 'firefox'; sleep 1; done

PID NI PRI %CPU PSR COMMAND

7252 0 24 3.2 3 firefox

9846 0 24 8.8 0 firefox

7252 0 24 3.2 2 firefox

9846 0 24 8.8 0 firefox

7252 0 24 3.2 2 firefox

物理機開關機

linux內存

我的友情鏈接

linux內存

CPU監控

LVM2

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結