1. 基本概念
•上下文切換(Context Switches):如果可運行的線程數大於CPU的數量,那麼OS最終會強行換出正在執行的線程,從而使其他線程能夠使用CPU,它會保存當前運行線程的執行上下文,並重建新調入線程的執行上下文。
•運行隊列(Run Queue ):每個CPU 都維護一個線程的運行隊列。如果CPU 子系統處於高負荷下,那就意味着內核調度將無法及時響應系統請求.導致結果,可運行狀態進程擁塞在運行隊列裏.當運行隊列越來越巨大,進程線程將花費更多的時間獲取被執行.每個處理器應該運行隊列不超過1-3個線程.例子,一個雙核處理器應該運行隊列不要超過6 個線程。
•load :就是指在CPU 隊列中有多少數目的線程,以及其中當前有多少進程線程數目被執行的組合. 安全的load:一般是cpu的個數
•CPU 利用率(CPU Utilization) :CPU 使用的百分比User TimeSystem TimeWait IOIdle。如果一個CPU 被充分使用,利用率分類之間均衡的比例應該是:65% -70% User Time;30% -35% System Time; 0% -5% Idle Time
•中斷(Interrupts) --Devices tell the kernel that they are done processing。例子,當一塊網卡設備遞送網絡數據包或者一塊硬件提供了一次IO 請求.
2. CPU監測
• 查看cpu信息: cat /proc/cpuinfo
•獲取cpu個數: grep 'processor' /proc/cpuinfo | wc -l
•uptime
顯示系統已經運行了多長時間,它依次顯示下列信息:現在時間、系統已經運行了多長時間、目前有多少登陸用戶、系統在過去的1分鐘、5分鐘和15分鐘內的平均負載。
相關命令:w 顯示目前登入系統的用戶
•vmstat(virtual memory *statistics) :*實時的性能監測工具
r 表示運行隊列(就是說多少個進程真的分配到CPU),當這個值超過了CPU數目,就會出現CPU瓶頸了。這個也和top的負載有關係,一般負載超過了3就比較高,超過了5就高,超過了10就不正常了,服務器的狀態很危險。top的負載類似每秒的運行隊列。如果運行隊列過大,表示你的CPU很繁忙,一般會造成CPU使用率很高。
b 表示阻塞的進程
swpd 虛擬內存已使用的大小
free 空閒的物理內存的大小
buff Linux/Unix系統是用來存儲
cache cache直接用來記憶我們打開的文件,給文件做緩衝
si 每秒從磁盤讀入虛擬內存的大小,如果這個值大於0,表示物理內存不夠用或者內存泄露了,要查找耗內存進程解決掉。
so 每秒虛擬內存寫入磁盤的大小,如果這個值大於0,同上。
bi 塊設備每秒接收的塊數量,這裏的塊設備是指系統上所有的磁盤和其他塊設備,默認塊大小是1024byte
bo 塊設備每秒發送的塊數量,例如我們讀取文件,bo就要大於0。bi和bo一般都要接近0,不然就是IO過於頻繁,需要調整。
in 每秒CPU的中斷次數,包括時間中斷
cs 每秒上下文切換次數,例如我們調用系統函數,就要進行上下文切換,線程的切換,也要進程上下文切換,這個值要越小越好,太大了,要考慮調低線程或者進程的數目,例如在apache和nginx這種web服務器中,我們一般做性能測試時會進行幾千併發甚至幾萬併發的測試,選擇web服務器的進程可以由進程或者線程的峯值一直下調,壓測,直到cs到一個比較小的值,這個進程和線程數就是比較合適的值了。系統調用也是,每次調用系統函數,我們的代碼就會進入內核空間,導致上下文切換,這個是很耗資源,也要儘量避免頻繁調用系統函數。上下文切換次數過多表示你的CPU大部分浪費在上下文切換,導致CPU幹正經事的時間少了,CPU沒有充分利用,是不可取的。
us 用戶CPU時間
sy 系統CPU時間,如果太高,表示系統調用時間長,例如是IO操作頻繁。
id 空閒 CPU時間,一般來說,id + us + sy = 100,一般我認爲id是空閒CPU使用率,us是用戶CPU使用率,sy是系統CPU使用率。
wt 等待IO CPU時間
•TOP:top命令是Linux下常用的性能分析工具,能夠實時顯示系統中各個進程的資源佔用狀況,類似於Windows的任務管理器。
統計信息區:前五行是系統整體的統計信息。
第一行是任務隊列信息,同 uptime 命令的執行結果。
第二、三行爲進程和CPU的信息。當有多個CPU時,這些內容可能會超過兩行。
第四、五行爲內存信息。
•mpstat(Multiprocessor Statistics):不但能查看所有CPU的平均狀況信息,而且能夠查看特定CPU的信息
•sar: 能夠查看歷史數據,也可查看實時
sar -q 查看load狀況
sar -u 查看cpu使用率
查看歷史某一天的,這個很重要可以和以往進行對比
sar -u -f /var/log/sa/sa03