監控項

每秒查詢率QPS是對一個特定的查詢服務器在規定時間內所處理流量多少的衡量標準。在因特網上,作爲域名系統服務器的機器的性能經常用每秒查詢率來衡量。
即每秒的響應請求數,也即是最大吞吐能力。
原理:每天80%的訪問集中在20%的時間裏,這20%時間叫做峯值時間
公式:( 總PV數 80% ) / ( 每天秒數 20% ) = 峯值時間每秒請求數(QPS)
機器:峯值時間每秒QPS / 單臺機器的QPS = 需要的機器
問:每天300w PV 的在單臺機器上,這臺機器需要多少QPS?
答:( 3000000 0.8 ) / (86400 0.2 ) = 139 (QPS)
問:如果一臺機器的QPS是58,需要幾臺機器來支持?
答:139 / 58 = 3

壓測:
合理的併發,且保證qps在一定範圍沒有明顯下降。
一、什麼是系統平均負載(Load average)
在Linux系統中,uptime、w、top等命令都會有系統平均負載load average的輸出,那麼什麼是系統平均負載呢?

  系統平均負載被定義爲在特定時間間隔內運行隊列中的平均進程樹。如果一個進程滿足以下條件則其就會位於運行隊列中:
特定時間間隔內運行隊列中的平均進程數
好象還不夠明白:就是進程隊列的長度,有多少個進程在排隊等待運行

(通俗的說,運行隊列中的進程樹正在消耗內存和CPU資源,從而能算出消耗資源的比例。)

- 它沒有在等待I/O操作的結果

  - 它沒有主動進入等待狀態(也就是沒有調用'wait')

  - 沒有被停止(例如:等待終止)

例如:
(1)# uptime
7:51pm up 2 days, 5:43, 2 users, load average: 8.13, 5.90, 4.94

命令輸出的最後內容表示在過去的1、5、15分鐘內運行隊列中的平均進程數量。
一般來說只要每個CPU的當前活動進程數不大於3那麼系統的性能就是良好的,如果每個CPU的任務數大於5,那麼就表示這臺機器的性能有嚴重問題。對於上面的例子來說,假設系統有兩個CPU,那麼其每個CPU的當前任務數爲:8.13/2=4.065。這表示該系統的性能是可以接受的。

(2)# cat /proc/loadavg
0.27 0.36 0.37 4/83 4828/

前三個數字大家都知道,是1、5、15分鐘內的平均進程數(有人認爲是系統負荷的百分比,其實不然,有些時候可以看到200甚至更多)。後面兩個呢,一個的分子是正在運行的進程數,分母是進程總數;另一個是最近運行的進程ID號。

(3)# w
功能說明:顯示目前登入系統的用戶信息。
語  法:w [-fhlsuV][用戶名稱]
補充說明:執行這項指令可得知目前登入系統的用戶有那些人,以及他們正在執行的程序。單獨執行w
指令會顯示所有的用戶,您也可指定用戶名稱,僅顯示某位用戶的相關信息。
參  數:
 -f  開啓或關閉顯示用戶從何處登入系統。
 -h  不顯示各欄位的標題信息列。
 -l  使用詳細格式列表,此爲預設值。
 -s  使用簡潔格式列表,不顯示用戶登入時間,終端機階段作業和程序所耗費的CPU時間。
 -u  忽略執行程序的名稱,以及該程序耗費CPU時間的信息。
 -V  顯示版本信息。

(4)# top
功能說明:顯示,管理執行中的程序。
語  法:top [bciqsS][d <間隔秒數>][n <執行次數>]
補充說明:執行top指令可顯示目前正在系統中執行的程序,並通過它所提供的互動式界面,用熱鍵加以管理。
參  數:
 b  使用批處理模式。
 c  列出程序時,顯示每個程序的完整指令,包括指令名稱,路徑和參數等相關信息。
 d<間隔秒數>  設置top監控程序執行狀況的間隔時間,單位以秒計算。
 i  執行top指令時,忽略閒置或是已成爲Zombie的程序。
 n<執行次數>  設置監控信息的更新次數。
 q  持續監控程序執行的狀況。
 s  使用保密模式,消除互動模式下的潛在危機。
 S  使用累計模式,其效果類似ps指令的"-S"參數。

第一行:
10:01:23 — 當前系統時間
126 days, 14:29 — 系統已經運行了126天14小時29分鐘(在這期間沒有重啓過)
2 users — 當前有2個用戶登錄系統
load average: 1.15, 1.42, 1.44 — load average後面的三個數分別是1分鐘、5分鐘、15分鐘的負載情況。
load average數據是每隔5秒鐘檢查一次活躍的進程數,然後按特定算法計算出的數值。如果這個數除以邏輯CPU的數量,結果高於5的時候就表明系統在超負荷運轉了。
第二行:
Tasks — 任務(進程),系統現在共有183個進程,其中處於運行中的有1個,182個在休眠(sleep),stoped狀態的有0個,zombie狀態(殭屍)的有0個。
第三行:cpu狀態
6.7% us — 用戶空間佔用CPU的百分比。
0.4% sy — 內核空間佔用CPU的百分比。
0.0% ni — 改變過優先級的進程佔用CPU的百分比
92.9% id — 空閒CPU百分比
0.0% wa — IO等待佔用CPU的百分比
0.0% hi — 硬中斷(Hardware IRQ)佔用CPU的百分比
0.0% si — 軟中斷(Software Interrupts)佔用CPU的百分比
第四行:內存狀態
8306544k total — 物理內存總量(8GB)
7775876k used — 使用中的內存總量(7.7GB)
530668k free — 空閒內存總量(530M)
79236k buffers — 緩存的內存量 (79M)
第五行:swap交換分區
2031608k total — 交換區總量(2GB)
2556k used — 使用的交換區總量(2.5M)
2029052k free — 空閒交換區總量(2GB)
4231276k cached — 緩衝的交換區總量(4GB)
第七行以下:各進程(任務)的狀態監控
PID — 進程id
USER — 進程所有者
PR — 進程優先級
NI — nice值。負值表示高優先級,正值表示低優先級
VIRT — 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
RES — 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
SHR — 共享內存大小,單位kb
S — 進程狀態。D=不可中斷的睡眠狀態 R=運行 S=睡眠 T=跟蹤/停止 Z=殭屍進程
%CPU — 上次更新到現在的CPU時間佔用百分比
%MEM — 進程使用的物理內存百分比
TIME+ — 進程使用的CPU時間總計,單位1/100秒
COMMAND — 進程名稱(命令名/命令行)

多U多核CPU監控
在top基本視圖中,按鍵盤數字“1”,可監控每個邏輯CPU的狀況:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章