linux iostat 性能初析


      Linux系統中的 iostat是I/O statistics(輸入/輸出統計)的縮寫,iostat工具將對系統的磁盤操作活動進行監視。 
      其特點是彙報磁盤活動統計情況,同時也會彙報出CPU使用情況。同vmstat一樣,iostat也有一個弱點,就是它不能對某個進程進行深入分析,僅對系統的整體情況進行分析。iostat屬於sysstat軟件包。可以用yum install sysstat 直接安裝。

命令格式: 
iostat[參數][時間][次數]

命令參數:

  • -C 顯示CPU使用情況

  • -d 顯示磁盤使用情況

  • -k 以 KB 爲單位顯示

  • -m 以 M 爲單位顯示

  • -N 顯示磁盤陣列(LVM) 信息

  • -n 顯示NFS 使用情況

  • -p[磁盤] 顯示磁盤和分區的情況

  • -t 顯示終端和CPU的信息

  • -x 顯示詳細信息

  • -V 顯示版本信息


iostat 命令

下圖是 每隔 10秒顯示一次, 一直顯示。

wKioL1hGCGeAtuq7AABtcKUtgTE275.png-wh_50


CPU 屬性值

  • %user:CPU處在用戶模式下的時間百分比。

  • %nice:CPU處在帶NICE值的用戶模式下的時間百分比。

  • %system:CPU處在系統模式下的時間百分比。

  • %iowait:CPU等待輸入輸出完成時間的百分比。

  • %steal:管理程序維護另一個虛擬處理器時,虛擬CPU的無意識等待時間百分比。

  • %idle:CPU空閒時間百分比。

備註:

  • 如果%iowait的值過高,表示硬盤存在I/O瓶頸,

  • %idle值高,表示CPU較空閒,

  • 如果%idle值高但系統響應慢時,有可能是CPU等待分配內存,此時應加大內存容量。

  • %idle值如果持續低於10,那麼系統的CPU處理能力相對較低,表明系統中最需要解決的資源是CPU。 

磁盤每一列的含義如下:

  • rrqm/s:     每秒進行 merge 的讀操作數目。 即 rmerge/s

  • wrqm/s:    每秒進行 merge 的寫操作數目。即 wmerge/s

  • r/s:          每秒完成的讀 I/O 設備次數。 即 rio/s

  • w/s:         每秒完成的寫 I/O 設備次數。即 wio/s

  • rsec/s:      每秒讀扇區數。即 rsect/s

  • wsec/s:     每秒寫扇區數。即 wsect/s

  • rkB/s:        每秒讀 K 字節數。是 rsect/s 的一半,因爲扇區大小爲 512 字節

  • wkB/s:       每秒寫 K 字節數。是 wsect/s 的一半

  • avgrq-sz:   平均每次設備 I/O 操作的數據大小(扇區)

  • avgqu-sz:   平均 I/O 隊列長度。

  • await:        平均每次設備 I/O 操作的等待時間(毫秒)

  • svctm:       平均每次設備 I/O 操作的服務時間(毫秒)

  • %util:        一秒中有百分之多少的時間用於 I/O 操作,或者說一秒中有多少時間 I/O 隊列是非空的。


備註:

  • 如果 %util 接近 100%,說明產生的I/O請求太多,I/O系統已經滿負荷,該磁盤可能存在瓶頸。

  • 如果 svctm 比較接近 await,說明 I/O 幾乎沒有等待時間;

  • 如果 await 遠大於 svctm,說明I/O 隊列太長,io響應太慢,則需要進行必要優化。

  • 如果avgqu-sz比較大,也表示有當量io在等待。

 

怎麼理解這裏的字段呢?

以超市結賬的例子來說明。 我們在超市排隊結賬時,怎麼決定該去哪個收銀臺呢? 首先是看每個收銀臺的排隊人數,5 個人總比 20 人要快吧?

除了數人頭,我們也常常看看前面人購買的東西多少,如果前面有個採購了一星期食品的大媽, 那麼可以考慮換個隊排了。

還有就是收銀員的速度了,如果碰上了連錢都點不清楚的新手,那就有的等了。

另外,時機也很重要,可能 5 分鐘前還人滿爲患的收款臺,現在已是人去樓空,這時候交款就很爽啊,當然,前提是那過去的 5 分鐘裏所做的事情比排隊要有意義(不過我還沒發現什麼事情比排隊還無聊的)。

I/O 系統也和超市排隊有很多類似之處: 

  • r/s+w/s        類似於交款人的總數

  • avgqu-sz(平均隊列長度):      類似於單位時間裏平均排隊的人數

  • svctm(平均服務時間)          類似於收銀員的收款速度

  • await(平均等待時間)          類似於平均每人的等待時間

  • avgrq-sz(平均 IO 數據)        類似於平均每人所買的東西多少

  • %util(磁盤 IO 使用率)         類似於收款臺前有人排隊的時間比例。

我們可以根據這些數據分析出 I/O 請求的模式,以及 I/O 的速度和響應時間:

  • 如果%util 接近 100%,說明產生的 I/O 請求太多,I/O 系統已經滿負荷,該磁盤可能存在瓶頸。

  • svctm 的大小一般和磁盤性能有關,CPU/內存的負荷也會對其有影響,請求過多也會間接導致 svctm的增加。

  • await 的大小一般取決於服務時間(svctm) 以及 I/O 隊列的長度和 I/O 請求的發出模式。一般來說 svctm < await,因爲同時等待的請求的等待時間被重複計算了。如果 svctm 比較接近 await,說明 I/O 幾乎沒有等待時間

  • 如果 await 遠大於 svctm,說明 I/O 隊列太長,應用得到的響應時間變慢

  • 隊列長度(avgqu-sz)也可作爲衡量系統 I/O 負荷的指標,但由於 avgqu-sz 是按照單位時間的平均值,所以不能反映瞬間的 I/O 洪水。

  • 如果響應時間超過了用戶可以容許的範圍,這時可以考慮更換更快的磁盤,調整內核 elevator 算法,優化應用,或者升級 CPU。

  • 如果%util 很大,而 rkB/s 和 wkB/s 很小,一般是因爲磁盤存在較多的磁盤隨機讀寫,最好把磁盤隨機讀寫優化成順序讀寫。

 


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章