Linux系統性能調優之性能分析

 性能調優的第一步是性能分析,下面從性能分析着手進行一些介紹,尤其對Linux性能分析工具vmstat的用法和實踐進行詳細介紹。

  1、性能分析的目的

  1)找出系統性能瓶頸(包括硬件瓶頸和軟件瓶頸);

  2)提供性能優化的方案(升級硬件?改進系統系統結構?);

  3)達到合理的硬件和軟件配置;

  4)使系統資源使用達到最大的平衡。(一般情況下系統良好運行的時候恰恰各項資源達到了一個平衡體,任何一項資源的過渡使用都會造成平衡體系破壞,從而造成系統負載極高或者響應遲緩。比如CPU過渡使用會造成大量進程等待CPU資源,系統響應變慢,等待會造成進程數增加,進程增加又會造成內存使用增加,內存耗盡又會造成虛擬內存使用,使用虛擬內存又會造成磁盤IO增加和CPU開銷增加)

  2、影響性能的因素

  1)CPU(cpu的速度與性能很大一部分決定了系統整體的性能,是否使用SMP)

  2)內存(物理內存不夠時會使用交換內存,使用swap會帶來磁盤I0和cpu的開銷)

  3)硬盤(存儲系統)

  a、Raid技術使用(RAID0,RAID1,RAID5,RAID0+1)

  b、小文件讀寫瓶頸是磁盤的尋址(tps),大文件讀寫的性能瓶頸是帶寬

  c、Linux可以利用空閒內存作文件系統訪問的cache,因此係統內存越大存儲系統的性能也越好

  4)網絡帶寬。

  3、性能分析的步驟

  1)對資源的使用狀況進行長期的監控和數據採集(nagios、cacti)

  2)使用常見的性能分析工具(vmstat、top、free、iostat等)

  3)經驗積累

  a、應用程序設計的缺陷和數據庫查詢的濫用最有可能導致性能問題

  b、性能瓶頸可能是因爲程序差/內存不足/磁盤瓶頸,但最終表現出的結果就是CPU耗盡,系統負載極高,響應遲緩,甚至暫時失去響應

  c、物理內存不夠時會使用交換內存,使用swap會帶來磁盤I0和cpu的開銷

  d、可能造成cpu瓶頸的問題:頻繁執Perl,php,java程序生成動態web;數據庫查詢大量的where子句、order by/group by排序……

  e、可能造成內存瓶頸問題:高併發用戶訪問、系統進程多,java內存泄露……

  f、可能造成磁盤IO瓶頸問題:生成cache文件,數據庫頻繁更新,或者查詢大表……

  4、vmstat詳細介紹

  vmstat是一個很全面的性能分析工具,可以觀察到系統的進程狀態、內存使用、虛擬內存使用、磁盤的IO、中斷、上下文切換、CPU使用等。對於 Linux 的性能分析,100%理解 vmstat 輸出內容的含義,並能靈活應用,那對系統性能分析的能力就算是基本掌握了。

  下面是vmstat命令的輸出結果:

  [root@monitor-www ~]# vmstat 1 5

  procs         —————memory—————      ——swap—— ——io——  ——system——   ——cpu——

  r   b    swpd     free       buff      cache   si    so    bi     bo      in    cs    us sy  id wa st

  1   0    84780    909744   267428    1912076   0     0     20     94       0     0     2  1  95  1  0

  1   2    84780    894968   267428    1912216   0     0      0   1396    2301 11337     8  3  89  0  0

  1   0    84780    900680   267428    1912340   0     0     76   1428    1854  8082     7  2  90  0  0

  1   0    84780    902544   267432    1912548   0     0    116    928    1655  7502     7  2  92  0  0

  2   0    84780    900076   267432    1912948   0     0    180    904    1963  8703    10  3  87  0  0

  對輸出解釋如下:

  1)procs

  a.r列表示運行和等待CPU時間片的進程數,這個值如果長期大於系統CPU個數,就說明CPU資源不足,可以考慮增加CPU;

  b.b列表示在等待資源的進程數,比如正在等待I/O或者內存交換等。

  2)memory

  a、swpd列表示切換到內存交換區的內存數量(以KB爲單位)。如果swpd的值不爲0或者比較大,而且si、so的值長期爲0,那麼這種情況一般不用擔心,不會影響系統性能;

  b、free列表示當前空閒的物理內存數量(以KB爲單位);

  c、buff列表示buffers cache的內存數量,一般對塊設備的讀寫才需要緩衝;

  d、cache列表示page cached的內存數量,一般作文件系統的cached,頻繁訪問的文件都會被cached。如果cached值較大,就說明cached文件數較多。如果此時IO中的bi比較小,就說明文件系統效率比較好。

  3)swap

  a、si列表示由磁盤調入內存,也就是內存進入內存交換區的數量;

  b、so列表示由內存調入磁盤,也就是內存交換區進入內存的數量

  c、一般情況下,si、so的值都爲0,如果si、so的值長期不爲0,則表示系統內存不足,需要考慮是否增加系統內存。

  4)IO

  a、bi列表示從塊設備讀入的數據總量(即讀磁盤,單位KB/秒)

  b、bo列表示寫入到塊設備的數據總量(即寫磁盤,單位KB/秒)

  這裏設置的bi+bo參考值爲1000,如果超過1000,而且wa值比較大,則表示系統磁盤IO性能瓶頸。

  5)system

  a、in列表示在某一時間間隔中觀察到的每秒設備中斷數;

  b、cs列表示每秒產生的上下文切換次數。

  上面這兩個值越大,會看到內核消耗的CPU時間就越多。

  6)CPU

  a、us列顯示了用戶進程消耗CPU的時間百分比。us的值比較高時,說明用戶進程消耗的CPU時間多,如果長期大於50%,需要考慮優化程序啥的。

  b、sy列顯示了內核進程消耗CPU的時間百分比。sy的值比較高時,就說明內核消耗的CPU時間多;如果us+sy超過80%,就說明CPU的資源存在不足。

  c、id列顯示了CPU處在空閒狀態的時間百分比;

  d、wa列表示IO等待所佔的CPU時間百分比。wa值越高,說明IO等待越嚴重。如果wa值超過20%,說明IO等待嚴重。

  e、st列一般不關注,虛擬機佔用的時間百分比。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章