常用監控指標及調優步驟

原創

2020-06-16 12:45

診斷性能問題，需要清楚監控的關鍵指標，以此輔助試驗診斷，最後驗證推測。

常用監控的關鍵指標

通常情況下，性能測試監控指標主要分爲：資源指標和系統指標。

資源指標：

CPU使用率：指單位時間內進程使用cpu時間的百分比，這是對一個時間段內CPU使用狀況的統計，通過這個指標可以看出在某一個時間段內CPU被佔用的情況，如果被佔用時間很高，那麼就需要考慮CPU是否已經處於超負荷運作，長期超負荷運作對於機器本身來說是一種損害，因此必須將CPU的利用率控制在一定的比例下，以保證機器的正常運作。，長時間高負載的情況下，一般可接受上限不超過75%。

內存佔用率：一般可接受上限不超過75%。

load average(linux)：是在一段時間內CPU正在處理以及等待CPU處理的進程數之和的統計信息，也就是CPU使用隊列的長度的統計信息。一般可接受上限不超過系統核心數的2倍。查看CPU core 命令：grep 'model name' /proc/cpuinfo | wc -l

磁盤I/O: 磁盤主要用於存取數據，因此當說到IO操作的時候，就會存在兩種相對應的操作，存數據的時候對應的是寫IO操作，取數據的時候對應的是是讀IO操作，一般使用% Disk Time（磁盤用於讀寫操作所佔用的時間百分比）度量磁盤讀寫性能。

網絡帶寬：一般使用計數器Bytes Total/sec來度量，Bytes Total/sec表示爲發送和接收字節的速率，包括幀字符在內。判斷網絡連接速度是否是瓶頸，可以用該計數器的值和目前網絡的帶寬比較。

系統指標：

TPS：每秒鐘系統能夠處理的交易或事務的數量。它是衡量系統處理能力的重要指標，TPS應該是一個比較平穩的曲線，而不是上下波動。

平均響應時間：系統處理事務的響應時間的平均值。事務的響應時間是從客戶端提交訪問請求到客戶端接收到服務器響應所消耗的時間。對於系統快速響應類頁面，一般簡單業務處理不超過3秒，複雜業務處理不超過5秒。對於接口，要求的事務處理能力比較高，響應時間就更短

事務失敗率：性能測試中，定義事務用於度量一個或者多個業務流程的性能指標，如用戶登錄、保存訂單、提交訂單操作均可定義爲事務。事務失敗率指在性能測試中失敗的事務與事務總數的百分比，對於要求很高的事務，要求失敗率爲0%，一般的事務，失敗率應控制在0.1%以內。

確定清晰的性能目標，並按優先級排列。

利用科學的測試工具對應用程序進行測試，並記錄測試結果。

把分佈式系統拆分成組件：Web層、業務層、集成層、以及網絡傳輸時間，分別進行調優。

有系統的科學調優

遵循一定的程序：測試性能→找出瓶頸→假設造成瓶頸的因素→測試假設是否成立→修改應用→再次測試性能。

確定影響性能的因素：CPU、Memory還是IO。

找出主要的瓶頸，首先解決最容易的，再重複測試。

一次修改一個瓶頸，不要對不需要的地方進行調優。

提高CPU性能：更快的代碼、SQL，更好的算法，減少短期生存的對象。

提高內存性能：減少或減小長期生存的對象。

提高IO性能：重新設計應用，減少IO的交互。

優化完成之後，進行QA測試。

在代碼中記錄優化的地方，並對舊代碼進行註釋。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

阿里雲 MaxCompute 2020-10 月刊

【10月新功能發佈】 1、MaxCompute 支持 sort by 不帶 distribute by MaxCompute 支持 sort by 不帶 distribute by，提供數據重排的解決方案，提高SQL執行的過濾性能。適用客

2020-11-09 12:19:53

數據湖 VS 數據倉庫之爭？阿里提出大數據架構新概念：湖倉一體

隨着近幾年數據湖概念的興起，業界對於數據倉庫和數據湖的對比甚至爭論就一直不斷。有人說數據湖是下一代大數據平臺，各大雲廠商也在紛紛的提出自己的數據湖解決方案，一些雲數倉產品也增加了和數據湖聯動的特性。但是數據倉庫和數據湖的區別到底是什麼，是技

雲棲號資訊小哥

2020-10-15 15:34:46

Serverless Spark的彈性利器 - EMR Shuffle Service

背景與動機計算存儲分離下的剛需計算存儲分離是雲原生的重要特徵。通常來講，計算是CPU密集型，存儲是IO密集型，他們對於硬件配置的需求是不同的。在傳統計算存儲混合的架構中，爲了兼顧計算和存儲，CPU和存儲設備都不能太差，因此犧牲了靈活性，

雲棲號資訊小哥

2020-09-28 14:28:49

數據湖構建服務搭配Delta Lake玩轉CDC實時入湖

什麼是CDC Change Data Capture(CDC)用來跟蹤捕獲數據源的數據變化，並將這些變化同步到目標存儲(如數據湖或數據倉庫)，用於數據備份或後續分析，同步過程可以是分鐘/小時/天等粒度，也可以是實時同步。CDC方案分爲侵入式

雲棲號資訊小哥

2020-09-27 14:01:53

雲原生計算引擎挑戰與解決方案

雲原生背景介紹與思考圖一是基於ECS底座的EMR架構，這是一套非常完整的開源大數據生態，也是近10年來每個數字化企業必不可少的開源大數據解決方案。主要分爲以下幾層： ECS物理資源層，也就是Iaas層數據接入層，例如實時的Kafka，

雲棲號資訊小哥

2020-09-27 14:01:53

多引擎集成挖掘湖上數據價值

數據湖已經逐步走到了精細化的管理，這意味着原始的計算引擎直接讀寫存儲的方式應當逐步演變爲使用標準方式讀寫數據湖存儲。然而“標準方式”實際上並無業界標準，與具體的計算引擎深度綁定，因此，支持計算引擎的豐富程度也就成了衡量數據湖的一個準則。阿

雲棲號資訊小哥

2020-09-24 16:28:50

數據湖架構，爲什麼需要“湖加速”？

在開源大數據領域，存儲/計算分離已經成爲共識和標準做法，數據湖架構成爲大數據平臺的首要選擇。基於這一範式，大數據架構師需要考慮三件事情：第一，選擇什麼樣的存儲系統做數據湖(湖存儲)？第二，計算和存儲分離後，出現了性能瓶頸，計算如何

雲棲號資訊小哥

2020-09-23 17:34:56

用盡每一寸GPU，阿里雲cGPU容器技術白皮書重磅發佈！

背景雲原生已經成爲業內雲服務的一個趨勢。在雲原生上支持異構計算，這個功能在標準的Docker上已經可以很好的支持了。爲了進一步提高GPU的利用率、避免算力浪費，需要在單個GPU上可以運行多個容器，並且在多個容器間隔離GPU應用，這在標準的

雲棲號資訊小哥

2020-09-21 16:55:50

估值百億獨角獸愛學習教育集團：通過雲原生實踐與時間賽跑

作者：山獵愛學習教育集團的前身爲高思教育，成立於2009年，以中小學課外培訓起家，曾經的定位是K12培訓機構；2014年，愛學習教育集團發力B端市場，目前在2B領域獲得了全國各地辦學機構的廣泛認可，由K12培訓機構升級爲K12教育供給

雲棲號資訊小哥

2020-09-14 15:10:51

mPaaS：全新移動開發平臺，只爲打造性能更優越的App

mPaaS 是源自於支付寶的移動開發平臺，爲移動開發、測試、運營及運維提供雲到端的一站式解決方案。產品能力全面覆蓋「跨端開發框架、研發協同、數字化運營、智能營銷、後端連接」等場景，目前已服務 12306、上海地鐵、廣發銀行、華夏銀行、C

雲棲號資訊小編

2020-09-04 14:13:47

阿里雲原生十年磨劍：讓企業在數字經濟時代煥發生命力

日前，國際知名諮詢機構 Gartner 發佈了最新雲廠商產品評估報告，作爲亞洲唯一入選的雲廠商，阿里雲在計算大類中，以 92.3% 的高得分率拿下全球第一，並且刷新了該項目的歷史最佳成績。本次報告，Gartner 更多關注雲原生領域，比

雲棲號資訊小編

2020-08-31 11:19:52

震驚！Redis 的字符串居然是這樣實現的…

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！之前本人在找工作面試時在Redis相關問題上可栽了跟頭。在面試前按常規套路準備了一下，比如 Redis 的常用5種數據結構，Redis持久化

雲棲號資訊小哥

2020-08-06 12:10:50

一文講透“進程，線程和協程”

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！本文從操作系統原理出髮結合代碼實踐講解了以下內容：什麼是進程，線程和協程？它們之間的關係是什麼？爲什麼說Python中的多線程是僞

雲棲號資訊小哥

2020-08-05 15:37:51

邊緣AI在智能家居人機界面(HMI)中的應用

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！消費者對於改進其便利性、安全性和用戶體驗的進步有着無法滿足的胃口。我們看到，人機界面(human-machine interface，HMI

雲棲號資訊小哥

2020-08-05 13:49:49

物聯網和遠程辦公

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！最近幾個月，遠程辦公幾乎席捲了每個組織。鑑於冠狀病毒大流行病尚未結束，很顯然，那些讓員工在家辦公的企業現在需要採取長期措施。甚至在限制解除並

雲棲號資訊小哥

2020-08-04 13:13:52

24小時熱門文章

最新文章

最新評論文章