[轉帖]流量一樣但爲什麼CPU使用率差別很大

原創

2024-05-06 13:29

https://plantegg.github.io/2024/04/26/%E6%B5%81%E9%87%8F%E4%B8%80%E6%A0%B7%E4%BD%86%E4%B8%BA%E4%BB%80%E4%B9%88CPU%E4%BD%BF%E7%94%A8%E7%8E%87%E5%B7%AE%E5%88%AB%E5%BE%88%E5%A4%A7/

這是我翻到2013年的一篇文章，當時驚動所有公司高人，最後分析得知原因後所有人都跪拜，你要知道那是2013年，正好10年過去了，如果是現在用我們星球的理論去套的話，簡直不要太容易

問題描述

同樣大小內存、同樣的CPU、同樣數量的請求、幾乎可以忽略的io，兩個機器的load卻差異挺大。一個機器的load是12左右，另外一個機器卻是30左右

你可以理解這是兩臺一摸一樣的物理機掛在一個LVS 下，LVS 分發流量絕對均衡

所以要找出爲什麼？

分析

兩臺機器的資源使用率：

//load低、CPU使用率低 的物理機，省略一部分核
Cpu0  : 67.1%us,  1.6%sy,  0.0%ni, 30.6%id,  0.0%wa,  0.0%hi,  0.7%si,  0.0%st
Cpu1  : 64.1%us,  1.6%sy,  0.0%ni, 34.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  : 63.0%us,  1.6%sy,  0.0%ni, 35.4%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  : 60.0%us,  1.3%sy,  0.0%ni, 38.4%id,  0.0%wa,  0.0%hi,  0.3%si,  0.0%st
Cpu4  : 59.8%us,  1.3%sy,  0.0%ni, 37.9%id,  1.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu5  : 56.7%us,  1.0%sy,  0.0%ni, 42.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu6  : 63.4%us,  1.3%sy,  0.0%ni, 34.6%id,  0.0%wa,  0.0%hi,  0.7%si,  0.0%st
Cpu7  : 62.5%us,  2.0%sy,  0.0%ni, 35.5%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu8  : 58.5%us,  1.3%sy,  0.0%ni, 39.5%id,  0.0%wa,  0.0%hi,  0.7%si,  0.0%st
Cpu9  : 55.8%us,  1.6%sy,  0.0%ni, 42.2%id,  0.3%wa,  0.0%hi,  0.0%si,  0.0%st

//load高、CPU使用率高 的物理機，省略一部分核
Cpu0  : 90.1%us,  1.9%sy,  0.0%ni,  7.1%id,  0.0%wa,  0.0%hi,  1.0%si,  0.0%st
Cpu1  : 88.5%us,  2.9%sy,  0.0%ni,  8.0%id,  0.0%wa,  0.0%hi,  0.6%si,  0.0%st
Cpu2  : 90.4%us,  1.9%sy,  0.0%ni,  7.7%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  : 86.9%us,  2.6%sy,  0.0%ni, 10.2%id,  0.0%wa,  0.0%hi,  0.3%si,  0.0%st
Cpu4  : 87.5%us,  1.9%sy,  0.0%ni, 10.2%id,  0.0%wa,  0.0%hi,  0.3%si,  0.0%st
Cpu5  : 87.3%us,  1.9%sy,  0.0%ni, 10.5%id,  0.0%wa,  0.0%hi,  0.3%si,  0.0%st
Cpu6  : 90.4%us,  2.9%sy,  0.0%ni,  6.4%id,  0.0%wa,  0.0%hi,  0.3%si,  0.0%st
Cpu7  : 90.1%us,  1.9%sy,  0.0%ni,  7.6%id,  0.0%wa,  0.0%hi,  0.3%si,  0.0%st
Cpu8  : 89.5%us,  2.6%sy,  0.0%ni,  6.7%id,  0.0%wa,  0.0%hi,  1.3%si,  0.0%st
Cpu9  : 90.7%us,  1.9%sy,  0.0%ni,  7.4%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

可以分析產出爲什麼低，檢查CPU是否降頻、內存頻率是否有差異——檢查結果一致

10年前經過一陣 perf top 看熱點後終於醒悟過來知道得去看 IPC，也就是相同CPU使用率下，其中慢的機器產出低了一半，那麼繼續通過perf看IPC：

可以看到兩臺機器的IPC是 0.3 VS 0.55，和CPU使用率差異基本一致，instructions幾乎一樣(意味着流量一樣，LVS 不背鍋)，但是處理同樣的instructions 用掉的cpu-clock 幾乎差了一倍，這應該是典型的內存時延大了一倍導致的。IPC 大致等於 instrunctions/cpu-clock （IPC：instrunctions per cycles）

經檢查這兩臺物理機都是兩路，雖然CPU型號/內存頻率一致，但是主板間跨Socket的 QPI帶寬差了一倍(主板是兩個不同的服務商提供)。可以通過綁核測試不同Socket/Node 下內存時延來確認這個問題

這是同一臺機器下兩個Socket 的內存帶寬，所以如果跨Socket 內存訪問多了就會導致時延更高、CPU使用率更高

總結

在今天我們看到這種問題就很容易了，但我還是要感嘆一下在入門前簡直太神奇，入門後也不過爾爾，希望你也早點入門。

第一：向CPU要產出，同樣的使用率產出得一樣，不一樣的話肯定是偷懶了，偷懶的直接證據就是 IPC 低了，導致IPC 低最常見的是內存時延高(內存頻率、跨Node/Socket 等，或者內存碎片)；延伸閱讀：性能的本質 IPC ，也是本星球唯二的必讀實驗

第二：測試工具很完善了，lmbench , 怎麼用lmbench 可以看這篇 ; 怎麼使用perf Perf IPC以及CPU性能

，學成後裝逼可以看聽風扇聲音來定位性能瓶頸

我以前說過每個領域都有一些核心知識點，IPC 就是CPU領域的核心知識點，和tcp的rmem/wmem 一樣很容易引導你入門

計算機專業裏非要挑幾個必學的知識點肯定得有計算機組成原理，但計算機組成原理內容太多，都去看也不現實，況且很多過時的東西，那麼我只希望你能記住計算機組成原理裏有個最核心的麻煩：內存牆——CPU 訪問內存太慢導致了內存牆是我們碰到衆多性能問題的最主要、最核心的一個，結合今天這個案例掌握IPC後再來學內存牆，再到理解計算機組成原理就對了，從一個實用的小點入手。

計算機專業裏除掉組成原理(有點高大上，沒那麼接地氣)，另外一個我覺得最有用的是網絡——看着low但是接地氣，問題多，很實用

2011年的文章：

詳解服務器內存帶寬計算和使用情況測量

更好的工具來發現類似問題：https://github.com/intel/numatop

如果你覺得看完對你很有幫助可以通過如下方式找到我

find me on twitter: @plantegg

知識星球：https://t.zsxq.com/0cSFEUh2J

開了一個星球，在裏面講解一些案例、知識、學習方法，肯定沒法讓大家稱爲頂尖程序員(我自己都不是)，只是希望用我的方法、知識、經驗、案例作爲你的墊腳石，幫助你快速、早日成爲一個基本合格的程序員。

爭取在星球內：

養成基本動手能力
擁有起碼的分析推理能力–按我接觸的程序員，大多都是沒有邏輯的
知識上教會你幾個關鍵的知識點

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

[轉帖]流量一樣但爲什麼CPU使用率差別很大

問題描述

分析

總結

詳解服務器內存帶寬計算和使用情況測量

如果你覺得看完對你很有幫助可以通過如下方式找到我

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

[轉帖]JVM內存配置最佳實踐

K8S下應用異常卡頓問題的分析與學習

[轉帖]全網最硬核 JVM 內存解析 - 4.Java 堆內存大小的確認

[轉帖]爲什麼我建議需要定期重建數據量大但是性能關鍵的表

smem的學習

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結