JVM從入門到精通(八):JVM調優實戰

案例1:系統CPU經常100%,如何調優?

推理過程是:CPU100%,那麼一定有線程在佔用系統資源,所以

  1. 找出哪個進程cpu高(top命令)
  2. 該進程中的哪個線程cpu高(top -Hp)
  3. 如果是java程序,導出該線程的堆棧 (jstack命令)
  4. 查找哪個方法(棧幀)消耗時間,哪個方法調用的哪個方法 (jstack),然後去看這個方法的代碼
  5. 工作線程佔比高 / 垃圾回收線程佔比高?
案例2:系統內存飆高,如何查找問題?
  1. 導出堆內存 (jmap)
  2. 分析 (jhat jvisualvm mat jprofiler … )

如何監控JVM?

可以使用 jstat jvisualvm jprofiler arthas top…等等

一個案例理解常用工具

  1. 測試代碼:
   package com.mashibing.jvm.gc;
   
   import java.math.BigDecimal;
   import java.util.ArrayList;
   import java.util.Date;
   import java.util.List;
   import java.util.concurrent.ScheduledThreadPoolExecutor;
   import java.util.concurrent.ThreadPoolExecutor;
   import java.util.concurrent.TimeUnit;
   
   /**
    * 從數據庫中讀取信用數據,套用模型,並把結果進行記錄和傳輸
    */
   
   public class T15_FullGC_Problem01 {
   
       private static class CardInfo {
           BigDecimal price = new BigDecimal(0.0);
           String name = "張三";
           int age = 5;
           Date birthdate = new Date();
   
           public void m() {}
       }
   
       private static ScheduledThreadPoolExecutor executor = new ScheduledThreadPoolExecutor(50,
               new ThreadPoolExecutor.DiscardOldestPolicy());
   
       public static void main(String[] args) throws Exception {
           executor.setMaximumPoolSize(50);
   
           for (;;){
               modelFit();
               Thread.sleep(100);
           }
       }
   
       private static void modelFit(){
           List<CardInfo> taskList = getAllCardInfo();
           taskList.forEach(info -> {
               // do something
               executor.scheduleWithFixedDelay(() -> {
                   //do sth with info
                   info.m();
   
               }, 2, 3, TimeUnit.SECONDS);
           });
       }
   
       private static List<CardInfo> getAllCardInfo(){
           List<CardInfo> taskList = new ArrayList<>();
   
           for (int i = 0; i < 100; i++) {
               CardInfo ci = new CardInfo();
               taskList.add(ci);
           }
   
           return taskList;
       }
   }
  
  1. java -Xms200M -Xmx200M -XX:+PrintGC com.mashibing.jvm.gc.T15_FullGC_Problem01

  2. 一般是運維團隊首先受到報警信息(CPU過高, Memory佔比大…然後你纔去查原因)

  3. top命令觀察到問題:內存不斷增長 CPU佔用率居高不下

  4. top -Hp 觀察進程中的線程,哪個線程CPU和內存佔比高

  5. jps定位具體java進程
    jstack 定位線程狀況,重點關注:WAITING BLOCKED
    e.g.
    waiting on <0x0000000088ca3310> (a java.lang.Object)
    假如有一個進程中100個線程,很多線程都在waiting on <xx> ,一定要找到是哪個線程持有這把鎖
    怎麼找?搜索jstack dump的信息,找 ,看哪個線程持有這把鎖RUNNABLE
    作業:
    1: 寫一個死鎖程序,用jstack觀察
    2: 寫一個程序,一個線程持有鎖不釋放,其他線程等待

  6. 爲什麼阿里規範裏規定,線程的名稱(尤其是線程池)都要寫有意義的名稱?爲了方便定位!
    怎麼樣自定義線程池裏的線程名稱?(自定義ThreadFactory)

  7. jinfo pid瞭解即可,用處不是特別大

  8. jstat -gc 動態觀察gc情況 / 閱讀GC日誌發現頻繁GC / arthas觀察 / jconsole/jvisualVM/ Jprofiler(最好用,收費)
    jstat -gc 4655 500 : 每個500個毫秒打印GC的情況
    如果面試官問你是怎麼定位OOM問題的?如果你回答用圖形界面(錯誤)
    1:已經上線的系統不用圖形界面用什麼?(cmdline arthas)
    2:圖形界面到底用在什麼地方?測試!測試的時候進行監控!(壓測觀察)

  9. jmap - histo 4655 | head -20,查找有多少對象產生,這個命令對線上系統影響不大。
    jmap -dump:format=b,file=xxx pid手動導出堆文件,這個命令不能線上用。
    線上系統,內存特別大,jmap執行期間會對進程產生很大影響,甚至卡頓(電商不適合),你可以這麼說:
    1:設定了參數HeapDump,OOM的時候會自動產生堆轉儲文件
    2:很多服務器備份(高可用),先把這臺機器隔離開,停掉這臺服務器對其他服務器不影響
    3:在線定位arthas(一般小點兒公司用不到,這樣吹容易露餡兒)

  10. java -Xms20M -Xmx20M -XX:+UseParallelGC -XX:+HeapDumpOnOutOfMemoryError com.mashibing.jvm.gc.T15_FullGC_Problem01

  11. 使用MAT / jhat /jvisualvm 進行dump文件分析
    https://www.cnblogs.com/baihuitestsoftware/articles/6406271.html
    jhat -J-mx512M xxx.dump
    http://192.168.17.11:7000
    拉到最後:找到對應鏈接
    可以使用OQL查找特定問題對象

  12. 找到代碼的問題

實戰

在這裏插入圖片描述top 命令
在這裏插入圖片描述
在這裏插入圖片描述

列出1591進程下的所有線程,重點關注:WAITING BLOCKED
在這裏插入圖片描述
java 日誌
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章