內存溢出,妥妥的名場面;
一、業務背景
對於分佈式架構中的文件服務來說,由於涉及大量的IO流操作,很容易引發JVM的相關異常,尤其是內存溢出的問題;
在最近的一次版本迭代中,真實的業務處理場景和上述幾乎一致,由於在文件服務中添加批量處理的動作,直接喚醒了隱藏許久的BUG,就是最常見的內存溢出;
問題的起因:在word文檔完成內容識別後,轉換爲pdf文件,然後進行頁面分割轉爲一組圖片,在這個複雜並且超長的流程中存在一個數組容器未銷燬;
解決的方式:分析JVM的dump文件,定位OOM問題引發的根本原因,結合文件服務的異常日誌分析,添加資源的釋放動作,從而解決問題;
二、Jdk-Bin目錄
對於相當一部分新手來說,看到JVM的問題都是Bug不知所起一臉懵的,其實這種心態大可不必,從職場幾年的開發經驗上看,JVM的問題大致分爲兩種:
- 開發輕鬆解決:可以升級內存資源或者調整分配,又或者對程序優化,完成相關資源的管理和釋放,這是最常用的手段;
- 輕鬆解決開發:由於經驗不足,程序出現重大BUG導致JVM異常,進而引起系列的連鎖反應,這種不會絕地反彈,只有一地雞毛;
在解決常規的JVM異常時,通常依賴JDK中基礎工具即可完成問題的定位,從而進行分析和解決,不過這些需要對基礎工具熟練使用纔行,而很多JDK自身的能力又是經常被忽略的;
在jdk的bin目錄中,有很多自帶工具可以用於對JVM的分析;
上述是基於jdk1.8的目錄,裏面有很多開發經常用到命令,下面圍繞一個微服務的啓動和運行,來看看基於JDK中自帶JVM工具的用法;
三、命令行工具
1、jps命令
jps:虛擬機進程狀態工具,該命令在Java環境部署和服務啓動查看時經常用到,首先在本地啓動一個facade門面微服務,然後在命令行中執行查詢;
jps
:命令默認輸出的是進程ID和應用主類的名稱;-l
:輸出進程ID和應用主類的完整路徑;-v
:輸出向jvm傳遞的參數,此處展示爲idea中顯式配置的VM-options參數,其他內容自行查看即可;-m
:輸出向main方法傳遞的參數,服務啓動前可以在idea的Program-arguments配置;
$ jps
1281 FacadeApp
$ jps -l
1281 com.explore.facade.FacadeApp
$ jps -v
1281 FacadeApp -Xms128m -Xmx256m -XX:MaxNewSize=256m -XX:MaxPermSize=256m
$ jps -m
1281 FacadeApp hello,main-method
2、jinfo命令
jinfo:在命令後面帶pid進程號,可以輸出指定進程的配置信息,在應用啓動時通常不會指定過多的配置參數,就可以使用該命令查詢很多參數的默認值;該命令還可以在運行時動態調整部分參數,只是很少被使用;
$ jinfo 1281 # 只粘貼個別參數
Java System Properties: # 系統參數
java.runtime.version=1.8.0_144-b01
file.encoding=UTF-8
sun.java.command=com.explore.facade.FacadeApp hello,main-method
VM Flags: # 虛擬機參數
-XX:InitialHeapSize=134217728 -XX:MaxHeapSize=268435456 -XX:MaxNewSize=267911168
VM Arguments: # 運行時參數
jvm_args: -Xms128m -Xmx256m -XX:MaxNewSize=256m -XX:MaxPermSize=256m
java_command: com.explore.facade.FacadeApp hello,main-method
$ jinfo -sysprops 1281 # 只輸出【Java System Properties】參數
$ jinfo -flags 1281 # 只輸出【VM Flags】參數
3、jstat命令
jstat:以指定的頻率輸出JVM的監控指標,下述命令輸出內存佔用和GC相關信息,每隔3秒輸出一次,連續打印5次;由於這裏只是啓動一個簡單的微服務,沒有執行業務邏輯,所以各項指標比較平穩;
$ jstat -gcutil 1281 3000 5
S0 S1 E O M CCS YGC YGCT FGC FGCT CGC CGCT GCT
0.00 0.00 57.97 64.16 92.82 88.75 3 0.028 9 0.516 - - 0.544
0.00 0.00 57.97 64.16 92.82 88.75 3 0.028 9 0.516 - - 0.544
該命令是比較常用的,這裏各項指標的統計邏輯,在tools.jar
包中有jstat_options
參考文檔,相對路徑sun/tools/jstat/resources/
目錄下;
option gcutil {
column {
header "^S0^" /* Survivor 0 Space - Percent Used */
data (1-((sun.gc.generation.0.space.1.capacity - sun.gc.generation.0.space.1.used)/sun.gc.generation.0.space.1.capacity)) * 100
}
column {
header "^S1^" /* Survivor 1 Space - Percent Used */
data (1-((sun.gc.generation.0.space.2.capacity - sun.gc.generation.0.space.2.used)/sun.gc.generation.0.space.2.capacity)) * 100
}
......
}
4、jstack命令
jstack:輸出指定進程當前時刻在JVM中的線程信息,爲了清楚的展示其效果,在服務啓動時創建線程死鎖,然後通過該命令就會把發生死鎖的線程打印出來,通過輸出可以發現兩條互相等待的線程信息;
$ jstack 1281
Found one Java-level deadlock:
=============================
"test-thread-02":
waiting for ownable synchronizer 0x00000007b00a35d0, (a java.util.concurrent.locks.ReentrantLock$NonfairSync),
which is held by "test-thread-01"
"test-thread-01":
waiting for ownable synchronizer 0x00000007b00a35a0, (a java.util.concurrent.locks.ReentrantLock$NonfairSync),
which is held by "test-thread-02"
Java stack information for the threads listed above:
===================================================
"test-thread-02":
at sun.misc.Unsafe.park(Native Method)
- parking to wait for <0x00000007b00a35d0> (a java.util.concurrent.locks.ReentrantLock$NonfairSync)
"test-thread-01":
at sun.misc.Unsafe.park(Native Method)
- parking to wait for <0x00000007b00a35a0> (a java.util.concurrent.locks.ReentrantLock$NonfairSync)
Found 1 deadlock.
5、jmap命令
jmap:可以輸出指定進程的內存中對象映射信息,或者堆的關鍵信息、內存的使用統計、GC算法、配置、類的實例信息及內存佔用等,該命令在解決JVM問題時也經常使用;
$ jmap 1281
$ jmap -heap 1281
Heap Configuration:
MinHeapFreeRatio = 0
MaxHeapFreeRatio = 100
MaxHeapSize = 536870912 (512.0MB)
Heap Usage:
PS Young Generation
Eden Space:
From Space:
To Space:
PS Old Generation
$ jmap -histo:live 1281
num #instances #bytes class name
----------------------------------------------
1311: 1 32 com.explore.facade.FacadeApp$$EnhancerBySpringCGLIB$$313d9e3
四、可視化工具
1、jconsole
Java內置的JVM性能監控工具,在熟悉上述的命令行工具之後,對於該可視化工具的使用不會太陌生,在命令中可以查看到的默認參數或者應用自定義配置,在該工具中也可以找到,並且以圖形化的方式呈現;
$ jconsole # 通過該命令會喚起jconsole界面
這裏選擇線程一欄,可以直觀的看到線程數量的變化曲線,也可以在下方查看某個線程的具體信息,並且可以通過檢測死鎖功能,發現在服務中創建的test-thread-01和test-thread-02兩條線程;
2、visualvm
VisualVM作爲解決JVM問題的常用工具,集成的功能豐富且強大,此處通過Idea插件的方式啓動FacadeApp微服務,在進程主頁可以看到自定義的配置,線程一欄因爲檢測到死鎖直接給到異常提示;
在監視一欄可以通過【堆dump】查看詳細的信息,可以查看類的實例數和大小,並且完成了結果排序和佔用統計;此處信息在定位和解決JVM問題時非常重要;
對於JVM的監控工具來說,其能力與常用的命令行語法差異很小,並且這些命令在jdk中tools.jar
包也可以找到其對應的類,對於一些更高級的監控平臺來說,例如Kuboard、Skywalking等,也對這些底層能力做了集成,其原理應該也是大同小異。
五、參考源碼
編程文檔:
https://gitee.com/cicadasmile/butte-java-note
應用倉庫:
https://gitee.com/cicadasmile/butte-flyer-parent