現實企業級Java開發中,有時候我們會碰到下面這些問題:
-
OutOfMemoryError,內存不足
-
內存泄露
-
線程死鎖
-
鎖爭用(Lock Contention)
-
Java進程消耗CPU過高
-
......
這些問題在日常開發中可能被很多人忽視(比如有的人遇到上面的問題只是重啓服務器或者調大內存,而不會深究問題根源),但能夠理解並解決這些問題是Java程序員進階的必備要求。本文將對一些常用的JVM性能調優監控工具進行介紹,希望能起拋磚引玉之用。本文參考了網上很多資料,難以一一列舉,在此對這些資料的作者表示感謝!關於JVM性能調優相關的資料,請參考文末。
A、 jps(Java Virtual Machine Process Status Tool)
jps主要用來輸出JVM中運行的進程狀態信息。語法格式如下:
1
|
jps
[options] [hostid] |
如果不指定hostid就默認爲當前主機或服務器。
命令行參數選項說明如下:
1
2
3
4
|
-q
不輸出類名、Jar名和傳入main方法的參數 -m
輸出傳入main方法的參數 -l
輸出main類或Jar的全限名 - v
輸出傳入JVM的參數 |
比如下面:
1
2
3
4
5
6
7
8
|
root@ubuntu:/ #
jps -m -l 2458
org.artifactory.standalone.main.Main /usr/local/artifactory-2 .2.5 /etc/jetty .xml 29920
com.sun.tools.hat.Main -port 9998 /tmp/dump .dat 3149
org.apache.catalina.startup.Bootstrap start 30972
sun.tools.jps.Jps -m -l 8247
org.apache.catalina.startup.Bootstrap start 25687
com.sun.tools.hat.Main -port 9999 dump.dat 21711
mrf-center.jar |
B、 jstack
jstack主要用來查看某個Java進程內的線程堆棧信息。語法格式如下:
1
2
3
|
jstack
[option] pid jstack
[option] executable core jstack
[option] [server- id @]remote- hostname -or-ip |
命令行參數選項說明如下:
1
2
|
-l
long listings,會打印出額外的鎖信息,在發生死鎖時可以用jstack -l pid來觀察鎖持有情況 -m
mixed mode,不僅會輸出Java堆棧信息,還會輸出C /C ++堆棧信息(比如Native方法) |
jstack可以定位到線程堆棧,根據堆棧信息我們可以定位到具體代碼,所以它在JVM性能調優中使用得非常多。下面我們來一個實例找出某個Java進程中最耗費CPU的Java線程並定位堆棧信息,用到的命令有ps、top、printf、jstack、grep。
第一步先找出Java進程ID,我部署在服務器上的Java應用名稱爲mrf-center:
1
2
|
root@ubuntu:/ #
ps -ef | grep mrf-center | grep -v grep root
21711 1 1 14:47 pts /3
00:02:10 java -jar mrf-center.jar |
得到進程ID爲21711,第二步找出該進程內最耗費CPU的線程,可以使用ps -Lfp pid或者ps -mp pid -o THREAD, tid, time或者top -Hp pid,我這裏用第三個,輸出如下:
TIME列就是各個Java線程耗費的CPU時間,CPU時間最長的是線程ID爲21742的線程,用
1
|
printf
"%x\n"
21742 |
得到21742的十六進制值爲54ee,下面會用到。
OK,下一步終於輪到jstack上場了,它用來輸出進程21711的堆棧信息,然後根據線程ID的十六進制值grep,如下:
1
2
|
root@ubuntu:/ #
jstack 21711 | grep 54ee "PollIntervalRetrySchedulerThread"
prio=10 tid=0x00007f950043e000 nid=0x54ee in
Object.wait() [0x00007f94c6eda000] |
可以看到CPU消耗在PollIntervalRetrySchedulerThread這個類的Object.wait(),我找了下我的代碼,定位到下面的代碼:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
//
Idle wait getLog().info( "Thread
["
+ getName() + "]
is idle waiting..." ); schedulerThreadState
= PollTaskSchedulerThreadState.IdleWaiting; long
now = System.currentTimeMillis(); long
waitTime = now + getIdleWaitTime(); long
timeUntilContinue = waitTime - now; synchronized (sigLock)
{
try
{
if (!halted.get())
{
sigLock.wait(timeUntilContinue);
}
}
catch
(InterruptedException ignore) {
} } |
它是輪詢任務的空閒等待代碼,上面的sigLock.wait(timeUntilContinue)就對應了前面的Object.wait()。
C、 jmap(Memory Map)和jhat(Java Heap Analysis Tool)
jmap用來查看堆內存使用狀況,一般結合jhat使用。
jmap語法格式如下:
1
2
3
|
jmap
[option] pid jmap
[option] executable core jmap
[option] [server- id @]remote- hostname -or-ip |
如果運行在64位JVM上,可能需要指定-J-d64命令選項參數。
1
|
jmap
-permstat pid |
打印進程的類加載器和類加載器加載的持久代對象信息,輸出:類加載器名稱、對象是否存活(不可靠)、對象地址、父類加載器、已加載的類大小等信息,如下圖:
使用jmap -heap pid查看進程堆內存使用情況,包括使用的GC算法、堆配置參數和各代中堆內存使用情況。比如下面的例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
|
root@ubuntu:/ #
jmap -heap 21711 Attaching
to process ID 21711, please wait... Debugger
attached successfully. Server
compiler detected. JVM
version is 20.10-b01 using
thread- local
object allocation. Parallel
GC with 4 thread(s) Heap
Configuration:
MinHeapFreeRatio
= 40
MaxHeapFreeRatio
= 70
MaxHeapSize
= 2067791872 (1972.0MB)
NewSize
= 1310720 (1.25MB)
MaxNewSize
= 17592186044415 MB
OldSize
= 5439488 (5.1875MB)
NewRatio
= 2
SurvivorRatio
= 8
PermSize
= 21757952 (20.75MB)
MaxPermSize
= 85983232 (82.0MB) Heap
Usage: PS
Young Generation Eden
Space:
capacity
= 6422528 (6.125MB)
used
= 5445552 (5.1932830810546875MB)
free
= 976976 (0.9317169189453125MB)
84.78829520089286%
used From
Space:
capacity
= 131072 (0.125MB)
used
= 98304 (0.09375MB)
free
= 32768 (0.03125MB)
75.0%
used To
Space:
capacity
= 131072 (0.125MB)
used
= 0 (0.0MB)
free
= 131072 (0.125MB)
0.0%
used PS
Old Generation
capacity
= 35258368 (33.625MB)
used
= 4119544 (3.9287033081054688MB)
free
= 31138824 (29.69629669189453MB)
11.683876009235595%
used PS
Perm Generation
capacity
= 52428800 (50.0MB)
used
= 26075168 (24.867218017578125MB)
free
= 26353632 (25.132781982421875MB)
49.73443603515625%
used
.... |
使用jmap -histo[:live] pid查看堆內存中的對象數目、大小統計直方圖,如果帶上live則只統計活對象,如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
|
root@ubuntu:/ #
jmap -histo:live 21711 | more
num
#instances
#bytes class name ----------------------------------------------
1:
38445 5597736 <constMethodKlass>
2:
38445 5237288 <methodKlass>
3:
3500 3749504 <constantPoolKlass>
4:
60858 3242600 <symbolKlass>
5:
3500 2715264 <instanceKlassKlass>
6:
2796 2131424 <constantPoolCacheKlass>
7:
5543 1317400 [I
8:
13714 1010768 [C
9:
4752 1003344 [B
10:
1225 639656 <methodDataKlass>
11:
14194 454208 java.lang.String
12:
3809 396136 java.lang.Class
13:
4979 311952 [S
14:
5598 287064 [[I
15:
3028 266464 java.lang.reflect.Method
16:
280 163520 <objArrayKlassKlass>
17:
4355 139360 java.util.HashMap$Entry
18:
1869 138568 [Ljava.util.HashMap$Entry;
19:
2443 97720 java.util.LinkedHashMap$Entry
20:
2072 82880 java.lang.ref.SoftReference
21:
1807 71528 [Ljava.lang.Object;
22:
2206 70592 java.lang.ref.WeakReference
23:
934 52304 java.util.LinkedHashMap
24:
871 48776 java.beans.MethodDescriptor
25:
1442 46144 java.util.concurrent.ConcurrentHashMap$HashEntry
26:
804 38592 java.util.HashMap
27:
948 37920 java.util.concurrent.ConcurrentHashMap$Segment
28:
1621 35696 [Ljava.lang.Class;
29:
1313 34880 [Ljava.lang.String;
30:
1396 33504 java.util.LinkedList$Entry
31:
462 33264 java.lang.reflect.Field
32:
1024 32768 java.util.Hashtable$Entry
33:
948 31440 [Ljava.util.concurrent.ConcurrentHashMap$HashEntry; |
class name是對象類型,說明如下:
1
2
3
4
5
6
7
8
9
|
B
byte C
char D
double F
float I
int J
long Z
boolean [
數組,如[I表示int[] [L+類名
其他對象 |
還有一個很常用的情況是:用jmap把進程內存使用情況dump到文件中,再用jhat分析查看。jmap進行dump命令格式如下:
1
|
jmap
-dump: format =b, file =dumpFileName |
我一樣地對上面進程ID爲21711進行Dump:
1
2
3
|
root@ubuntu:/ #
jmap -dump:format=b,file=/tmp/dump.dat 21711 Dumping
heap to /tmp/dump .dat
... Heap
dump file
created |
dump出來的文件可以用MAT、VisualVM等工具查看,這裏用jhat查看:
1
2
3
4
5
6
7
8
9
10
|
root@ubuntu:/ #
jhat -port 9998 /tmp/dump.dat Reading
from /tmp/dump .dat... Dump
file
created Tue Jan 28 17:46:14 CST 2014 Snapshot
read ,
resolving... Resolving
132207 objects... Chasing
references, expect 26 dots.......................... Eliminating
duplicate references.......................... Snapshot
resolved. Started
HTTP server on port 9998 Server
is ready. |
然後就可以在瀏覽器中輸入主機地址:9998查看了:
上面紅線框出來的部分大家可以自己去摸索下,最後一項支持OQL(對象查詢語言)。
D、jstat(JVM統計監測工具)
語法格式如下:
1
|
jstat
[ generalOption | outputOptions vmid [interval[s|ms] [count]] ] |
vmid是虛擬機ID,在Linux/Unix系統上一般就是進程ID。interval是採樣時間間隔。count是採樣數目。比如下面輸出的是GC信息,採樣時間間隔爲250ms,採樣數爲4:
1
2
3
4
5
6
|
root@ubuntu:/ #
jstat -gc 21711 250 4
S0C
S1C S0U S1U EC EU OC OU PC PU YGC YGCT FGC FGCT GCT
192.0
192.0 64.0 0.0 6144.0 1854.9 32000.0 4111.6 55296.0 25472.7 702 0.431 3 0.218 0.649 192.0
192.0 64.0 0.0 6144.0 1972.2 32000.0 4111.6 55296.0 25472.7 702 0.431 3 0.218 0.649 192.0
192.0 64.0 0.0 6144.0 1972.2 32000.0 4111.6 55296.0 25472.7 702 0.431 3 0.218 0.649 192.0
192.0 64.0 0.0 6144.0 2109.7 32000.0 4111.6 55296.0 25472.7 702 0.431 3 0.218 0.649 |
要明白上面各列的意義,先看JVM堆內存佈局:
可以看出:
1
2
|
堆內存
= 年輕代 + 年老代 + 永久代 年輕代
= Eden區 + 兩個Survivor區(From和To) |
現在來解釋各列含義:
1
2
3
4
5
6
7
|
S0C、S1C、S0U、S1U:Survivor
0 /1 區容量(Capacity)和使用量(Used) EC、EU:Eden區容量和使用量 OC、OU:年老代容量和使用量 PC、PU:永久代容量和使用量 YGC、YGT:年輕代GC次數和GC耗時 FGC、FGCT:Full
GC次數和Full GC耗時 GCT:GC總耗時 |
其他JVM性能調優參考資料:
《Java虛擬機規範》
《Java Performance》
《Trouble Shooting Guide for JavaSE 6 with HotSpot VM》: http://www.oracle.com/technetwork/java/javase/tsg-vm-149989.pdf
《Effective Java》
VisualVM: http://docs.oracle.com/javase/7/docs/technotes/guides/visualvm/
jConsole: http://docs.oracle.com/javase/1.5.0/docs/guide/management/jconsole.html
Monitoring and Managing JavaSE 6 Applications: http://www.oracle.com/technetwork/articles/javase/monitoring-141801.html