線上某應用的FULLGC分析

這2天，排除線上某應用啓動內存變化頻繁的問題時，額外發現了一個fullgc的問題，分享給大家。

過程如下：抽了臺線上機器，想看下這段時間機器的gc情況，發現裏面有好幾個FullGc的日誌：

T23:23:02.009+0800: 21860.015: [Full GC 21860.015: [CMS: 2361237K->1111804K(4718592K), 4.9917540 secs] 2532961K->1111804K(5190464K), [CMS Perm : 17397K->17240K(131072K)], 4.9918770 secs] [Times: user=4.96 sys=0.03, real=4.99 secs]

JVM參數設置如下：

-XX:+UseCMSInitiatingOccupancyOnly

-XX:CMSInitiatingOccupancyFraction=60

參數的意思是：在舊區到60％的時候，會觸發一次cmsgc，應該出現如下日誌：

T20:10:37.803+0800: 3246087.559: [CMS-concurrent-mark-start]

T20:10:38.463+0800: 3246088.220: [CMS-concurrent-mark: 0.661/0.661 secs] [Times: user=3.17 sys=0.56, real=0.66 secs]

T20:10:38.463+0800: 3246088.220: [CMS-concurrent-preclean-start]

T20:10:38.552+0800: 3246088.309: [CMS-concurrent-preclean: 0.069/0.089 secs] [Times: user=0.14 sys=0.04, real=0.09 secs]

T20:10:38.552+0800: 3246088.309: [CMS-concurrent-abortable-preclean-start]

而現在日誌裏面都是old區到2.3G（50%）的時候，就會觸發一次FullGc，而且gc日誌裏面沒有一次正常的cmsgc，現在是什麼原因在半路截胡了？

開始懷疑JVM參數是否設置生效，通過jinfo進行查看：

jinfo -flag UseCMSInitiatingOccupancyOnly 20195

jinfo -flag CMSInitiatingOccupancyFraction 20195

一切正常。

出現Fullgc，當時我想可能的原因有以下幾個情況：

cmsgc失敗導致（GC日誌中沒有相關cmsgc失敗的日誌）
JMAP -histo：現場人爲執行肯定不是）
大對象分配時，空間不夠導致（當時還剩下50%內存，並且如果大對象分配，gc日誌裏面是會有如下WARN的）
內存碎片導致？（由於系統會經常分配一些大數組，這個會加劇碎片化）

第四點是最可能的原因了。於是，接下來怎麼驗證是否是它導致的呢？加上PrintGCReason，先打印出fullgc的原因，

命令如下：

/java/bin/jinfo -flag +PrintGCReason

第二天，查看日誌，如下：

GC Cause: Heap Inspection Initiated GC T16:16:01.880+0800: 687439.886: [Full GC 687439.886: [CMS: 2362138K->1180717K(4718592K), 5.6573690 secs] 2700275K->1180717K(5190464K), [C MS Perm : 17531K->17488K(131072K)], 5.6574950 secs] [Times: user=5.59 sys=0.06, real=5.65 secs]

GC原因：堆檢查啓動GC，FullGc的原因是這個，看不明白，諮詢過後，說這個很可能是因爲JAMP -hist繼：活導致的FullGc。

那如果是這樣，就有可能是有腳本或者定時任務，也可能是什麼其他東西，去執行了這個命令，反正據我瞭解的cs沒有做這事。接下來就是找這個“兇手”了，這事情沒做過，沒啥頭緒，看進程也看不出什麼，想grep所有腳本，懶癌又發作了，還是先去羣裏諮詢下有啥簡單又省力的辦法吧，一下搞定：

[ ~]$ crontab -l */1 * * * * /home/bin/config-monitor.sh >> /home/logs/config-monitor.log 2>&1 [logs]$ cat /home/bin/config-monitor.sh |grep "jmap" jmaplog="/home/jmap.log"; if (count == 3) { / run jmap print "run jmap command : /java/bin/jmap -histo:live "pid" |head -n 20"; system("/java/bin/jmap -histo:live "pid" |head -n 20")>jmaplog; print "#######Server has recovered after running jmap######";

線上某應用的FULLGC分析

這2天，排除線上某應用啓動內存變化頻繁的問題時，額外發現了一個fullgc的問題，分享給大家。

過程如下：抽了臺線上機器，想看下這段時間機器的gc情況，發現裏面有好幾個FullGc的日誌：

而現在日誌裏面都是old區到2.3G（50%）的時候，就會觸發一次FullGc，而且gc日誌裏面沒有一次正常的cmsgc，現在是什麼原因在半路截胡了？

開始懷疑JVM參數是否設置生效，通過jinfo進行查看：

一切正常。

出現Fullgc，當時我想可能的原因有以下幾個情況：

cmsgc失敗導致（GC日誌中沒有相關cmsgc失敗的日誌）

JMAP -histo：現場人爲執行肯定不是）

大對象分配時，空間不夠導致（當時還剩下50%內存，並且如果大對象分配，gc日誌裏面是會有如下WARN的）

內存碎片導致？（由於系統會經常分配一些大數組，這個會加劇碎片化）

第四點是最可能的原因了。於是，接下來怎麼驗證是否是它導致的呢？加上PrintGCReason，先打印出fullgc的原因，

命令如下：

/java/bin/jinfo -flag +PrintGCReason

GC原因：堆檢查啓動GC，FullGc的原因是這個，看不明白，諮詢過後，說這個很可能是因爲JAMP -hist繼：活導致的FullGc。

總結：

1，問題可能出現的原因，要儘快動手去驗證，不要只停留在思考的層面;

2，出現fullgc的時候，可以通過加上PrintGCReason，查看具體GC原因。

中間件技術及雙十一實踐·EagleEye篇 EagleEye——分佈式調用的跟蹤者

DRDS自主升降配幫企業省錢省到家

中間件技術及雙十一實踐·穩定性平臺篇穩定性平臺——系統穩定運行的保障者

中間件技術及雙十一實踐·服務框架篇分佈式服務框架——分佈式服務的組織者

中間件技術及雙十一實踐·軟負載篇軟負載——分佈式系統的引路人

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

線上某應用的FULLGC分析

這2天，排除線上某應用啓動內存變化頻繁的問題時，額外發現了一個fullgc的問題，分享給大家。

過程如下：抽了臺線上機器，想看下這段時間機器的gc情況，發現裏面有好幾個FullGc的日誌：

而現在日誌裏面都是old區到2.3G（50%）的時候，就會觸發一次FullGc，而且gc日誌裏面沒有一次正常的cmsgc，現在是什麼原因在半路截胡了？

開始懷疑JVM參數是否設置生效，通過jinfo進行查看：

一切正常。

出現Fullgc，當時我想可能的原因有以下幾個情況：

cmsgc失敗導致（GC日誌中沒有相關cmsgc失敗的日誌）

JMAP -histo：現場 人爲執行肯定不是）

大對象分配時，空間不夠導致（當時還剩下50%內存，並且如果大對象分配，gc日誌裏面是會有如下WARN的）

內存碎片導致？（由於系統會經常分配一些大數組，這個會加劇碎片化）

第四點是最可能的原因了。於是，接下來怎麼驗證是否是它導致的呢？加上PrintGCReason，先打印出fullgc的原因，

命令如下：

/java/bin/jinfo -flag +PrintGCReason

GC原因：堆檢查啓動GC，FullGc的原因是這個，看不明白，諮詢過後，說這個很可能是因爲JAMP -hist繼：活導致的FullGc。

總結：

1，問題可能出現的原因，要儘快動手去驗證，不要只停留在思考的層面;

2，出現fullgc的時候，可以通過加上PrintGCReason，查看具體GC原因。

JMAP -histo：現場人爲執行肯定不是）