這可能是把Java 垃圾回收機制講解的最清楚的一篇文章

本文轉載自:這可能是把Java 垃圾回收機制講解的最清楚的一篇文章


Java內存模型

1. 內存回收機制:內存回收就是釋放掉在內存中已經沒用的對象。

要判斷怎樣的對象是沒用的對象。這裏有2種方法:

  • 採用標記計數的方法: 給內存中的對象給打上標記,對象被引用一次,計數就加1,引用被釋放了,計數就減一,當這個計數爲0的時候,這個對象就可以被回收了。 當然,這也就引發了一個問題:循環引用的對象是無法被識別出來並且被回收的。所以就有了第二種方法:
  • 採用根搜索算法: 從一個根出發,搜索所有的可達對象,這樣剩下的那些對象就是需要被回收的 判斷完了哪些對象是沒用的,這樣就可以進行回收了 最簡單的,就是直接清空那個需要被回收的對象。但是這又出現了一個問題,就是內存會被分爲一塊一塊的小碎片。
  • 爲了解決這個問題,可以採用第二種方法,就是在之前的基礎上將存活的對象給整理一下,使他們變成一個連續的內存,從而釋放出連續的較大的內存空間。 還有一中回收方法就是採用複製的辦法:將內存分爲2塊,一塊用來存放對象,另一塊用來放着,當存放對象的那塊滿了以後就將上面存活的對象給複製過來,然後在這塊內存上工作,並且將之前的內存清空,當自己這塊滿了以後再複製回去,如此反覆。

比較效率的一中做法是將以上的幾種方法給結合起來。

首先將內存分塊,分爲新生代,老年代和永久代。 永久代用來存放代碼,等一些基本不改變的數據, 新生代用來存放剛產生的一些對象,新生代又可分爲3塊。分別爲Edon區,Survivor0,survivor1,剛產生的對象是放在Edon區中,當這個區塊放滿了以後就將其存活的部分複製到survivor0塊中,並且將Edon區中的數據清空,等到survivor0滿了就將其中的存活的數據放到survivor1中,清空survivor0,垃圾回收到了一定次數還未被回收的對象,就可以放到老年區。一般來說,剛纔產生的對象大多是要在下一次垃圾回收的時候就要被回收掉的,只有一小部分對象會被保留下來,這些被保留下來的對象都是比較穩定的,所以在老年區中的對象回收方法可以採用整理的方法,而在Edon區等新生代中採用複製的方法比較好。

垃圾回收他是在虛擬機空閒的時候或者內存緊張的時候執行的,什麼時候回收不是由程序員來控制的,這也就是java比較耗內存的原因之一。 還有在垃圾回收的時候當檢測到對象沒有用了,需要被回收的時候並不會馬上被回收,而是將其放入到一個準備回收的隊列,去執行finalize方法。。

一、垃圾回收機制的意義

Java語言中一個顯著的特點就是引入了垃圾回收機制,使c++程序員最頭疼的內存管理的問題迎刃而解,它使得Java程序員在編寫程序的時候不再需要考慮內存管理。由於有個垃圾回收機制,Java中的對象不再有“作用域”的概念,只有對象的引用纔有“作用域”。垃圾回收可以有效的防止內存泄露,有效的使用空閒的內存。

ps:內存泄露是指該內存空間使用完畢之後未回收,在不涉及複雜數據結構的一般情況下,Java 的內存泄露表現爲一個內存對象的生命週期超出了程序需要它的時間長度,我們有時也將其稱爲“對象遊離”。

二、垃圾回收機制中的算法

Java語言規範沒有明確地說明JVM使用哪種垃圾回收算法,但是任何一種垃圾回收算法一般要做2件基本的事情:(1)發現無用信息對象;(2)回收被無用對象佔用的內存空間,使該空間可被程序再次使用。

1.引用計數法(Reference Counting Collector)

1.1算法分析

引用計數是垃圾收集器中的早期策略。在這種方法中,堆中每個對象實例都有一個引用計數。當一個對象被創建時,且將該對象實例分配給一個變量,該變量計數設置爲1。當任何其它變量被賦值爲這個對象的引用時,計數加1(a = b,則b引用的對象實例的計數器+1),但當一個對象實例的某個引用超過了生命週期或者被設置爲一個新值時,對象實例的引用計數器減1。任何引用計數器爲0的對象實例可以被當作垃圾收集。當一個對象實例被垃圾收集時,它引用的任何對象實例的引用計數器減1。

1.2優缺點

優點:引用計數收集器可以很快的執行,交織在程序運行中。對程序需要不被長時間打斷的實時環境比較有利。

缺點:無法檢測出循環引用。如父對象有一個對子對象的引用,子對象反過來引用父對象。這樣,他們的引用計數永遠不可能爲0.

1.3引用計數算法無法解決循環引用問題,例如:

public class Main {
    public static void main(String[] args) {
        MyObject object1 = new MyObject();
        MyObject object2 = new MyObject();
          
        object1.object = object2;
        object2.object = object1;
          
        object1 = null;
        object2 = null;
    }
}

最後面兩句將object1和object2賦值爲null,也就是說object1和object2指向的對象已經不可能再被訪問,但是由於它們互相引用對方,導致它們的引用計數器都不爲0,那麼垃圾收集器就永遠不會回收它們。

2.tracing算法(Tracing Collector) 或 標記-清除算法(mark and sweep)

2.1根搜索算法

根搜索算法是從離散數學中的圖論引入的,程序把所有的引用關係看作一張圖,從一個節點GC ROOT開始,尋找對應的引用節點,找到這個節點以後,繼續尋找這個節點的引用節點,當所有的引用節點尋找完畢之後,剩餘的節點則被認爲是沒有被引用到的節點,即無用的節點。

java中可作爲GC Root的對象有

  • 虛擬機棧中引用的對象(本地變量表)
  • 方法區中靜態屬性引用的對象
  • 方法區中常量引用的對象
  • 本地方法棧中引用的對象(Native對象)

2.2 tracing算法的示意圖

2.3 標記-清除算法分析

標記-清除算法採用從根集合進行掃描,對存活的對象對象標記,標記完畢後,再掃描整個空間中未被標記的對象,進行回收,如上圖所示。標記-清除算法不需要進行對象的移動,並且僅對不存活的對象進行處理,在存活對象比較多的情況下極爲高效,但由於標記-清除算法直接回收不存活的對象,因此會造成內存碎片。

3. compacting算法 或 標記-整理算法

標記-整理算法採用標記-清除算法一樣的方式進行對象的標記,但在清除時不同,在回收不存活的對象佔用的空間後,會將所有的存活對象往左端空閒空間移動,並更新對應的指針。標記-整理算法是在標記-清除算法的基礎上,又進行了對象的移動,因此成本更高,但是卻解決了內存碎片的問題。在基於Compacting算法的收集器的實現中,一般增加句柄和句柄表。

4.copying算法(Compacting Collector)

該算法的提出是爲了克服句柄的開銷和解決堆碎片的垃圾回收。它開始時把堆分成 一個對象 面和多個空閒面, 程序從對象面爲對象分配空間,當對象滿了,基於copying算法的垃圾 收集就從根集中掃描活動對象,並將每個 活動對象複製到空閒面(使得活動對象所佔的內存之間沒有空閒洞),這樣空閒面變成了對象面,原來的對象面變成了空閒面,程序會在新的對象面中分配內存。一種典型的基於coping算法的垃圾回收是stop-and-copy算法,它將堆分成對象面和空閒區域面,在對象面與空閒區域面的切換過程中,程序暫停執行。

5.generation算法(Generational Collector)

分代的垃圾回收策略,是基於這樣一個事實:不同的對象的生命週期是不一樣的。因此,不同生命週期的對象可以採取不同的回收算法,以便提高回收效率。

年輕代(Young Generation)

  • 所有新生成的對象首先都是放在年輕代的。年輕代的目標就是儘可能快速的收集掉那些生命週期短的對象。
  • 新生代內存按照8:1:1的比例分爲一個eden區和兩個survivor(survivor0,survivor1)區。一個Eden區,兩個 Survivor區(一般而言)。大部分對象在Eden區中生成。回收時先將eden區存活對象複製到一個survivor0區,然後清空eden區,當這個survivor0區也存放滿了時,則將eden區和survivor0區存活對象複製到另一個survivor1區,然後清空eden和這個survivor0區,此時survivor0區是空的,然後將survivor0區和survivor1區交換,即保持survivor1區爲空, 如此往復。
  • 當survivor1區不足以存放 eden和survivor0的存活對象時,就將存活對象直接存放到老年代。若是老年代也滿了就會觸發一次Full GC,也就是新生代、老年代都進行回收
  • 新生代發生的GC也叫做Minor GC,MinorGC發生頻率比較高(不一定等Eden區滿了才觸發)

年老代(Old Generation)

  • 在年輕代中經歷了N次垃圾回收後仍然存活的對象,就會被放到年老代中。因此,可以認爲年老代中存放的都是一些生命週期較長的對象。
  • 內存比新生代也大很多(大概比例是1:2),當老年代內存滿時觸發Major GC即Full GC,Full GC發生頻率比較低,老年代對象存活時間比較長,存活率標記高。

持久代(Permanent Generation)

用於存放靜態文件,如Java類、方法等。持久代對垃圾回收沒有顯著影響,但是有些應用可能動態生成或者調用一些class,例如Hibernate 等,在這種時候需要設置一個比較大的持久代空間來存放這些運行過程中新增的類。

三、GC(垃圾收集器)

  • 新生代收集器使用的收集器:Serial、PraNew、Parallel Scavenge
  • 老年代收集器使用的收集器:Serial Old、Parallel Old、CMS

Serial收集器(複製算法)

新生代單線程收集器,標記和清理都是單線程,優點是簡單高效。

Serial Old收集器(標記-整理算法)

老年代單線程收集器,Serial收集器的老年代版本。

ParNew收集器(停止-複製算法)

新生代收集器,可以認爲是Serial收集器的多線程版本,在多核CPU環境下有着比Serial更好的表現。

Parallel Scavenge收集器(停止-複製算法)

並行收集器,追求高吞吐量,高效利用CPU。吞吐量一般爲99%, 吞吐量= 用戶線程時間/(用戶線程時間+GC線程時間)。適合後臺應用等對交互相應要求不高的場景。

Parallel Old收集器(停止-複製算法)

Parallel Scavenge收集器的老年代版本,並行收集器,吞吐量優先

CMS(Concurrent Mark Sweep)收集器(標記-清理算法)

高併發、低停頓,追求最短GC回收停頓時間,cpu佔用比較高,響應時間快,停頓時間短,多核cpu 追求高響應時間的選擇

四、GC的執行機制

由於對象進行了分代處理,因此垃圾回收區域、時間也不一樣。GC有兩種類型:Scavenge GC和Full GC。

Scavenge GC

一般情況下,當新對象生成,並且在Eden申請空間失敗時,就會觸發Scavenge GC,對Eden區域進行GC,清除非存活對象,並且把尚且存活的對象移動到Survivor區。然後整理Survivor的兩個區。這種方式的GC是對年輕代的Eden區進行,不會影響到年老代。因爲大部分對象都是從Eden區開始的,同時Eden區不會分配的很大,所以Eden區的GC會頻繁進行。因而,一般在這裏需要使用速度快、效率高的算法,使Eden去能儘快空閒出來。

Full GC

對整個堆進行整理,包括Young、Tenured和Perm。Full GC因爲需要對整個堆進行回收,所以比Scavenge GC要慢,因此應該儘可能減少Full GC的次數。在對JVM調優的過程中,很大一部分工作就是對於FullGC的調節。有如下原因可能導致Full GC:

  • 老年代(Tenured)被寫滿
  • 持久代(Perm)被寫滿
  • System.gc()被顯示調用
  • 上一次GC之後Heap的各域分配策略動態變化

Java instanceof 關鍵字是如何實現的?

boolean result;
if (obj == null) {
  result = false;
} else {
  try {
      T temp = (T) obj; // checkcast
      result = true;
  } catch (ClassCastException e) {
      result = false;
  }
}

本文轉載自:這可能是把Java 垃圾回收機制講解的最清楚的一篇文章

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章