圖解Golang的GC垃圾回收算法

這篇文章主要介紹了圖解Golang的GC垃圾回收算法,詳細的介紹了三種經典的算法,小編覺得挺不錯的,現在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧

雖然Golang的GC自打一開始,就被人所詬病,但是經過這麼多年的發展,Golang的GC已經改善了非常多,變得非常優秀了。

以下是Golang GC算法的里程碑:

  • v1.1 STW
  • v1.3 Mark STW, Sweep 並行
  • v1.5 三色標記法
  • v1.8 hybrid write barrier

經典的GC算法有三種: 引用計數(reference counting)標記-清掃(mark & sweep)複製收集(Copy and Collection)

Golang的GC算法主要是基於 標記-清掃(mark and sweep) 算法,並在此基礎上做了改進。因此,在此主要介紹一下 標記-清掃(mark and sweep)算法 ,關於 引用計數(reference counting)複製收集(copy and collection) 可自行百度。

標記-清掃(Mark And Sweep)算法

此算法主要有兩個主要的步驟:

  • 標記(Mark phase)
  • 清除(Sweep phase)

第一步,找出不可達的對象,然後做上標記。

第二步,回收標記好的對象。

操作非常簡單,但是有一點需要額外注意: mark and sweep 算法在執行的時候,需要程序暫停!即 stop the world

也就是說,這段時間程序會卡在哪兒。故中文翻譯成 卡頓

我們來看一下圖解:

開始標記,程序暫停。程序和對象的此時關係是這樣的:

然後開始標記,process找出它所有可達的對象,並做上標記。如下圖所示:

標記完了之後,然後開始清除未標記的對象:

然後 垃圾 清除了,變成了下圖這樣。

最後,停止暫停,讓程序繼續跑。然後循環重複這個過程,直到 process 生命週期結束。

標記-清掃(Mark And Sweep)算法存在什麼問題?

標記-清掃(Mark And Sweep)算法 這種算法雖然非常的簡單,但是還存在一些問題:

  • STW,stop the world;讓程序暫停,程序出現卡頓。
  • 標記需要掃描整個heap
  • 清除數據會產生heap碎片

這裏面最重要的問題就是:mark-and-sweep 算法會暫停整個整個程序。

Go是如何面對並這個問題的呢?

三色併發標記法

我們先來看看Golang的三色標記法的大體流程。

首先:程序創建的對象都標記爲白色。

gc開始:掃描所有可到達的對象,標記爲灰色

從灰色對象中找到其引用對象標記爲灰色,把灰色對象本身標記爲黑色

監視對象中的內存修改,並持續上一步的操作,直到灰色標記的對象不存在

此時,gc回收白色對象。

最後,將所有黑色對象變爲白色,並重復以上所有過程。

好了,大體的流程就是這樣的,讓我們回到剛纔的問題:Go是如何解決 標記-清除(mark and sweep) 算法中的卡頓(stw,stop the world)問題的呢?

gc和用戶邏輯如何並行操作?

標記-清除(mark and sweep)算法的STW(stop the world)操作,就是runtime把所有的線程全部凍結掉,所有的線程全部凍結意味着用戶邏輯是暫停的。這樣所有的對象都不會被修改了,這時候去掃描是絕對安全的。

Go如何減短這個過程呢?標記-清除(mark and sweep)算法包含兩部分邏輯:標記和清除。

我們知道Golang三色標記法中最後只剩下的黑白兩種對象,黑色對象是程序恢復後接着使用的對象,如果不碰觸黑色對象,只清除白色的對象,肯定不會影響程序邏輯。所以: 清除操作和用戶邏輯可以併發。

標記操作和用戶邏輯也是併發的,用戶邏輯會時常生成對象或者改變對象的引用,那麼標記和用戶邏輯如何併發呢?

process新生成對象的時候,GC該如何操作呢?不會亂嗎?

我們看如下圖,在此狀態下:process程序又新生成了一個對象,我們設想會變成這樣:

但是這樣顯然是不對的,因爲按照三色標記法的步驟,這樣新生成的對象A最後會被清除掉,這樣會影響程序邏輯。

Golang爲了解決這個問題,引入了 寫屏障 這個機制。

寫屏障:該屏障之前的寫操作和之後的寫操作相比,先被系統其它組件感知。

通俗的講:就是在gc跑的過程中,可以監控對象的內存修改,並對對象進行重新標記。(實際上也是超短暫的stw,然後對對象進行標記)

在上述情況中, 新生成的對象,一律都標位灰色!
即下圖:

那麼,灰色或者黑色對象的引用改爲白色對象的時候,Golang是該如何操作的?

看如下圖,一個黑色對象引用了曾經標記的白色對象。

這時候,寫屏障機制被觸發,向GC發送信號,GC重新掃描對象並標位灰色。

因此,gc一旦開始,無論是創建對象還是對象的引用改變,都會先變爲灰色。

參考文獻:

Golang's Real-time GC in Theory and Practice

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持神馬文庫。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章