GC算法-標記清除算法

概述

標記清除算法, 描述起來很簡單, 從名字上就能看出, 分爲兩個階段:

  1. 標記階段: 遍歷所有對象, 將活動對象都打上標記
  2. 清除階段: 遍歷堆, 將沒有標記的對象釋放掉.

介紹完畢, 本文結束. 開玩笑, 確實看上去很簡單啦. 那就具體思考一下實現吧.

實現

介紹寫的很清楚了, 實現也是兩個階段唄, 先打tag, 後清除.

標記

尋找所有的活動對象, 要從一個起點開始, 根集合(包括棧、常量池等等), 然後一層一層找下去. 簡單來說就像這樣:

add_mark(obj){
    // 防止重複標記
    if(obj.mark == true) return;
    obj.mark = true
    // 遍歷所有子對象
    for(o in objs){
        add_mark(o)
    }	    
}

將根基合的所有對象都調用一遍, 標記完成.

清除

標記時遍歷的是活動對象, 清除階段呢? 遍歷堆. 將堆上所有非活動對象清除. 就比如:


當然, 其中的free函數也不是簡單的將地址回收, 而是將其記錄到一個鏈表中, 以方便下次申請內存. 實現大概如下:

free(p){
    // 這裏有一個全局變量, 保存鏈表頭: FREE_HEAD
    // 若當前對象和上一次回收的對象是連續內存, 直接合並
    if(FREE_HEAD + FREE_HEAD.size == p){
        FREE_HEAD.size += p.size
    }else{
        p.next = FREE_HEAD
        FREE_HEAD = p
    }
}

這樣, 申請內存時遍歷FREE_HEAD, 找到大小合適的分塊. 若沒有找到, 就動態擴容咯. 這裏其實還有一個優化的小方向, 開始的時候忘記了. 爲了提高查找內存時速度, 可以將空閒鏈表按照大小進行區分, 這樣, 需要多大的內存, 直接到對應的鏈表中找就行了.

雖然實現寫的很粗糙, 但大致意思有了.

問題

1.內存的碎片化

從上面可以看到, 只對內存進行了清除, 但是沒有整理. 而內存的申請有事動態的, 就會導致出現很多離散的小片空閒內存. 極端情況甚至可能內存中還有200mb的空閒內存, 但是申請個10kb的空間卻找不到.

2.暫停時間長

其暫停時間與堆的大小成正比, 堆越大, 遍歷清除耗費的時間就越久.

爲了解決標記清除算法的問題, 衍生出了位圖標記法, BiBOP法 ,延遲清除算法等等個人感覺很雞肋(好吧, 或許是我未得其精髓).


爲了解決標記清除的問題, 有衍生出了 標記複製 , 標記整理 算法, 之後再議.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章