在有序數組中,可以快速找到特定的值,但是想在有序數組中插入一個新的數據項,就必須首先找出新數據項插入的位置,然後將比新數據項大的數據項向後移動一位,來給新的數據項騰出空間,刪除同理,這樣移動很費時。顯而易見,如果要做很多的插入和刪除操作和刪除操作,就不該選用有序數組。
另一方面,鏈表中可以快速添加和刪除某個數據項,但是在鏈表中查找數據項可不容易,必須從頭開始訪問鏈表的每一個數據項,直到找到該數據項爲止,這個過程很慢。
樹這種數據結構,既能像鏈表那樣快速的插入和刪除,又能想有序數組那樣快速查找。這裏主要實現一種特殊的樹——二叉(搜索)樹。二叉搜索樹有如下特點:一個節點的左子節點的關鍵字值小於這個節點,右子節點的關鍵字值大於或等於這個節點。插入一個節點需要根據這個規則進行插入。
刪除節點時二叉搜索樹中最複雜的操作,但是刪除節點在很多樹的應用中又非常重要,所以詳細研究並總結下特點。刪除節點要從查找要刪的節點開始入手,首先找到節點,這個要刪除的節點可能有三種情況需要考慮:
·該節點是葉節點,沒有子節點
·該節點有一個子節點
·該節點有兩個子節點
第一種最簡單,第二種也還是比較簡單的,第三種就相當複雜了。下面分析這三種刪除情況:
要刪除葉節點,只需要改變該節點的父節點對應子字段的值即可,由指向該節點改爲null就可以了。垃圾回收器會自動回收葉節點,不需要自己手動刪掉;當節點有一個子節點時,這個節點只有兩個連接:連向父節點和連向它唯一的子節點。需要從這個序列中剪斷這個節點,把它的子節點直接連到它的父節點上即可,這個過程要求改變父節點適當的引用(左子節點還是右子節點),指向要刪除節點的子節點即可;第三種情況最複雜,如果要刪除有兩個子節點的節點,就不能只用它的一個子節點代替它,比如要刪除節點25,如果用35取代它,那35的左子節點是15呢還是30?
因此需要考慮另一種方法,尋找它的中序後繼來代替該節點。下圖顯示的就是要刪除節點用它的後繼代替它的情況,刪除後還是有序的。(這裏還有更麻煩的情況,即它的後繼自己也有右子節點,下面再討論。)
那麼如何找後繼節點呢?首先得找到要刪除的節點的右子節點,它的關鍵字值一定比待刪除節點的大。然後轉到待刪除節點右子節點的左子節點那裏(如果有的話),然後到這個左子節點的左子節點,以此類推,順着左子節點的路徑一直向下找,這個路徑上的最後一個左子節點就是待刪除節點的後繼。如果待刪除節點的右子節點沒有左子節點,那麼這個右子節點本身就是後繼。尋找後繼的示意圖如下:
找到了後繼節點,現在開始刪除了,先看第一種情況,後繼節點是delNode右子節點的做後代,這種情況要執行以下四個步驟:
·把後繼父節點的leftChild字段置爲後繼的右子節點;
·把後繼的rightChild字段置爲要刪除節點的右子節點;
·把待刪除節點從它父節點的leftChild或rightChild字段刪除,把這個字段置爲後繼;
·把待刪除的左子節點移除,將後繼的leftChild字段置爲待刪除節點的左子節點。
如下圖所示:
如果後繼節點就是待刪除節點的右子節點,這種情況就簡單了,因爲只需要把後繼爲跟的子樹移到刪除的節點的位置即可。如下圖所示:
看到這裏,就會發現刪除時相當棘手的操作。實際上,因爲它非常複雜,一些程序員都嘗試着躲開它,他們在Node類中加了一個Boolean字段來標識該節點是否已經被刪除,在其他操作之前會先判斷這個節點是不是已經刪除了,這樣刪除節點不會改變樹的結構,。當然樹中還保留着這種已經刪除的節點,對存儲造成浪費,但是如果沒有那麼多刪除的話,這也不失爲一個好方法。下面是二叉搜索樹的主要代碼: