【基礎不牢，地動山搖】K-D樹

原創

2019-07-31 01:15

爲什麼在這裏介紹最爲基礎的數據結構“樹”呢？
因爲在最近鄰算法中樹有很重要的作用。首先回顧一下二叉樹：

二叉樹是每個結點最多有兩個子樹的樹結構。通常子樹被稱作“左子樹”和“右子樹”。二叉樹常被用於實現二叉查找樹和二叉堆。一張圖快速理解二叉樹：

二叉樹的搜索和構造就不再這裏介紹了，大家可以參考這篇文章。link

爲什麼在上一節介紹二叉樹？因爲K-D樹是每個節點都爲k維點的二叉樹。是一種對K維空間內的實例點進行存儲，以便對其進行快速的搜索的方法。構造K-D 樹相當於不斷的用垂直與座標軸的超平面將K維空間切分。K-D樹的每個節點對應一個K維超矩形區域。很拗口？來個例子吧

一個二維數據集
$T=\{(2,3)^T,(5,4)^T,(9,6)^T,(4,7)^T,(9,6)^T,(4,7)^T,(8,1)^T,(7,2)^T\}$

point_list.sort(key=itemgetter(axis))
median = len(point_list) // 2 # choose median
location=point_list[median]

如何構造KD樹？
具體的算法流程如下所是：
輸入： K維空間的數據集 $T={x_1,x_2,...x_N},(x_i=(x^{(1)}_i,x^{(2)}_i),...x^{(K)}_i)$
輸出： KD樹

輸入： KD樹，目標點 $x$
輸出： KD樹

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.