來自兩篇論文
Topological Methods for the Analysis of High Dimensional Data Sets and 3D Object Recognition (2007)
Extracting insights from the shape of complex data using topology (2013)
並沒有仔細地研究,只是略讀了一下。這兩篇文章的方法都是差不多的,但是作者完全不一樣也沒有引用不知道怎麼回事,這個算法在前一篇叫做mapper,在後一篇叫做TDA,因爲後面那篇寫得比較清楚,所以我標題使用了TDA。當然,由於我並沒有仔細閱讀,所以疏漏在所難免,如果有錯誤的地方,請指出。
簡單介紹一下TDA:
-
輸入:高維數據點雲(距離矩陣,說成點雲方便理解,但是有點不正確)
-
輸出:一個網絡,代表點雲的拓撲信息
-
簡單流程:劃分點云爲部分重合的數個區域,在每個區域內分別進行局部聚類,每個類都作爲輸出的網絡中的一個結點,若點雲重合部分的某個點分別屬於兩個或多個類(cluster),連接它們。
-
可控參數:點雲劃分方法(filter函數,重合度,劃分方式),局部聚類方法,其他
-
filter函數:可以接受高維向量(點雲中的點)作爲輸入,輸出一個標量的函數,可以用到多個filter。
-
點雲的劃分:大小爲m的點雲通過n個filter函數處理後變成m個n維的向量(或者說點),首先規定要劃分出多少個子區域,每個子區域和其他子區域的重合度爲多少,然後劃分
舉例:
對一個三維手掌點雲數據,使用一個filter函數,如圖B所示,filter的不同輸出顏色不同,規定分成6段,以多少比例重合,分割如圖C,在六段中分別按照連通性簡單聚類成13個結點,如果重合區某個點同時屬於兩個結點,連接它們,得到圖D。