topological data analysis (TDA) 算法

原創

2019-03-15 15:35

來自兩篇論文

Topological Methods for the Analysis of High Dimensional Data Sets and 3D Object Recognition （2007）

Extracting insights from the shape of complex data using topology （2013）

並沒有仔細地研究，只是略讀了一下。這兩篇文章的方法都是差不多的，但是作者完全不一樣也沒有引用不知道怎麼回事，這個算法在前一篇叫做mapper，在後一篇叫做TDA，因爲後面那篇寫得比較清楚，所以我標題使用了TDA。當然，由於我並沒有仔細閱讀，所以疏漏在所難免，如果有錯誤的地方，請指出。

簡單介紹一下TDA：

輸入：高維數據點雲（距離矩陣，說成點雲方便理解，但是有點不正確）
輸出：一個網絡，代表點雲的拓撲信息
簡單流程：劃分點云爲部分重合的數個區域，在每個區域內分別進行局部聚類，每個類都作爲輸出的網絡中的一個結點，若點雲重合部分的某個點分別屬於兩個或多個類（cluster），連接它們。
可控參數：點雲劃分方法（filter函數，重合度，劃分方式），局部聚類方法，其他
filter函數：可以接受高維向量（點雲中的點）作爲輸入，輸出一個標量的函數，可以用到多個filter。
點雲的劃分：大小爲m的點雲通過n個filter函數處理後變成m個n維的向量（或者說點），首先規定要劃分出多少個子區域，每個子區域和其他子區域的重合度爲多少，然後劃分

舉例：

對一個三維手掌點雲數據，使用一個filter函數，如圖B所示，filter的不同輸出顏色不同，規定分成6段，以多少比例重合，分割如圖C，在六段中分別按照連通性簡單聚類成13個結點，如果重合區某個點同時屬於兩個結點，連接它們，得到圖D。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.