topological data analysis (TDA) 算法

來自兩篇論文

Topological Methods for the Analysis of High Dimensional Data Sets and 3D Object Recognition (2007)

Extracting insights from the shape of complex data using topology (2013)

並沒有仔細地研究,只是略讀了一下。這兩篇文章的方法都是差不多的,但是作者完全不一樣也沒有引用不知道怎麼回事,這個算法在前一篇叫做mapper,在後一篇叫做TDA,因爲後面那篇寫得比較清楚,所以我標題使用了TDA。當然,由於我並沒有仔細閱讀,所以疏漏在所難免,如果有錯誤的地方,請指出。

簡單介紹一下TDA:

  • 輸入:高維數據點雲(距離矩陣,說成點雲方便理解,但是有點不正確)

  • 輸出:一個網絡,代表點雲的拓撲信息

  • 簡單流程:劃分點云爲部分重合的數個區域,在每個區域內分別進行局部聚類,每個類都作爲輸出的網絡中的一個結點,若點雲重合部分的某個點分別屬於兩個或多個類(cluster),連接它們。

  • 可控參數:點雲劃分方法(filter函數,重合度,劃分方式),局部聚類方法,其他

  • filter函數:可以接受高維向量(點雲中的點)作爲輸入,輸出一個標量的函數,可以用到多個filter。

  • 點雲的劃分:大小爲m的點雲通過n個filter函數處理後變成m個n維的向量(或者說點),首先規定要劃分出多少個子區域,每個子區域和其他子區域的重合度爲多少,然後劃分

舉例:

對一個三維手掌點雲數據,使用一個filter函數,如圖B所示,filter的不同輸出顏色不同,規定分成6段,以多少比例重合,分割如圖C,在六段中分別按照連通性簡單聚類成13個結點,如果重合區某個點同時屬於兩個結點,連接它們,得到圖D。
圖片來自於論文2圖片來自於論文2

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章