機器學習與智能優化 之 自底向上(層次)聚類

要點

層次聚類構建了一棵包含數據點的樹(層次組織)。如果你不瞭解樹的概念,可以想想你用來組織文件的文件夾,實體的或者電腦上的(文件組成一個工程,不同工程的文件夾再組合成一個“正在進行的工程”文件夾)。

設想你沒有祕書並且沒有時間親手做這些:一個自底向上的聚類方法可以幫你做這些事,只要你設立了一個合適的方法去測量獨立數據與已經合併點的數據集之間的相似度。

這個方法之所以成爲“自底向上”是因爲它從獨立的數據點開始,合併最相似的點,然啊後合併最相似的集合,直到只剩一個集合。聚類的數目在開始的時候並沒有指定:一個合適的數值可以通過數次實驗在合適的相似度層次來切割樹得到。

通過層次聚類,聖誕老人現在可以只用一個巨大的紅盒子來組織聖誕禮物了。當打開它時,會發現裏面有一系列盒子,再打開,還是盒子,直到打開“葉”盒子才找到實際裝的禮物。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章