樣本空間有個點,層次聚類的過程如下:
1、將每個點都單獨歸爲1類
2、計算各個類之間的相似度/距離
3、將相似度最大/距離最近的兩個類合併爲1類
4、重複步驟2和3,直到所有類歸爲1類
最開始有個類,每循環一次便有兩個類合併了(即類的總數-1),直到減到你想要的k個類,則可以停止迭代,若想得到所有結果,則一直減,減到1爲止
如何計算兩個類之間的距離:
- Single Linkage:取兩個類中最近的兩個樣本的距離
- Complete Linkage:取兩個類中最遠的兩個樣本的距離
- Average Linkage:把兩個類中點兩兩求距離然後取均值