KPCA算法淺析

二者都是在PCA和LDA的基礎上加入了核函數,從線性變化到非線性變化,因此建議先搞懂什麼是PCA、LDA和核函數。

KPCA

我們先來看一個實際問題,圖b是樣本在二維空間中的分佈,稱爲本真二維結構,然後以S形曲面嵌入到三維空間中,形成圖a的空間結構,如果使用線性降維的方法,會丟失低維結構,得到一個圖c這樣的二維空間結構。
在這裏插入圖片描述
面對上述問題,我們就不能採用傳統的線性降維方法了,這時候就要使用我們的核主成分分析KPCA來實現非線性降維。

KPCA算法其實很簡單,數據在低維度空間不是線性可分的,但是在高維度空間就可以變成線性可分的了。利用這個特點,KPCA只是將原始數據通過核函數(kernel)映射到高維度空間,再利用PCA算法進行降維,所以叫做K PCA降維。因此KPCA算法的關鍵在於這個核函數。

總結一下KPCA算法的計算過程

1.去除平均值,進行中心化。
2.利用核函數計算核矩陣K。
3.計算核矩陣的特徵值和特徵向量。
4.將特徵相量按對應特徵值大小從上到下按行排列成矩陣,取前k行組成矩陣P。
5.P即爲降維後的數據。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章