PCA(Principal components Analysis)即主成分分析,是圖像處理中經常用的降維方法,因爲在圖像提取相應的特徵如顏色,紋理,SIFT,SURF等特徵,但是一副圖像中有很多個這種特徵點,梅哥特徵點又有一個相應的描述該特徵點的128維的向量,因此需要降維,提高效率。
理解一:主成分分析(最近重構性):多指標(存在一定相關性,信息重疊)轉化成少數幾個線性無關綜合指標,還可以反映原來的變量的信息。方式通過線性組合實現,也就是主成分分析的公式。
理解二:主成分分析(最大可分性):通過變換把數據變換到一個新的座標系統中,幾個主成分就對應一個座標,就是維度(3個主成分就是三維空間,)使得任何數據投影的第一大方差在第一座標(第一主成分)上,第二大方差在第二個座標(第二主成分)上。主成分分析經常用減少數據集的維數,同時保持數據集對方差貢獻最大的特徵,通過保留低階主成分,忽略高階主成分。樣本點在新空間中超平面的投降,所有的樣本點投影能儘可能分開,則應投影后樣本點的方差最大化主成分分析法是一種數學變換的方法, 它把給定的一組相關變量通過線性變換轉成另一組不相關的變量,這些新的變量按照方差依次遞減的順序排列。在數學變換中保持變量的總方差不變,使第一變量具有最大的方差,稱爲第一主成分,第二變量的方差次大,並且和第一變量不相關,稱爲第二主成分。依次類推,I個變量就有I個主成分
主成分分析的計算步驟
① 計算相關係數矩陣,各個特徵值之間的相關性
② 計算相關性係數矩陣特徵值與特徵向量
③ 計算主成分貢獻率及累計貢獻率
④ 計算主成分載荷
基礎公式
協方差:
主成分分析法通過研究指標體系的內在結構關係,從而將多個指標轉化爲少數幾個相互獨立且包含原來指標大部分信息(80%或85%以上)的綜合指標。其優點在於它確定的權數是基於數據分析而得出的指標之間的內在結構關係,不受主觀因素的影響,有較好的客觀性,而且得出的綜合指標(主成分)之間相互獨立,減少信息的交叉,這對分析評價極爲有利。
主成分 |
Y1 |
Y2 |
Y3 |
Y4 |
特徵根 貢獻率(%) 累計貢獻率 |
11.1134 65.37 65.37 |
2.6656 15.68 81.05 |
0.9126 5.37 86.42 |
0.7052 4.15 90.57 |