PCA主成分分析—個人理解

原創

2020-05-16 11:14

PCA大多數時候用來降維，在做畢設人臉識別的時候學的。

降維只是把某些維度捨棄，把源數據投影到一個新的基底，x軸y軸都是基底單位爲1，新基底最好相互正交。

怎麼投影呢，兩個向量做內積A*B=|A|*|B|*cos<A,B>,其中|A|*cos<A,B>就是A在B上的投影，B爲基底那麼應該|B|==1;

所以只需要將B單位化然後A*B就得到了新的基下的向量了。

捨棄那些維度，保留那些維度呢，我們希望保留的維度是相互獨立的，而且在這個維度內各個樣本值是分散的，相差的越多越好，越有自己的特色越好。所以剛好對應了協方差和方差，協方差表示各個維度的相關性如果協方差爲0則相互獨立>0正相關<0負相關，方差表示樣本離散程度不用多說。

那麼設m個樣本n個維度的一個數據矩陣每列對應每個維度減去這個維度內的各個元素的平均值得到A，A爲m行n列，A'表示A的轉置矩陣，C=A'A，C=C/m是A的協方差矩陣，C是n*n的矩陣，C的主對角線元素正好對應了各個維度內的方差，而其他元素對應了協方差，要使協方差爲0，那麼就形成了一個對角矩陣，就是除了主對角線元素全爲0。故要把協方差矩陣對角化。

協方差矩陣C是一個是對稱矩陣，在線性代數上，實對稱矩陣有一系列非常好的性質：

1）實對稱矩陣不同特徵值對應的特徵向量必然正交。

2）設特徵向量重數爲r，則必然存在r個線性無關的特徵向量相對應，因此可以將這r個特徵向量單位正交化。

所以C可以得到n個特徵值和特徵向量，把特徵值從大到小排好序組成一個矩陣D，特徵向量正交單位化後按列從左到右組成矩陣P，P逆CP=D，PD==CP。

P取前k列後，k列n行，AP=Y就得到了降維後的結果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

HDU-1205(喫糖果)

喫糖果 Time Limit: 6000/3000 MS (Java/Others) Memory Limit: 65535/32768 K (Java/Others) Total Submission(s): 32022

2020-07-08 12:17:52

【hdoj 1164】Eddy's research I

Eddy's research I Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Submission(s):

2020-07-08 09:49:59

伊甸園日曆遊戲(vijos--1004)

題目： Adam和Eve玩一個遊戲，他們先從1900.1.1到2001.11.4這個日期之間隨意抽取一個日期出來。然後他們輪流對這個日期進行操作： 1 ：把日期的天數加1，例如1900.1.1變到1900.1.2 2 ：把月份

2020-07-08 09:20:48

對角化的一題

超级大超越

2020-07-08 09:04:38

找規律·Number Game ZOJ - 3346

題目大意：A和B做遊戲規則是：首先給定了N0，A選擇一個數a（N0≤a≤N0^2）,B選擇一個數b，保證a/b 是一個素數的正數次冪。下一次遊戲，將b作爲N0，繼續；若A能選到1990，則A贏，若B能選到1則B贏。A，B走的都是最優策略，

2020-07-08 06:28:56

LeetCode題解(1431)：擁有最多糖果的孩子(Python)

題目：原題鏈接（簡單）解法時間複雜度空間複雜度執行用時 Ans 1 (Python) O(N)O(N)O(N) O(1)O(1)O(1) 44ms (54.21%) Ans 2 (Python)

2020-07-08 05:30:43

LeetCode題解(1413)：逐步求和得到正數的最小值(Python)

題目：原題鏈接（簡單）標籤：簡單數學解法時間複雜度空間複雜度執行用時 Ans 1 (Python) O(N)O(N)O(N) O(1)O(1)O(1) 48ms (39.32%) Ans 2 (Pyth

2020-07-08 05:30:38

loj#2325. 「清華集訓 2017」小 Y 和恐怖的奴隸主（矩陣快速冪優化概率dp）

吐槽請無視哇塞我終於開始更博客了！感不感動！興不興奮！%￥#%$#@*&.... emm事實上是因爲csdn的LaTeX終於修復好了。。 ps. 之後的題解可能都會相對簡略。並且養成標題上加算法的好習慣，，題面在這裏

2020-07-08 05:07:32

closed-form solution 是啥

轉自： https://www.cnblogs.com/vive/p/5006552.html 轉載出處：學習筆記解析解(Analytical solution) 就是根據嚴格的公式推導，給出任意的自變量就可以求出其因變量，

2020-07-08 05:05:11

AI筆記: 數學基礎之定積分的性質

定積分的性質設所列定積分都存在 (1) ∫abf(x)dx=−∫baf(x)dx⇒∫aaf(x)dx=0\int_a^b f(x) dx = - \int_b^a f(x) dx \Rightarrow \int_a^a f(x

2020-07-08 03:49:20

AI筆記: 數學基礎之方向導數的計算和梯度

方向導數定理若函數f(x,y,z)在點P(x,y,z)處可微，沿任意方向l的方向導數 ∂f∂l=∂f∂xcosα+∂f∂ycosβ+∂f∂zcosγ\frac{\partial f}{\partial l} = \frac{

2020-07-08 03:49:20

AI筆記: 數學基礎之定積分的引例與定義

概述積分學不定積分定積分定積分舉例 1 ）矩形和梯形備註：圖片託管於github，請確保網絡的可訪問性矩形面積：S=ahS = ahS=ah 梯形面積：S=h2(a+b)S = \frac{h}{

2020-07-08 03:11:45

深度之眼《數據基礎訓練營》筆記

文|Seraph 01 | 線性代數一、矩陣及其運算合集矩陣及其運算。方陣、行向量、列向量、兩個矩陣相等、零矩陣矩陣是一種陣列的表示：圖像、線性變換等。單位矩陣、對角矩陣diag 矩陣的乘法不滿足交換律。矩陣沒有除法

2020-07-08 00:56:51

記一次大數整除

除法其實也是減法（應該可以這樣說），那麼大數除法中，該如何判斷一個大數能否被其它數整除呢？（這裏說的數指自然數）比如 a(=100000000000000000000000)，就不能被 b(=333)整除，（但是計算機硬件不支持這次計算

2020-07-08 00:38:49

CSU 1303: Decimal

Description 任意一個分數都是有理數，對於任意一個有限小數，我們都可以表示成一個無限循環小數的形式(在其末尾添加0)，對於任意一個無限循環小數都可以轉化成一個分數。現在你的任務就是將任意一個無限循環小數轉化成既約分數形

2020-07-08 00:16:47

24小時熱門文章

最新文章

最新評論文章