PCA最大方差理論+幾何意義

轉載請註明：雲南省高校數據化運營管理工程研究中心博客http://write.blog.csdn.net/mdeditor#!postId=78932615

主成份爲什麼可以

經過主成分在壓縮數據之後的數據（主成分得分數據），多個變量變爲更少的綜合變量，變量個數減少了，還能反映原有數據的信息嗎？爲什麼可以呢？解決以上疑問前我們需要了解PCA理論基礎：

1.PCA理論基礎:方差最大理論

我們以一個二維數據爲例：

圖1：尋找主成分的正交旋轉
將二維，降至一維
• a二維經過投影，變爲一維；
• b要儘可能保留原始信息。直觀的感受就是投影之後儘量分散，點分佈差異相對較大，沒有相關性（相反的極端情況是投影后聚成一團，變量間的差別小，蘊含的信息就少了）；
• c如何體現差異呢，可量化的方差。這就需要找一個方向使得投影后它們在投影方向上的方差儘可能達到最大，即在此方向上所含的有關原始信息樣品間的差異信息是最多的；
• d降維在線性空間中就是基變換，換一種說法就是，找到一組的基向量，在此向量空間上進行投影。在圖中就是本來基是（0，1），（1,0）現在換成在橫貫1,3第一象限的那條，爲什麼不選橫貫2，4象限的呢，思考b條。

我們由二維空間向一維空間的轉換，如何才能儘可能的保留信息呢，這就需要找一個方向使得投影后它們在投影方向上的方差儘可能達到最大，即在此方向上所含的有關原始信息樣品間的差異信息是最多的。

（小夥伴會不會有爲什麼是方差最大的疑惑呢？從數據體現信息的多少出發。極端的情況是樣本數據都是相同的，那就沒有更多信息了。所以有樣本間有變化，纔有更多信息，變化就是差異，差異就用方差體現）

2.方差最大和協方差的關係

要解釋方差最大和主成分的關係需要從方差和協方差的關係入手：

設對原始數據標準化（減去對應變量的均值，再除以其方差），每個樣本對應p個變量，設x=(x∗1,x∗2,⋯，x∗p)′ 爲p維隨機變量,u=E(x),∑=V(x) ，找其線性組合（找綜合變量），進行線性變換：

⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ y 1 = y 2 = y p = a 11 x 1 + a 21 x 2 + \dots + a 1 p x p a 12 x 1 + a 22 x 2 + \dots + a 2 p x p ⋮ a 1 p x 1 + a 2 p x 2 + \dots + a p p x p = a' 1 x = a' 2 x ⋮ = a' p x

我們首先試圖用綜合變量y1 來代表原始的P個變量,爲使y1 ,在 x∗1,x∗2,⋯，x∗n 的一切線性組合中最大限度的保留這組變量的信息，應是其方差最大化。在a′1a1=1 的約束下，尋找a1 ，使得
V(y1)=a′1∑a1 ,
達到最大,就稱爲第一主成分。對稱矩陣協方差矩陣。

\sum = V (x)

爲對稱的，進行對稱矩陣的譜分解，（分解後的對角矩陣元素

λi，ti
都有着特殊的含義，即特徵值和對應的特徵向量）
譜分解：

\sum = T Λ T T = (t 1, t 2, \dots, t p) ⎛ ⎝ ⎜ ⎜ λ 1 0 \dots ⋱ \dots 0 λ p ⎞ ⎠ ⎟ ⎟ ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ t' 1 t' 2 ⋮ t' p ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ = \sum i = 1 p λ i t 1 t' 1

3. 解釋方差最大和主成分的關係：

設

λ 1 > λ 2 > λ p \geq 0

由於

V (y 1) = a' 1 \sum a 1 = \sum i = 1 p λ i a' 1 t i t' i a 1 = \sum i = 1 p λ i (a' 1 t i) 2

\leq λ 1 \sum i = 1 p (a' 1 t i) 2 = λ 1 \sum i = 1 p a' 1 t i t' i a 1

= λ 1 a' 1 T T T a 1 = λ 1 a' 1 a 1 = λ 1

(計算要知道，T爲正交矩陣。t爲特徵向量，T’T爲1；a’t是一個數，不是向量；a’a已經設定爲1，本人第一次看好多遍無果，想到前面一句後才順利的推導上面的式子)
直接驗證，當取

a1=t1 時,有

t′1∑t1=t′1(λ1t1)=λ1 ,即此時

y1=t′1x ,具有最大方差值

λ1 。
如果第一主成分信息不夠多，還不足以代表原始的p個變量，則需要再考慮第二主成y2，爲了使與y2所含的信息與y1不重疊，要求cov(y1,y2)=0.
第二主成分的推理於第一主成分類似，可得到

y1=t′2x ，具有方差值

λ2 。
（推理點撥：考慮到不同特徵值的特徵向量正交，相乘爲0，推理亦是會暢通。）
（重疊是指線性關係上的，如果有重疊則說明還有進一步降維的空間）

4.貢獻率和累計貢獻率概念：

從上面的推導，我們也可以發現特徵值和主成分方差的關係，總方差中屬於第i主成分yi的比例爲

λ i \sum i = 1 p λ i

稱爲主成分yi的貢獻率。累計貢獻率就是多個主成分貢獻率的加和啦。

5. 主成分取多少個呢？

可人爲指定固定個數，但是往往取（相對於p）較小的m個,使得累計貢獻達到一個較高的百分比（80%——90%），此時y1,y2,y2……，ym可以來代替x1,x2,x3……xp,從而達到降爲的目的。而信息的損失卻不多。

6.幾何意義

通過第三部分的計算過程，假設我們得到所有的主成分：
y1,y2,y3,⋯，yp ,ai 爲特徵向量.在 2.方差最大和協方差的關係部分內容中的線性變換，是一個正交變換
幾何意義是將原有RP 空間的由(x∗1,x∗2,⋯，x∗p)′ 夠成的原p維座標軸作一正交旋轉，一組正交單位向量(t1,t2,⋯,tp) 表明了p個新座標軸的方向，這些新的座標軸彼此扔保持正交，yi是在ti上的投影值，λi 反映了在t1上投影點的分散程度。

四、如何實現

內部服務器博客，或者CSDN 雲南省高校數據化運營管理工程研究中心的博客.

1.我們可以按步編程（見程序《PCA算法 python實現（法一）一步一步實現》）
http://blog.csdn.net/m0_37788308/article/details/78115229

2.快速代碼實現（《PCA python實現（法2）scikit-learn 快速實現》）
http://blog.csdn.net/m0_37788308/article/details/78115229

sklearn官方文檔地址：http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html

主成分分析的方差最大，解析主成份爲什麼可以（二）

PCA最大方差理論+幾何意義

主成份爲什麼可以

1.PCA理論基礎:方差最大理論

2.方差最大和協方差的關係

3. 解釋方差最大和主成分的關係：

4.貢獻率和累計貢獻率概念：

5. 主成分取多少個呢？

6.幾何意義

四、如何實現

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

MCMC抽樣與LDA參數求解

在jupeyter_notebook中編寫內容教程

windows10 安裝mysql 以及遇到的各種問題解決方案

美團點評2018春招自然語言處理方向

神經網絡實現連續型變量的迴歸預測（python)

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結