給定數據集:, 其中
,
樣本均值和樣本方差的矩陣表達
樣本均值:
, 這裏記
樣本方差:
記,稱之爲centering matrix, 則
討論:centering matrix的性質:
由可知,
綜上可知,
最大投影方差角度
PCA的核心思想:將一組可能線性相關的變量通過正交變換成一組線性無關的變量;
- 一箇中心:原始特徵空間的重構(相關到無關)
- 兩個基本點:
- 最大投影方差
- 最小重構距離
首先,對所有數據樣本進行去中心化,即, 同時令投影方向, 則投影方差:, 此處
損失函數 , 同時
, 因爲,所以可寫成這樣
綜上可知,
拉格朗日函數:
由,可得,這裏爲eign-vector,爲eign-value;
最小重構距離角度
首先,對所有樣本進去中心化,即, 同時令投影方向,
考慮二維的重構向量:, 其中爲投影標量,爲方向向量;如下圖所示:
更一般的情況, , 則重構向量:
降維後,, 則重構向量:, 降維是丟掉了一部分信息
重構距離爲:
, 由上可知,
綜上可知,
由拉格朗日函數同理可得,
, 找出對重構距離影響最小的(p-q)個維度。
SVD 角度
,,
, SVD分解,其中: 是對角矩陣;
綜合與, 可知,
和有相同的特徵值:(,爲特徵值構成的對角矩陣)。
特徵分解 得到方向(主成分) 由求做座標【備註:】
特徵分解 直接求得座標
由可知,
, 其中,爲特徵值組成的對角矩陣。
爲T的特徵向量組成的矩陣, 直接求的特徵向量,就可以直接得到座標;
當 時,分解 , 當 時,分解;
完,