假如我們的原始數據矩陣是 ,維度是 。
主成分分析:
首先計算 的協方差矩陣 , 的維度是 ,然後對協方差矩陣進行特徵分解:
這裏 由 的特徵向量組成,對角矩陣 由 的特徵值組成。
選取前 列得到 ,然後原始數據通過以下方式降維:
奇異值分解:
可以被分解爲三個矩陣的乘積:
我們知道 是由 的特徵向量組成, 是由 的特徵向量組成,而 由 特徵值的平方根組成。
聯繫是什麼?
當 是中心化了的數據,也就是說均值爲0,其協方差矩陣可以由 計算得到。
而可以看到在SVD中, 的值就是由 而來,因此,原始數據可以通過以下方式降維:
注意前提條件:中心化了的原始數據。