PCA學習過程（一、原理）

原創

2020-07-02 12:48

從SVM過來發現在選擇特徵的時候需要用到PCA，這樣選的特徵就有很好的區分度，更容易進行預測工作。
摸索了好幾天，其實是拖延了好幾天。
終於認爲我行了。。寫一下理解後的心得
首先膜拜下大神，看一下這個鏈接
https://zhuanlan.zhihu.com/p/77151308
上面寫的很全面了，從基變換到協方差矩陣對角化說的很清楚。
我再捋一遍PCA求解步驟：
設有 m 條 n 維數據。
1、將原始數據按列組成 n 行 m 列矩陣 X；
2、將 X 的每一行進行零均值化，即減去這一行的均值；
3、求出協方差矩陣 $C=\frac{1}{m}XX^T$ ；
4、求出協方差矩陣的特徵值及對應的特徵向量；
5、將特徵向量按對應特徵值大小從上到下按行排列成矩陣，取前 k 行組成矩陣 P；
6、 Y=PX即爲降維到 k 維後的數據。

反思幾個問題：
1、爲什麼用協方差矩陣的特徵向量來做投影矩陣？
這樣可以使投影后的向量方差最大，協方差小。能保證投影后的向量協方差矩陣就是原向量協方差矩陣的對角化。這時候投影后向量協方差爲0，方差都集中在對角線上。
2、爲什麼去均值。
去均值後才能保證協方差矩陣的元素等於向量的協方差和方差。

現在發現數學纔是王道！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pure::variants—產品平臺化及變體管理工具

產品概述 pure::variants是德國pure-systems公司的產品，其目的是幫助企業實現對產品線的變體管理，提高企業項目資產的複用效率。pure::variants的核心理念是運用產品線管理方法對項目資產（項目計劃

2023-12-07 11:12:23

需求工程諮詢和實施服務

服務概述經緯恆潤多年來在汽車電子產品開發與量產、工程服務、研發流程體系建設方面積累了大量的實際研發經驗，併爲國內外主流OEM和核心供應商提供了相應的量產產品和研發服務，覆蓋車身和舒適域、智能駕駛、智能網聯、智能座艙、底盤控制

2023-11-15 11:41:36

通用自動化測試軟件 — TAE

概述 INTEWORK-TAE（Test Automation Executor) 是一款通用的自動化測試軟件，可以兼容不同的仿真系統，同時具備了故障注入、標定、測量、診斷、模型在迴路測試（MIL) 等一系列與 ECU 測試

2021-12-27 21:11:00

技術分享 | 帶你從webots中搭建第一個仿真環境

前言前面的文章介紹了webots的安裝和簡單使用，今天我們來創建一個簡單的webots世界和一個簡單的控制器，該控制器會讓機器人在世界中進行避障。廢話不多說，現在就開始吧 1. 準備 webots世界其實是一個文件。文件中包含諸如物體在哪

2021-12-25 21:44:25

學習方法 | 買科研無人機之前你需要考慮的七件事

買科研無人機之前你需要考慮的七件事，很多客戶都有買過我們的科研無人機P系列、Z系列等等...從最開始的P100,到後期的P200，再到現在的P450、P230、P600。2020年後，網絡上也出現了更多種類和類型的科研無人機，那麼大家購買科

2021-12-25 21:44:18

IPOPT安裝

###1.安裝工具coinbrew 打開網頁，找到以下網址將網站中的內容全部複製到自己創建的coinbrew文件中，並且賦予權限 chmod u+x coinbrew 或者執行 git clone https://www.github

2021-12-25 21:32:59

AD9371 & AD9375 Prototyping Platform User Guide

The ADRV9371-W/PRBZ, ADRV9371-N/PCBZ and ADRV9375-N/PCBZ are FMC radio cards for the AD9371 respectively AD9375, a high

2021-12-25 21:24:31

Twin Builder—系統級多物理域數字孿生平臺

Twin Builder是ANSYS公司系統仿真單元的核心產品，是一款專業的跨學科多領域系統仿真軟件和數字孿生平臺。能夠做到統領建模、仿真和驗證，並與IIoT物聯網平臺集成、部署與運行數字孿生體。在Twin Builder的支持下，能夠

2021-12-25 21:12:40

【今日在線研討會預熱】pure::variants — 產品線變體管理工具

pure::variants 是德國pure-systems公司的產品，其目的是幫助企業實現對產品線的變體管理，提高企業項目資產的複用效率。pure::variants的核心理念是運用產品線管理方法對項目資產（項目計劃、需求、模型、功能模塊

2021-10-21 21:11:13

技術分享 | 嵌入式常用濾波算法的matlab實現

隨着基於模型設計的廣泛應用，模型在環仿真也逐漸多了起來，我們今天介紹幾種嵌入式常用濾波算法的matlab實現。一、採用數字濾波算法克服隨機干擾的誤差具有以下優點：數字濾波無需其他的硬件成本，只用一個計算過程，可靠性高，不存在阻抗匹配

2021-09-27 21:33:22

TAITherm—專業熱管理工具

TAITherm是ThermoAnalytics公司開發的專業三維熱仿真分析工具，模擬熱傳導、熱對流和熱輻射問題，以其專業的模型庫和材料庫、方便的熱建模方式和良好的熱求解能力，廣泛應用於國內外汽車、工業自動化、軌道交通、重型

2021-09-10 21:11:19

從入門到退坑，詳解數分行業的3個崗位，起薪高達40W的是哪個？

馬上就要到求職季所謂的金九銀十了，所以最近有很多今年求職的同學問我：自己畢業想從事數據分析領域，但數分也有很多崗位，像是數據分析師、數據產品經理、數據挖掘等，不清楚這些崗位的要求、薪資、發展前景都有什麼區別，害怕自己成爲前輩口中的SQL b

2021-09-01 21:37:26

精心整理的全網資源，正經不正經的都有，持續更新中~

致不甘落後的你：哈嘍，小夥伴們，大家好，平時小編會給大家分享一些資源，但畢竟能力和時間有限，無法專注蒐集整理那些難搞的資源，很多小夥伴們都問我有沒有全面的資源彙總，方便隨時查看和學習，今天這個問題有人解決了。當下社會，每個人都在努

2021-08-20 21:15:52

全是付費買的資源，請低調使用！

致不甘落後的你：當下社會，每個人都在努力提升自己的能力，資料和信息蒐集已經成爲我們生活的一部分，靠自己的能力進行各種資料的搜索、整理、學習，用碎片化的知識充足自我，但是隻依靠個人的時間、金錢和精力，收效甚微，甚至常常被一些廣告和虛

2021-08-11 09:16:34

MacOs 10.14.3 Matlab2018b 解決“找不到已安裝的編譯器 'Xcode Clang++'。錯誤使用mex，未找到合適的編譯器”問題

MacOs 10.14.3 Matlab2018b 解決“找不到已安裝的編譯器 'Xcode Clang++'。錯誤使用mex，未找到合適的編譯器”問題參考文章：（1）MacOs 10.14.3 Matlab2018b 解決“找不到已

2021-07-19 21:15:45

24小時熱門文章

SQL優化-20231016

最新文章

最新評論文章