PCA学习过程（一、原理）

原創

2020-07-02 12:48

从SVM过来发现在选择特征的时候需要用到PCA，这样选的特征就有很好的区分度，更容易进行预测工作。
摸索了好几天，其实是拖延了好几天。
终于认为我行了。。写一下理解后的心得
首先膜拜下大神，看一下这个链接
https://zhuanlan.zhihu.com/p/77151308
上面写的很全面了，从基变换到协方差矩阵对角化说的很清楚。
我再捋一遍PCA求解步骤：
设有 m 条 n 维数据。
1、将原始数据按列组成 n 行 m 列矩阵 X；
2、将 X 的每一行进行零均值化，即减去这一行的均值；
3、求出协方差矩阵 $C=\frac{1}{m}XX^T$ ；
4、求出协方差矩阵的特征值及对应的特征向量；
5、将特征向量按对应特征值大小从上到下按行排列成矩阵，取前 k 行组成矩阵 P；
6、 Y=PX即为降维到 k 维后的数据。

反思几个问题：
1、为什么用协方差矩阵的特征向量来做投影矩阵？
这样可以使投影后的向量方差最大，协方差小。能保证投影后的向量协方差矩阵就是原向量协方差矩阵的对角化。这时候投影后向量协方差为0，方差都集中在对角线上。
2、为什么去均值。
去均值后才能保证协方差矩阵的元素等于向量的协方差和方差。

现在发现数学才是王道！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pure::variants—产品平台化及变体管理工具

產品概述 pure::variants是德國pure-systems公司的產品，其目的是幫助企業實現對產品線的變體管理，提高企業項目資產的複用效率。pure::variants的核心理念是運用產品線管理方法對項目資產（項目計劃

2023-12-07 11:12:23

需求工程咨询和实施服务

服務概述經緯恆潤多年來在汽車電子產品開發與量產、工程服務、研發流程體系建設方面積累了大量的實際研發經驗，併爲國內外主流OEM和核心供應商提供了相應的量產產品和研發服務，覆蓋車身和舒適域、智能駕駛、智能網聯、智能座艙、底盤控制

2023-11-15 11:41:36

通用自动化测试软件 — TAE

概述 INTEWORK-TAE（Test Automation Executor) 是一款通用的自動化測試軟件，可以兼容不同的仿真系統，同時具備了故障注入、標定、測量、診斷、模型在迴路測試（MIL) 等一系列與 ECU 測試

2021-12-27 21:11:00

技术分享 | 带你从webots中搭建第一个仿真环境

前言前面的文章介紹了webots的安裝和簡單使用，今天我們來創建一個簡單的webots世界和一個簡單的控制器，該控制器會讓機器人在世界中進行避障。廢話不多說，現在就開始吧 1. 準備 webots世界其實是一個文件。文件中包含諸如物體在哪

2021-12-25 21:44:25

学习方法 | 买科研无人机之前你需要考虑的七件事

買科研無人機之前你需要考慮的七件事，很多客戶都有買過我們的科研無人機P系列、Z系列等等...從最開始的P100,到後期的P200，再到現在的P450、P230、P600。2020年後，網絡上也出現了更多種類和類型的科研無人機，那麼大家購買科

2021-12-25 21:44:18

IPOPT安装

###1.安裝工具coinbrew 打開網頁，找到以下網址將網站中的內容全部複製到自己創建的coinbrew文件中，並且賦予權限 chmod u+x coinbrew 或者執行 git clone https://www.github

2021-12-25 21:32:59

AD9371 & AD9375 Prototyping Platform User Guide

The ADRV9371-W/PRBZ, ADRV9371-N/PCBZ and ADRV9375-N/PCBZ are FMC radio cards for the AD9371 respectively AD9375, a high

2021-12-25 21:24:31

Twin Builder—系统级多物理域数字孪生平台

Twin Builder是ANSYS公司系統仿真單元的核心產品，是一款專業的跨學科多領域系統仿真軟件和數字孿生平臺。能夠做到統領建模、仿真和驗證，並與IIoT物聯網平臺集成、部署與運行數字孿生體。在Twin Builder的支持下，能夠

2021-12-25 21:12:40

【今日在线研讨会预热】pure::variants — 产品线变体管理工具

pure::variants 是德國pure-systems公司的產品，其目的是幫助企業實現對產品線的變體管理，提高企業項目資產的複用效率。pure::variants的核心理念是運用產品線管理方法對項目資產（項目計劃、需求、模型、功能模塊

2021-10-21 21:11:13

技术分享 | 嵌入式常用滤波算法的matlab实现

隨着基於模型設計的廣泛應用，模型在環仿真也逐漸多了起來，我們今天介紹幾種嵌入式常用濾波算法的matlab實現。一、採用數字濾波算法克服隨機干擾的誤差具有以下優點：數字濾波無需其他的硬件成本，只用一個計算過程，可靠性高，不存在阻抗匹配

2021-09-27 21:33:22

TAITherm—专业热管理工具

TAITherm是ThermoAnalytics公司開發的專業三維熱仿真分析工具，模擬熱傳導、熱對流和熱輻射問題，以其專業的模型庫和材料庫、方便的熱建模方式和良好的熱求解能力，廣泛應用於國內外汽車、工業自動化、軌道交通、重型

2021-09-10 21:11:19

从入门到退坑，详解数分行业的3个岗位，起薪高达40W的是哪个？

馬上就要到求職季所謂的金九銀十了，所以最近有很多今年求職的同學問我：自己畢業想從事數據分析領域，但數分也有很多崗位，像是數據分析師、數據產品經理、數據挖掘等，不清楚這些崗位的要求、薪資、發展前景都有什麼區別，害怕自己成爲前輩口中的SQL b

2021-09-01 21:37:26

精心整理的全网资源，正经不正经的都有，持续更新中~

致不甘落後的你：哈嘍，小夥伴們，大家好，平時小編會給大家分享一些資源，但畢竟能力和時間有限，無法專注蒐集整理那些難搞的資源，很多小夥伴們都問我有沒有全面的資源彙總，方便隨時查看和學習，今天這個問題有人解決了。當下社會，每個人都在努

2021-08-20 21:15:52

全是付费买的资源，请低调使用！

致不甘落後的你：當下社會，每個人都在努力提升自己的能力，資料和信息蒐集已經成爲我們生活的一部分，靠自己的能力進行各種資料的搜索、整理、學習，用碎片化的知識充足自我，但是隻依靠個人的時間、金錢和精力，收效甚微，甚至常常被一些廣告和虛

2021-08-11 09:16:34

MacOs 10.14.3 Matlab2018b 解决“找不到已安装的编译器 'Xcode Clang++'。错误使用mex，未找到合适的编译器”问题

MacOs 10.14.3 Matlab2018b 解決“找不到已安裝的編譯器 'Xcode Clang++'。錯誤使用mex，未找到合適的編譯器”問題參考文章：（1）MacOs 10.14.3 Matlab2018b 解決“找不到已

2021-07-19 21:15:45

24小時熱門文章

最新文章

最新評論文章