FDA降維

原創

2020-02-23 08:19

FDA是一個傳統的有用的線性有監督的降維方法，FDA通過最大化類間距離，最小化類內距離的方法降維，但是對於呈現多峯的樣本數據的降維效果並不好。爲了對多峯數據降維，首要的是要保持數據的局部結構。LPP通過保持數據的局部結構獲得很好的降維效果，但他只能用於無監督的情況，不能將樣本的標籤信息考慮在內。
由於類間散佈矩陣不是滿秩的，所以FDA只能將數據映射到維數小於類個數的低維空間，這是FDA的侷限。
FDA
設xi∈Rd(i=1,2,...,n) ,是d維空間中的樣本，yi∈{1,2,...,c} 是相關的標籤集，zi∈Rr(r<d) 是xi 在低維空間的表示，T 表示從X 到Z 的線性變換，Zi=TTxi ,n 是樣本個數，c 是類別個數，nl 是屬於類別c 的樣本個數。∑cl=1nl=n .
每類的均值：ul=1nl∑i:yi=lxi
總的均值：u=1n∑ni=1xi=1n∑cl=1nlul
類內離散度矩陣：S(w)=∑cl=1∑i:yi=l(xi−ul)(xi−ul)T ，d×d 矩陣。
類間離散度矩陣：S(b)=∑cl=1nl(ul−u)(ul−u)T ，d×d 矩陣。
目標函數T=argminT∈Rd×rtr(TTS(w)T)tr(TTS(b)T) ，s.t. TTS(w)T=Ir
最優解爲S(b)φ=λS(w)φ 的最大的d 個特徵值所對應的特徵向量，設S(w) 可逆，則最優解即爲S(w)−1S(b) 的最大的d 個特徵值所對應的特徵向量.
定義W(w)i,j={1nl0if yi=yj=lif yi≠yj
S(w)=12∑ni=1∑nj=1W(w)i,j(xi−xj)(xi−xj)T
定義W(b)i,j={1n−1nl1nif yi=yj=lif yi≠yj
S(b)=12∑ni=1∑nj=1W(b)i,j(xi−xj)(xi−xj)T

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

機器學習 | 特徵工程 —— 降維：PCA（主成分分析）

1.數學原理 1.1.【參考博客】 https://www.cnblogs.com/xinyuyang/p/11178676.html 1.2.【精簡描述】 PCA實際上是將含有冗餘特徵的高維空間數據集投影到地位空間中，在保證信息量的同

2020-07-07 23:48:07

機器學習入門系列之PCA降維

目錄前言 PCA降維原理 PCA如何降維 Sklearn實現總結前言今天來說說機器學習中一個比較重要的概念——主成分分析(Principal Component Analysis)，簡稱PCA。根據字面意思強行解釋一波，就是對

2020-07-02 09:52:02

LLE（locally linear embedding）原理介紹

LLE原理局部線性嵌入（Locally Linear Embedding, LLE）是無監督非線性降維算法，是流行學習的一種。 LLE和Isomap一樣試圖在降維過程中保持高維空間中的流形結構。Isomap把任意兩個樣本點之間

2020-06-27 04:41:13

深度學習-t-SNE對S型數據降維

目標效果：代碼： import numpy as np from sklearn.manifold import TSNE from time import time import matplotlib.pyplot as pl

Vivinia_Vivinia

2020-06-23 12:05:45

PCA和LDA簡介

PCA: PCA(Principal Component Analysis)，即主成分分析方法，是一種使用最廣泛的數據降維算法，可用於提取數據的主要特徵分量。目的: 在高維數據中找方差最大的方向, 將n維特徵映射到k維上(k <

星落秋风五丈原

2020-06-21 13:17:56

機器學習算法複習-譜聚類

來自http://www.cnblogs.com/wentingtu/archive/2011/12/22/2297426.html 如果說 K-means 和 GMM 這些聚類的方法是古代流行的算法的話，那麼這次要講的 Spect

2020-06-17 04:14:16

迷宮 1

( 程序文件名： maze1. pas/c/cpp) 【問題描述】在最新版惡魔城遊戲的最後一關有一個 n*m 的迷宮，入口座標是左上角(1,1)，出口座標是右下角(n，m)。迷宮中的某些小格中有面包圈，有些沒有。爲了通關，ba

2020-06-16 08:10:08

機器學習——降維

主成分分析（PCA） 1.主成分分析法是降維的最常使用的算法。 2.在PCA中，要做的是找到一個方向向量（Vector direction），當把所有的數據都投射到該向量上時，希望投射距離均方差能儘可能地小。 3.方向向量是一個經

2020-06-16 02:17:05

機器學習——PCA

PCA主成分分析介紹 PCA是一種無監督學習的降維技術思想 1.投影后樣本越分散，保留的信息越多 2.PCA的主要思想是將n維特徵映射到k維上，這k維是全新的正交特徵也被稱爲主成分，是在原有n維特徵的基礎上重新構造出來的k維特

2020-06-16 02:16:54

詳解PCA（主成分分析）原理

在我們之前分類器的討論中，如SVM、貝葉斯判別等，都假定已給出了特徵向量維數確定的樣本集，其中各樣本的每一維都是該樣本的一個特徵。然而不同的特徵對於分類器設計的影響是不同的，如果將數目很多的測量值不做分析，全部直接用作分類特徵，不

2020-06-16 02:01:27

降維：主成分分析

2020-06-04 03:34:27

電費敏感數據挖掘二: 文本特徵構造

2020-05-08 21:45:49

機器學習之降維算法（PCA和LDA）

leboop（二宝）

2020-05-08 21:40:08

PCA(主成分分析-principal components analysis)學習筆記以及源代碼實戰講解

梁先森-python数据分析师进阶之路

2020-05-04 22:18:46

連載｜線性判別分析（LDA）

2020-04-02 22:22:56

24小時熱門文章

最新文章

最新評論文章