多元數據降維方法--線性方法--《多元數據分析(2012)》筆記3

線性方法:多元特徵選擇和多元特徵轉換方法(又可分爲主成分分析和因子分析)

1.主成分分析法適用於:原始數據之間存在較高的相關性,變量之間相關性越強,則原始數據之間存在非常大的冗餘。

主成分分析在MATLAB中實現:princomp(需提供原始數據集)、pcacov(需提供樣本數據間的協方差和相關係數)。

實現:

X = 3+randn(30,1);%randn(30,1)表示隨機產生30*1的正太矩陣。
Y = 5+6*X+2*randn(30,1);
Z = 8-3*X+4*X.^2+3*randn(30,1);
X1 = X(1:15);
X2 =X(16:30);
Y1 = Y(1:15);
Y2 = Y(16:30);
Z1 = Z(1:15);
Z2 = Z(16:30);
B = [X1,X2,Y1,Y2,Z1,Z2];
save B.mat B
boxplot(B)%畫矩陣B的盒圖
stdr = std(B);
meanr = mean(B);
meanr = repmat(meanr,15,1);%將矩陣meanr的橫向複製爲15倍,縱向複製爲1倍
sr = (B-meanr)./repmat(stdr,15,1);
[coefs,scores,variance,t2] = princomp(sr);%主成分分析
I = coefs'*coefs;%??
plot(scores(:,1),scores(:,2),'+');%畫圖
percent_explained = 100*variance/sum(variance);%???

插圖:(至今還未明白這個圖)

2.因子分析法

MATLAB中factoran函數實現極大似然公共因子分析。


盒圖參考:點擊打開鏈接

princomp可參考可參考



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章