機器學習降維

原創

2019-03-22 18:11

降維

1、簡介

當特徵選擇完成後，可以直接訓練模型了，但是可能由於特徵矩陣過大，導致計算量大，訓練時間長的問題，因此降低特徵矩陣維度也是必不可少的。常見的降維方法除了以上提到的基於L1懲罰項的模型以外。
另外還有主成分分析法（PCA）和線性判別分析（LDA），線性判別分析本身也是一個分類模型。PCA和LDA有很多的相似點，其本質是要將原始的樣本映射到維度更低的樣本空間中，但是PCA和LDA的映射目標不一樣：

PCA是爲了讓映射後的樣本具有最大的發散性
而LDA是爲了讓映射後的樣本有最好的分類性能。

所以說PCA是一種無監督的降維方法，而LDA是一種有監督的降維方法。

2、使用方法

主成分分析法（PCA）

使用decomposition庫的PCA類選擇特徵的代碼如下：

from sklearn.decomposition import PCA
selected_feeature = PCA(n_components=2).fit_transform(features)
print(selected_feeature)

線性判別分析法（LDA）

使用LDA進行降維的代碼如下：

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
selected_feeature = LDA(n_components=n).fit_transform(features, target)
print(selected_feeature)

總結

特徵工程包含下面幾個部分：

數據預處理：標準化，區間縮放，二值化，啞編碼，缺失值處理，多項式變換，函數變換
特徵選擇：方差選擇，卡方檢驗，遞歸消除，基於模型消除
數據降維： PCA， LDA

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習降維

降維

1、簡介

2、使用方法

主成分分析法（PCA）

線性判別分析法（LDA）

總結

C語言--右移左移

12款高效開源Wiki系統推薦，打造團隊知識管理利器

一個開源且全面的C#算法實戰教程

dotnet 基於 DirectML 控制檯運行 Phi-3 模型

自定義MyBatis插件

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

常用的 Git 指令

鼠標控制軟件有可能和虛擬機軟件產生衝突

sm4加密工具類

Subprocess使用總結

API 校驗與失效策略

mongoDB 對接python

python 安裝scikit-surprise報錯

django 加載靜態模板

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

機器學習 降維

降維

1、簡介

2、使用方法

主成分分析法（PCA）

線性判別分析法（LDA）

總結

機器學習降維