線性鑑別分析LDA

原創

2020-06-19 21:51

學習了LDA算法，做個總結，如果有錯誤，還望指教！

LDA的目標

應用統計方法解決模式識別問題時，一再碰到的問題之一是維數問題。[1]

LDA的目標即是通過投影從高維樣本中抽取分類信息、降低維數，使投影后的樣本有最大的類間距離和最小的類內距離。

將d維樣本變換爲1維樣本所用的方法：

其中，w，x爲n維列向量。如果||w||=1，則每個yn就是想對應的xn到方向爲w的直線上的投影。[1]

假若現在有兩類樣本，維數爲d，將這兩類樣本投影到一個特定的方向上，可以使這兩類樣本類內聚集，而類間分散，有利於分類。有n類樣本時也是一樣。因此，重要的選擇w的方向。

推理過程

在推理之前，先定義幾個參量：

一個樣本集X=(x1,x2……xn)包含c個類別，xi(i=1,2,……,n)爲d維列向量。

（1）ni(i=1,2……c)：第i個類別的樣本個數；

（2）ui(i=1,2……c)：第i個類別的樣本均值

（3）u爲所有的樣本均值

（4）

（5）

現在以兩個類求投影矩陣w爲例，接下來公式比較多，直接上word的截圖：

當有c個類時，取前c-1大個特徵之對應的特徵向量組成投影矩陣。

實現

參考文獻

[1]邊肇祺. 模式識別[M] . 北京：清華大學出版社，1992：87-90

[2]http://wenku.baidu.com/link?url=JFwe9ZRTiOdDqUqJ2rwymQ4zbdlGA810OLdcf-7xTWEa0lGNyDm4zi_asZeYzig1nUvQMGIXD2xmuErBDij_OJ28R5qGtEyf2Xa7dfckXba

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

學習筆記|模式識別|Kmeans聚類以及matlab中kmeans函數的使用

一、聚類介紹聚類分析是指事先不瞭解每一個樣本的類別或其他的先驗知識，而唯一的分類根據是樣本的特徵，利用某種相似度度量的方法，把特徵相同或相似的歸爲一類，實現聚類劃分，聚類是一種無監督分類方法。同一個聚合類中的模式比不同聚合類中的模式更相

2020-07-05 19:02:51

學習筆記|模式識別|KNN分類與matlab實現

一、KNN介紹 K-近鄰分類器（KNN）是一種在線分類器，也就是說在分類的時候直接從訓練樣本中找出與待分類樣本最接近的K個樣本，以判斷待分類樣本的類別。初學者容易把KNN和Kmeans搞混，KNN是一種最簡單的有監督分類方法，而Kmean

2020-07-05 19:02:51

學習筆記|模式識別|SVM分類和libsvm在matlab中的使用

一、SVM介紹傳統學習方法採用的經驗風險最小化方法（ERM）雖然將誤差最小化，但不能最小化學習過程的泛化誤差。ERM方法不成功的例子就是神經網絡中的過學習問題。爲此，由Vapnik領導的貝爾實驗室研究小組於1963年提出了一種新的非常有

2020-07-05 19:02:51

機器學習與數據挖掘之生成模型與判別模型

參考文獻：機器學習與數據挖掘參考文獻監督學習的任務是學習一個模型，應用這一模型，對給定的輸入預測相應的輸出，這個模型的一般形式爲決策函數： Y=f(X) 或者條件概率分佈： P(Y|X) 監督學習方法分爲生成方法和判別方法。所學到的模

2020-07-03 04:41:20

機器學習與數據挖掘參考文獻

《統計學習方法》李航《機器學習》周志華

2020-07-03 04:41:20

LDA模型，主題聚類模型

自然語言處理--LDA主題聚類模型 LDA模型算法簡介：算法的輸入是一個文檔的集合D={d1, d2, d3, ... , dn}，同時還需要聚類的類別數量m；然後會算法會將每一篇文檔 di 在所有Topic上的一個概率

2020-07-07 14:08:10

關於LDA的一些思考

問1：LDA生成一個文檔的過程是什麼樣的？答1：1）根據預料級參數α，生成文檔d的主題分佈Θ_d~p(Θ|α) 2）對於文檔d中每個位置i對應的單

2020-07-07 00:04:37

shadow detection in opencv code

//shadow detection performed per pixel // should work for rgb data, could be usefull for gray scale and depth data as w

2020-07-08 07:15:24

一篇基於pthon和scikt-learn的關於機器學習的介紹

A Gentle Introduction to Machine Learning with Pythonand Scikit-learn 一篇基於pthon和scikt-learn的關於機器學習的介紹 GuillermoMon

2020-07-07 09:31:56

增強現實初始

增強現實，AR（AugmentedReality），從字面理解，即在人們的現實生活場景中疊加虛擬信息，達到對現實世界信息豐富和擴張的效果。 1.增強現實的歷史人們對增強現實的研究是從1990年代初期開始，當時需要昂貴的

2020-07-07 09:31:55

實現一下Parzen窗估計

自己計劃實現一遍模式識別裏的內容。 Parzen窗估計是非參數估計。我在非參數技術——Parzen窗估計方法文章和非參數估計-Parzen窗口函數法文章裏面整理出了算法基本過程：利用第一篇博客給出的樣本數據對給定的數據進行分類。分類的方法

2020-07-07 09:25:53

OpenCV學習教程入門篇

OpenCV，是Inter公司開發的免費開源專門由於圖像處理和機器視覺的C/C++庫，英文全稱是Open Source Computer Vision。 1. 可視化語言Matlab與OpenCV都可以用於圖像處理，學哪種比較好

2020-07-07 04:51:46

Matlab常用小結

下面是最近使用matlab常用的一些方法總結，不斷更新，方便以後查閱！問題1：如果我想把matlab僅僅是當成一個計算器來使用呢？或者說高級點的計算器？不想開UI界面，能在命令行下快速啓動。簡單，只需運行： ./matlab -no

2020-07-06 14:00:30

【深度學習】Image Super-Resolution Using Deep Convolutional Networks

摘要作者提出了一種深度學習圖像超分辨率的方法，直接在高低分辨率圖像之間學習一個端到端的映射。作者後續還證明了傳統的sparse-coding-based超分方法也可以看做一個深度卷積神經網絡，相對於這種方法，作者的方法聯合優化所

2020-07-05 05:11:50

基於K-L變換的人臉識別的MATLAB實現

clear all; %---------------------- 打開訓練圖像集 --------------------% Files = dir('FREET\F1\*.bmp'); %打開文件夾中所有圖像 Dir =

2020-07-04 07:23:14

24小時熱門文章

最新文章

最新評論文章