线性鉴别分析LDA

原創

2020-06-19 21:51

学习了LDA算法，做个总结，如果有错误，还望指教！

LDA的目标

应用统计方法解决模式识别问题时，一再碰到的问题之一是维数问题。[1]

LDA的目标即是通过投影从高维样本中抽取分类信息、降低维数，使投影后的样本有最大的类间距离和最小的类内距离。

将d维样本变换为1维样本所用的方法：

其中，w，x为n维列向量。如果||w||=1，则每个yn就是想对应的xn到方向为w的直线上的投影。[1]

假若现在有两类样本，维数为d，将这两类样本投影到一个特定的方向上，可以使这两类样本类内聚集，而类间分散，有利于分类。有n类样本时也是一样。因此，重要的选择w的方向。

推理过程

在推理之前，先定义几个参量：

一个样本集X=(x1,x2……xn)包含c个类别，xi(i=1,2,……,n)为d维列向量。

（1）ni(i=1,2……c)：第i个类别的样本个数；

（2）ui(i=1,2……c)：第i个类别的样本均值

（3）u为所有的样本均值

（4）

（5）

现在以两个类求投影矩阵w为例，接下来公式比较多，直接上word的截图：

当有c个类时，取前c-1大个特征之对应的特征向量组成投影矩阵。

实现

参考文献

[1]边肇祺. 模式识别[M] . 北京：清华大学出版社，1992：87-90

[2]http://wenku.baidu.com/link?url=JFwe9ZRTiOdDqUqJ2rwymQ4zbdlGA810OLdcf-7xTWEa0lGNyDm4zi_asZeYzig1nUvQMGIXD2xmuErBDij_OJ28R5qGtEyf2Xa7dfckXba

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

学习笔记|模式识别|Kmeans聚类以及matlab中kmeans函数的使用

一、聚類介紹聚類分析是指事先不瞭解每一個樣本的類別或其他的先驗知識，而唯一的分類根據是樣本的特徵，利用某種相似度度量的方法，把特徵相同或相似的歸爲一類，實現聚類劃分，聚類是一種無監督分類方法。同一個聚合類中的模式比不同聚合類中的模式更相

2020-07-05 19:02:51

学习笔记|模式识别|KNN分类与matlab实现

一、KNN介紹 K-近鄰分類器（KNN）是一種在線分類器，也就是說在分類的時候直接從訓練樣本中找出與待分類樣本最接近的K個樣本，以判斷待分類樣本的類別。初學者容易把KNN和Kmeans搞混，KNN是一種最簡單的有監督分類方法，而Kmean

2020-07-05 19:02:51

学习笔记|模式识别|SVM分类和libsvm在matlab中的使用

一、SVM介紹傳統學習方法採用的經驗風險最小化方法（ERM）雖然將誤差最小化，但不能最小化學習過程的泛化誤差。ERM方法不成功的例子就是神經網絡中的過學習問題。爲此，由Vapnik領導的貝爾實驗室研究小組於1963年提出了一種新的非常有

2020-07-05 19:02:51

机器学习与数据挖掘之生成模型与判别模型

參考文獻：機器學習與數據挖掘參考文獻監督學習的任務是學習一個模型，應用這一模型，對給定的輸入預測相應的輸出，這個模型的一般形式爲決策函數： Y=f(X) 或者條件概率分佈： P(Y|X) 監督學習方法分爲生成方法和判別方法。所學到的模

2020-07-03 04:41:20

机器学习与数据挖掘参考文献

《統計學習方法》李航《機器學習》周志華

2020-07-03 04:41:20

LDA模型，主题聚类模型

自然語言處理--LDA主題聚類模型 LDA模型算法簡介：算法的輸入是一個文檔的集合D={d1, d2, d3, ... , dn}，同時還需要聚類的類別數量m；然後會算法會將每一篇文檔 di 在所有Topic上的一個概率

2020-07-07 14:08:10

关于LDA的一些思考

問1：LDA生成一個文檔的過程是什麼樣的？答1：1）根據預料級參數α，生成文檔d的主題分佈Θ_d~p(Θ|α) 2）對於文檔d中每個位置i對應的單

2020-07-07 00:04:37

shadow detection in opencv code

//shadow detection performed per pixel // should work for rgb data, could be usefull for gray scale and depth data as w

2020-07-08 07:15:24

一篇基于pthon和scikt-learn的关于机器学习的介绍

A Gentle Introduction to Machine Learning with Pythonand Scikit-learn 一篇基於pthon和scikt-learn的關於機器學習的介紹 GuillermoMon

2020-07-07 09:31:56

增强现实初始

增強現實，AR（AugmentedReality），從字面理解，即在人們的現實生活場景中疊加虛擬信息，達到對現實世界信息豐富和擴張的效果。 1.增強現實的歷史人們對增強現實的研究是從1990年代初期開始，當時需要昂貴的

2020-07-07 09:31:55

实现一下Parzen窗估计

自己計劃實現一遍模式識別裏的內容。 Parzen窗估計是非參數估計。我在非參數技術——Parzen窗估計方法文章和非參數估計-Parzen窗口函數法文章裏面整理出了算法基本過程：利用第一篇博客給出的樣本數據對給定的數據進行分類。分類的方法

2020-07-07 09:25:53

OpenCV学习教程入门篇

OpenCV，是Inter公司開發的免費開源專門由於圖像處理和機器視覺的C/C++庫，英文全稱是Open Source Computer Vision。 1. 可視化語言Matlab與OpenCV都可以用於圖像處理，學哪種比較好

2020-07-07 04:51:46

Matlab常用小结

下面是最近使用matlab常用的一些方法總結，不斷更新，方便以後查閱！問題1：如果我想把matlab僅僅是當成一個計算器來使用呢？或者說高級點的計算器？不想開UI界面，能在命令行下快速啓動。簡單，只需運行： ./matlab -no

2020-07-06 14:00:30

【深度学习】Image Super-Resolution Using Deep Convolutional Networks

摘要作者提出了一種深度學習圖像超分辨率的方法，直接在高低分辨率圖像之間學習一個端到端的映射。作者後續還證明了傳統的sparse-coding-based超分方法也可以看做一個深度卷積神經網絡，相對於這種方法，作者的方法聯合優化所

2020-07-05 05:11:50

基于K-L变换的人脸识别的MATLAB实现

clear all; %---------------------- 打開訓練圖像集 --------------------% Files = dir('FREET\F1\*.bmp'); %打開文件夾中所有圖像 Dir =

2020-07-04 07:23:14

24小時熱門文章

最新文章

最新評論文章