線性鑑別分析LDA

學習了LDA算法,做個總結,如果有錯誤,還望指教!

LDA的目標

應用統計方法解決模式識別問題時,一再碰到的問題之一是維數問題。[1]
LDA的目標即是通過投影從高維樣本中抽取分類信息、降低維數,使投影后的樣本有最大的類間距離和最小的類內距離。
將d維樣本變換爲1維樣本所用的方法:
其中,w,x爲n維列向量。如果||w||=1,則每個yn就是想對應的xn到方向爲w的直線上的投影。[1]
假若現在有兩類樣本,維數爲d,將這兩類樣本投影到一個特定的方向上,可以使這兩類樣本類內聚集,而類間分散,有利於分類。有n類樣本時也是一樣。因此,重要的選擇w的方向。

推理過程

在推理之前,先定義幾個參量:
一個樣本集X=(x1,x2……xn)包含c個類別,xi(i=1,2,……,n)爲d維列向量。
(1)ni(i=1,2……c):第i個類別的樣本個數;
(2)ui(i=1,2……c):第i個類別的樣本均值
3)u爲所有的樣本均值
4)
(5)

現在以兩個類求投影矩陣w爲例,接下來公式比較多,直接上word的截圖:



當有c個類時,取前c-1大個特徵之對應的特徵向量組成投影矩陣。

實現


參考文獻

[1]邊肇祺. 模式識別[M] . 北京:清華大學出版社,1992:87-90



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章