模式識別學習筆記(6)——特徵維數問題

特徵維數帶來什麼問題?

1、計算

2、存儲

3、泛化能力,過擬合overfitting

分類錯誤率與特徵



特徵維數決定可分性

比如:3D空間完全可分,而2D和1D投影空間有重疊

但,增加特徵也可能導致分類性能更差,因爲有模型估計誤差(wrong model)

計算複雜度


當樣本數小於特徵維度時,協方差可能奇異

過擬合(overfitting)

特徵維數高、訓練樣本少導致模型參數估計不準確,比如協方差矩陣需要樣本數大於特徵數

——解決辦法:

1、特徵降維:特徵提取(變換),特徵選擇

2、參數共享/平滑


參考資料:

中國科學院大學碩士課《模式識別》ppt









發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章