特徵維數帶來什麼問題?
1、計算
2、存儲
3、泛化能力,過擬合overfitting
分類錯誤率與特徵
特徵維數決定可分性
比如:3D空間完全可分,而2D和1D投影空間有重疊
但,增加特徵也可能導致分類性能更差,因爲有模型估計誤差(wrong model)
計算複雜度
當樣本數小於特徵維度時,協方差可能奇異
過擬合(overfitting)
特徵維數高、訓練樣本少導致模型參數估計不準確,比如協方差矩陣需要樣本數大於特徵數
——解決辦法:
1、特徵降維:特徵提取(變換),特徵選擇
2、參數共享/平滑
參考資料:
中國科學院大學碩士課《模式識別》ppt