這幾張圖太形象了,只好收藏了。來自:http://xgli0910.blog.163.com/blog/static/46962168201021932741868/
mahalanobis距離是基於樣本分佈的一種距離。物理意義就是在規範化的主成分空間中的歐氏距離。所謂規範化的主成分空間就是利用主成分分析對一些數據進行主成分分解。再對所有主成分分解軸做歸一化,形成新的座標軸。由這些座標軸張成的空間就是規範化的主成分空間。
換句話說,主成分分析就是把橢球分佈的樣本改變到另一個空間裏,使其成爲球狀分佈。而mahalanobis距離就是在樣本呈球狀分佈的空間裏面所求得的Euclidean距離。
當然,上面的解釋只是對橢球分佈而言,對一般分佈,只能消除分佈的二階相關性,而不能消除高階相關性。