歸一化有哪些類型

線性歸一化


將原始數據線性化的方法轉換到[0 1]的範圍,該方法實現對原始數據的等比例縮放。
 

yi =\frac{xi}{max(x)}

 

極差變換法

 

通過利用變量取值的最大值和最小值(或者最大值)將原始數據轉換爲界於某一特定範圍的數據,從而消除量綱和數量級影響,改變變量在分析中的權重來解決不同度量的問題。

由於極值化方法在對變量無量綱化過程中僅僅與該變量的最大值和最小值這兩個極端值有關,而與其他取值無關,這使得該方法在改變各變量權重時過分依賴兩個極端取值。

yi = \frac{xi - min(x)}{max(x)-min(x)}

zero-score法(0均值標準化)

即每一變量值與其平均值之差除以該變量的標準差。雖然該方法在無量綱化過程中利用了所有的數據信息,但是該方法在無量綱化後不僅使得轉換後的各變量均值相同,且標準差也相同,即無量綱化的同時還消除了各變量在變異程度上的差異,從而轉換後的各變量在聚類分析中的重要性程度是同等看待的。而實際分析中,經常根據各變量在不同單位間取值的差異程度大小來決定其在分析中的重要性程度,差異程度大的其分析權重也相對較大。
 

yi = \frac{xi-mean(x)}{\sigma }

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章