數據預處理-歸一化與z-score標準化

歸一化:

歸一化是一種簡化計算的方式,即將量綱的表達式,經過變換,化爲無量綱的表達式,成爲標量。 在多種計算中都經常用到這種方法。


線性函數轉換:

y=(x-MinValue)/(MaxValue-MinValue)

說明:x、y分別爲轉換前、後的值,MaxValue、MinValue分別爲樣本的最大值和最小值。


對數函數轉換:

y=log10(x)

說明:以10爲底的對數函數轉換。


反正切函數轉換:

y=atan(x)*2/PI


z-score標準化:

標準分數(standard score)也叫z分數(z-score),是一個分數與平均數的差再除以標準差的過程。

用公式表示爲:z=(x-μ)/σ。其中x爲某一具體分數,μ爲平均數,σ爲標準差。

Z值的量代表着原始分數和母體平均值之間的距離,是以標準差爲單位計算。在原始分數低於平均值時Z則爲負數,反之則爲正數


標準分數可以回答這樣一個問題:"一個給定分數距離平均數多少個標準差?"在平均數之上的分數會得到一個正的標準分數,在平均數之下的分數會得到一個負的標準分數。


引自:

http://baike.baidu.com/link?url=n2HbtKxAC_wAyGEJMN-D7wwZNg2B3-dFa-0W9W8sAFJWf5BTry5hIAG6RlFWl-zlWNUUJht85XhoLIy4Hg9Gj_

http://baike.baidu.com/link?url=egN4K40qIsxRxknS6uvOlL63MFGx5LCUq12ojBI-3caMRCYAM5WihO_o2t6vHP0rQKfyei-LKVuN7kbg4HExRK

發佈了39 篇原創文章 · 獲贊 9 · 訪問量 21萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章