真別再糾結標準化還是歸一化了

原創

2020-04-20 20:22

很多博客把他們搞混。畢竟字典也是把他們放一起了。

既然搞混，那混在一起看好了

在我看來他們其實都是對feature value做了變化就是了。糾結那麼多概念的問題也沒什麼意義。

有些是不變化原數據分佈的

其實均值方差變了那分佈肯定就變了。我這裏“不改變原數據分佈”的意思是概率密度函數的形狀不變。

$x_i=\frac {x_i-\mu} {\sigma}$
這個改得挺好，把原分佈映射到均值爲0方差爲1的分佈上。額外提一句，即便是均值0標準差1也不非得是標準正態分佈，有很多博客亂寫

下面的方法應用後原數據分佈的概率密度函數形狀仍然不變，只不過不一定是標準的0均值1標準差的分佈而已。

$x_i=\frac{x_i-x_{min}}{x_{max}-x_{min}}$
$x_i=\frac{x_i-\mu}{x_{max}-x_{min}}$

有些會改變分佈：

$x_i=log(x_i)$
$x_i=\frac{atan(x_i)*2} \pi$

還有很多變換方法，依據情況選擇變換方法就是了。
另外並不是所有機器學習算法都需要歸一或者標準化。看其原理就行了，不必多說。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pytorch分別用MLP和RNN擬合sinx

0 理論上帶有一個非線性函數的網絡能夠擬合任意函數。那顯然MLP和RNN是科研擬合sinx的。開頭先把結果給展示出來，然後是代碼，最後是我的過程。懶得看的直接看前半部分行了，過程給有興趣的人看看。先上結果圖注：每次訓練tor

2020-07-05 07:30:42

opencv+yolov3實現物體檢測

效果： yolo， you only look once. 如此著名故事又多的模型，真的值得一試。我們是直接下載人家yolov3模型來用，所以需要下載幾個東西，除了detection是我們自己寫的代碼，其餘都要下載，文末分享了所

2020-06-23 06:59:22

Windows10安裝TensorFlow-GPU詳解

困了我幾天的TensorFlow安裝，今天終於安裝成功了。最後發現是版本的問題。。。。。😔😔😔😔😔😔 我主要參考下面的文章： https://www.cnblogs.com/apan008/p/11254688.html 最後附上

浅殇忆流年

2020-06-21 23:01:33

人工智能數學基礎——最優化方法

人工智能的目標就是最優化：在複雜環境與多體交互中做出最優決策。幾乎所有的人工智能問題最後都會歸結爲一個優化問題的求解，因而最優化理論是人工智能必備的基礎知識。最優化理論（optimization）研究的問題是判定

菠萝小笨笨

2020-06-13 20:35:11

人工智能數學基礎——數理統計

基礎的統計理論有助於對機器學習的算法和數據挖掘的結果做出解釋，只有做出合理的解讀，數據的價值才能夠體現。數理統計（mathematical statistics）根據觀察或實驗得到的數據來研究隨機現象，並對研究對象的客觀規

菠萝小笨笨

2020-06-13 20:35:00

一圖看懂alpha-beta（α-β）剪枝

用之有弗盈

2020-06-02 01:37:38

ai講師人工智能講師葉梓《人工智能概念入門》機器學習深度學習講師-15

大数据AI人工智能专家培训讲师叶梓团队

2020-04-23 00:34:40

簡潔爲什麼用word2vec

2020-04-20 20:22:41

pytorch、torchvision離線pip

2020-02-24 09:32:13

pytorch深度學習 3層全連接層，使用MNIST，圖片訓練、識別、測試全過程示例

2020-02-24 09:32:13

pip使用清華源

2020-02-24 09:32:13

pytorch中一些基本的常識，懶得翻文檔快速理解

2020-02-24 09:32:13

訓練數據添加一定的擾動會增加模型泛化能力

2020-02-24 09:32:13

人工智能數學基礎——線性代數

菠萝小笨笨

2020-02-22 01:34:31

人工智能數學基礎——概率論

菠萝小笨笨

2020-02-22 01:34:31

24小時熱門文章

最新文章

最新評論文章