真别再纠结标准化还是归一化了

原創

2020-04-20 20:22

很多博客把他们搞混。毕竟字典也是把他们放一起了。

既然搞混，那混在一起看好了

在我看来他们其实都是对feature value做了变化就是了。纠结那么多概念的问题也没什么意义。

有些是不变化原数据分布的

其实均值方差变了那分布肯定就变了。我这里“不改变原数据分布”的意思是概率密度函数的形状不变。

$x_i=\frac {x_i-\mu} {\sigma}$
这个改得挺好，把原分布映射到均值为0方差为1的分布上。额外提一句，即便是均值0标准差1也不非得是标准正态分布，有很多博客乱写

下面的方法应用后原数据分布的概率密度函数形状仍然不变，只不过不一定是标准的0均值1标准差的分布而已。

$x_i=\frac{x_i-x_{min}}{x_{max}-x_{min}}$
$x_i=\frac{x_i-\mu}{x_{max}-x_{min}}$

有些会改变分布：

$x_i=log(x_i)$
$x_i=\frac{atan(x_i)*2} \pi$

还有很多变换方法，依据情况选择变换方法就是了。
另外并不是所有机器学习算法都需要归一或者标准化。看其原理就行了，不必多说。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pytorch分别用MLP和RNN拟合sinx

0 理論上帶有一個非線性函數的網絡能夠擬合任意函數。那顯然MLP和RNN是科研擬合sinx的。開頭先把結果給展示出來，然後是代碼，最後是我的過程。懶得看的直接看前半部分行了，過程給有興趣的人看看。先上結果圖注：每次訓練tor

2020-07-05 07:30:42

opencv+yolov3实现物体检测

效果： yolo， you only look once. 如此著名故事又多的模型，真的值得一試。我們是直接下載人家yolov3模型來用，所以需要下載幾個東西，除了detection是我們自己寫的代碼，其餘都要下載，文末分享了所

2020-06-23 06:59:22

Windows10安装TensorFlow-GPU详解

困了我幾天的TensorFlow安裝，今天終於安裝成功了。最後發現是版本的問題。。。。。😔😔😔😔😔😔 我主要參考下面的文章： https://www.cnblogs.com/apan008/p/11254688.html 最後附上

浅殇忆流年

2020-06-21 23:01:33

人工智能数学基础——最优化方法

人工智能的目標就是最優化：在複雜環境與多體交互中做出最優決策。幾乎所有的人工智能問題最後都會歸結爲一個優化問題的求解，因而最優化理論是人工智能必備的基礎知識。最優化理論（optimization）研究的問題是判定

菠萝小笨笨

2020-06-13 20:35:11

人工智能数学基础——数理统计

基礎的統計理論有助於對機器學習的算法和數據挖掘的結果做出解釋，只有做出合理的解讀，數據的價值才能夠體現。數理統計（mathematical statistics）根據觀察或實驗得到的數據來研究隨機現象，並對研究對象的客觀規

菠萝小笨笨

2020-06-13 20:35:00

一图看懂alpha-beta（α-β）剪枝

用之有弗盈

2020-06-02 01:37:38

ai讲师人工智能讲师叶梓《人工智能概念入门》机器学习深度学习讲师-15

大数据AI人工智能专家培训讲师叶梓团队

2020-04-23 00:34:40

简洁为什么用word2vec

2020-04-20 20:22:41

pytorch、torchvision离线pip

2020-02-24 09:32:13

pytorch深度学习 3层全连接层，使用MNIST，图片训练、识别、测试全过程示例

2020-02-24 09:32:13

pip使用清华源

2020-02-24 09:32:13

pytorch中一些基本的常识，懒得翻文档快速理解

2020-02-24 09:32:13

训练数据添加一定的扰动会增加模型泛化能力

2020-02-24 09:32:13

人工智能数学基础——线性代数

菠萝小笨笨

2020-02-22 01:34:31

人工智能数学基础——概率论

菠萝小笨笨

2020-02-22 01:34:31

24小時熱門文章

SQL优化-20231016

最新文章

最新評論文章