爲什麼要進行特徵縮放
比如說我們這裏有一個函數:
接下來我們分兩種情況來對比一下,從而說明我們爲什麼要進行特徵縮放:
左上角的框圖和右上角的框圖都能表示我們在最開始提出的函數,不同的是左上角的框圖中的取值是1,2····;的取值是100,200······;右上角的框圖中的取值是1,2······;的取值是1,2······。將左上角所示的式子的等高圖畫出來如左下角所示,因爲在左上角的情況下隨着的改變,的變化比較小,而隨着的變化的變化會比較大,因此形成了左下角所示的橢圓形狀。將右上角所示的式子的等高圖畫出來如右下角所示,因爲在右上角的情況下隨着和的改變,的變化基本相同,因此形成了右下角所示的圓形。
我們知道梯度下降的方向是沿着等高線的法線方向的如圖中紅色箭頭所示,可以看到右下角的紅色箭頭幾乎是沿一條直線朝着最低點運動過去的,而左下角的紅色箭頭是改變了多次方向才朝着最低點運動過去的。
所以當特徵值有相似的範圍的話梯度下降會比較快。
怎麼進行特徵縮放
也就是說要對紅色框裏面的進行特徵縮放的話,就要先求出綠框裏面元素的平均值,再求出綠框裏面元素的標準差,最後代入就可以求出縮放後的特徵值了。