原创 22Normalizaiton_layers

一、爲什麼要Normalization? ICS問題:由於數據尺度/分佈異常,導致訓練困難 由上圖中的D(H1)=n*D(x)*D(W)=1可知,第一個隱藏層的輸出等於上一層的輸入的方差和二者之間權重的方差的連乘,所以如果數據的