特徵歸一化

原創

大眼呆萌君

2020-02-23 11:19

題目（2）：爲什麼需要對數值類型的特徵做歸一化 (normalization)？

回答角度：

歸一化的方式
歸一化的作用
各方式的優劣

數據類型

結構化數據：數值型、類別型（ordinal, nominal）
非結構化數據：包含的信息無法用一個簡單的數值表示，並且每條數據的大小各不相同

歸一化方式

min-max scaling

Pro

may be useful where all parameters need to have the same positive scale

z-score normalization (aka standardization)

Con

sensitive to outliers

normalize vectors to a norm of one

歸一化原因

梯度下降法更易找到最優解

應用場景

需normalization的問題

linear regression, logistic regression, kNN with Euclidean distance, SVM, linear discriminant analysis, neural network, PCA, K-means

不需normalization的問題

decision tree, e.g. C4.5: split nodes based on information gain, which is not affected by normalisation.
graphical-model based classifiers, e.g. Fisher LDA, Naive Bayes

備註：統計文獻中通常稱爲feature scaling. min-max的方式稱爲normalization, z-score normalization稱爲standardisation。

參考文獻

《百面機器學習》

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

百面機器學習 #3 經典算法：02 邏輯迴歸

參考：百面機器學習西瓜書 02 邏輯迴歸Logistic Regression（對數機率迴歸） 2.1 邏輯迴歸和線性迴歸二者都使用極大似然法來對訓練樣本進行建模。在求解超參數的過程中，都可以使用梯度下降的方法

2020-07-06 05:06:31

梯度下降、隨機梯度下降法、及其改進

題目（155）：當訓練數據量特別大時，經典的梯度下降法存在什麼問題，需要做如何改進？題目（158）：隨機梯度下降法失效的原因。題目（160）：爲了改進隨機梯度下降法，研究者都做了哪些改動？提出了哪些變種方法？它們各有哪些特點？

大眼呆萌君

2020-07-04 19:24:32

機器學習中的凸和非凸優化問題

題目（145）：機器學習中的優化問題，哪些是凸優化問題，哪些是非凸優化問題？請各舉一個例子。凸優化定義凸優化問題非凸優化問題凸優化定義：公式、geometric insight 凸優化問題：邏輯迴歸

大眼呆萌君

2020-07-04 18:42:44

L1正則項與稀疏性

題目（164）：L1正則化使得模型參數具有稀疏性的原理是什麼？回答角度：幾何角度，即解空間形狀微積分角度，對帶L1限制的目標函數求導貝葉斯先驗解空間形狀 Step 1. 正則條件和限制條件的等價性 Step 2. L

大眼呆萌君

2020-07-04 18:42:44

驗證梯度的正確性

題目（152）：如何驗證求目標函數梯度功能的正確性？考點：微積分、Taylor expansion 近似（微積分）根據partial derivative的定義， ∂L(θ)∂θi=L(θ1,⋯ ,θi+h,⋯ ,θp)−L(

大眼呆萌君

2020-07-04 18:42:44

無約束優化問題的求解

題目（148）：無約束優化問題的優化方法有哪些？複習點：一階、二階算法和Taylor expansion之間的關係直接求解迭代求解一階算法二階算法直接求解 convex objective function

大眼呆萌君

2020-07-04 18:42:44

百面機器學習 #3 經典算法：01-3 核函數支撐向量機SVM

文章目錄1.3 非線性SVM與核技巧1.3.1 核函數1.3.2 核技巧在支持向量機中的應用1.3.3 常用核函數1.4 其他問題1.4.1 是否存在一組參數使SVM訓練誤差爲0：是1.4.2 訓練誤差爲0的SVM分類器一定存在嗎

2020-06-25 16:33:27

百面機器學習 #2 模型評估：01&02 精確率與召回率，假陽性與真陽性率，PR曲線和ROC曲線

文章目錄1. P-R（Precision-Recall）曲線F1 score2. 平方根誤差的侷限性3. ROC曲線ROC曲線繪製4. AUC predict Positive predict Negative

2020-06-25 16:33:24

百面機器學習 #3 經典算法：01-1 線性可分（硬間隔）支撐向量機SVM

文章目錄①從原始問題到對偶問題②對偶問題的解的形式化簡③從對偶問題的解到原問題的解④從原問題的解到分離超平面和決策函數、支撐向量參考李航統計學習方法第7章。支持向量機學習的基本想法是求解能夠正確劃分訓練數據集並且幾何間隔最

2020-06-16 09:02:10

百面機器學習 #3 經典算法：01-2 不完全線性可分（軟間隔）支撐向量機SVM

文章目錄①從原問題到對偶問題②對偶問題的解的形式化簡③從對偶問題的解到原問題的解④從原問題的解到分離超平面、決策函數、支撐向量假設訓練數據集不是線性可分的。通常情況是，訓練數據中有一些特異點（outlier），將這些特異點除去後

2020-06-16 09:02:10

《百面》-10.循環神經網絡

1.循環神經網絡和卷積神經網絡問題1：處理文本數據時，循環神經網絡與前饋神經網絡相比有什麼特點？答： nett=Uxt+Wht−1,hf=f(nett),y=g(VhT) net_t=Ux_t+Wh_{t-1},h_f=f(n

东东就是我

2020-06-16 05:54:26

《百面》-2.模型評估

目錄 1.評估指標的侷限性問題1.準確率的侷限性。問題2.精確率與召回率的權衡。問題3.平方根誤差的“意外” 2.ROC曲線 1.問題：什麼是ROC曲線？ 2.問題：如何繪製ROC曲線？ 3.問題：如何計算AUC？ 4.問題：R

东东就是我

2020-06-16 05:54:26

《百面》-9.前向神經網絡

5.深度卷積神經網絡問題1：卷積操作的本質特性包括稀疏交互和參數共享，具體解釋這兩種特性及其作用。答：在卷積神經網絡中，卷積核尺度遠小於輸入的維度，這樣每個輸出神經元僅與前一層特定局部區域內的神經元存在連接權重，我們稱這種

东东就是我

2020-06-16 05:54:26

《百面》-9.前向神經網絡

1.多層感知機與布爾函數問題1：多層感知機表示異或邏輯時最少需要幾個隱含層（僅考慮二元輸入）？答：一層問題2：如果只是用一個隱層，需要多少隱節點能夠實現包含n元輸入的任意布爾函數？答：問題3：考慮多隱層的情況，實現包含n元輸入的

东东就是我

2020-06-16 05:54:26

《百面》-7.優化算法

1.有監督學習的損失函數問題1：有監督學習涉及的損失函數有哪些？請列舉並簡述他們的特點。答：1.二分類問題，Y={1,-1} （1）0-1損失，非凸，非光滑，算法很難優化 ,,當P爲真時取值爲1，否則爲0. （2）Hinge，凸上界，

东东就是我

2020-06-16 05:54:25

24小時熱門文章

最新文章

最新評論文章