特徵值縮放:
例子:有一個feature序列,x1基本大於10000,x2都是小於0.01的數,這樣可能需要花很長時間才能收斂,解決辦法就是特徵值縮放
這樣可以將數據控制在【-1,1】的區間內
過擬合問題和欠擬合問題都是由於特徵值沒有選好或者樣本太少引發的
過擬合的最簡單解決方法:刪除無用特徵,選取更簡單的擬合函數
欠擬合解決辦法:增加核心特徵,選取複雜函數
特徵值縮放:
例子:有一個feature序列,x1基本大於10000,x2都是小於0.01的數,這樣可能需要花很長時間才能收斂,解決辦法就是特徵值縮放
這樣可以將數據控制在【-1,1】的區間內
過擬合問題和欠擬合問題都是由於特徵值沒有選好或者樣本太少引發的
過擬合的最簡單解決方法:刪除無用特徵,選取更簡單的擬合函數
欠擬合解決辦法:增加核心特徵,選取複雜函數
Bag-of-Words 1.文字問題 2. 什麼是Bag-of-Words(具體例子) 3. 侷限性 1.文字問題 文本建模的一個問題是它很雜亂,機器學習算法之類的技術更喜歡定義明確的
講解的很清楚: https://www.cnblogs.com/wangguchangqing/p/12021638.html