特征值缩放:
例子:有一个feature序列,x1基本大于10000,x2都是小于0.01的数,这样可能需要花很长时间才能收敛,解决办法就是特征值缩放
这样可以将数据控制在【-1,1】的区间内
过拟合问题和欠拟合问题都是由于特征值没有选好或者样本太少引发的
过拟合的最简单解决方法:删除无用特征,选取更简单的拟合函数
欠拟合解决办法:增加核心特征,选取复杂函数
特征值缩放:
例子:有一个feature序列,x1基本大于10000,x2都是小于0.01的数,这样可能需要花很长时间才能收敛,解决办法就是特征值缩放
这样可以将数据控制在【-1,1】的区间内
过拟合问题和欠拟合问题都是由于特征值没有选好或者样本太少引发的
过拟合的最简单解决方法:删除无用特征,选取更简单的拟合函数
欠拟合解决办法:增加核心特征,选取复杂函数
Bag-of-Words 1.文字問題 2. 什麼是Bag-of-Words(具體例子) 3. 侷限性 1.文字問題 文本建模的一個問題是它很雜亂,機器學習算法之類的技術更喜歡定義明確的
講解的很清楚: https://www.cnblogs.com/wangguchangqing/p/12021638.html