误差有两个方面:bias和variance。
简单的模型(如线性模型),variance比较小,且不容易受样品数据影响,不易过拟合。与此相反,复杂的模型的bias比较小。
如果你的模型都不能拟合训练数据,训练error比较大,说明模型欠拟合。这种情况下,需要重新设计你的模型,可能包括增加更多的特征或增加模型的复杂度。
如果你在训练集上可以得到很小的error,但在test集上却error很大,说明模型过拟合导致方差很大。在variance很大的情况下,有三种改进的方法:增大训练集、正则化、dropout。增大训练集可以同时降低bias和variance。数据集可能可以用各种方法人工产生。另一种方法是正则化,正则化有可能会伤害bias。
模型误差的来源
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
论文翻译——基于数据的最优直方图
y小川
2020-07-05 03:49:27
正规化和模型选择(Regularization and model selection)
y小川
2020-07-05 03:49:27
资料翻译——核密度估计简介
y小川
2020-07-05 03:49:27
论文翻译——用于大型社交网络的推荐系统:主要挑战及解决方案回顾
y小川
2020-07-05 03:49:27
MNIST数据集格式转化
jiarenyf
2020-07-02 01:58:14
机器学习: 逻辑回归(Logistic Regression) 小项目
小威威__
2020-07-01 21:05:53
机器学习:手写数字识别(Hand-written digits recognition)小项目
小威威__
2020-07-01 21:05:52
GBDT- gradient boosting decision tree
BojackHorseman
2020-07-01 03:21:08
1 - 统计学习方法概论
DawnRanger
2020-06-29 14:09:08
LLE(locally linear embedding)原理介绍
清心明月
2020-06-27 04:41:13
method_LLE(Locally linear embdding)
清心明月
2020-06-27 04:41:13
机器学习中的最优化方法进阶
前言: 在機器學習方法中,若模型理解爲決策模型,有些模型可以使用解析方法。不過更一般的對模型的求解使用優化的方法,更多的數據可以得到更多的精度。 一、線性規劃 線性規劃、整數規劃、目標規劃等
清心明月
2020-06-27 04:41:13
method_LPP(Locality preserving projections)
清心明月
2020-06-27 04:41:13
algo_KNN(k-nearest neighbor)
清心明月
2020-06-27 04:41:13