西瓜书第二章：模型评估与选择

原創

2018-09-04 17:54

训练误差（traning error）：学习器在训练集上的误差，训练误差极小可能产生过拟合（overfitting）。

泛化误差（generalization erro）：学习器在新样本上的误差，泛化误差极小可能产生欠拟合（underfitting）。

在机器学习的过程中会将数据分为训练集（training set)、验证集（development set）和测试集（test set），其中训练集用于训练模型，验证集用于评估测试的数据集，测试集是对最终的神经网络做无偏估计。而一般来说我们需要保证训练集和测试集的数据符合同一分布。

留出法（hold-out）：将D划分为两个互斥的集合，其中一个作为训练集，另一个作为测试集。

交叉验证法（cross validation）：将数据集D划分为k个大小相似的互斥子集，每个子集都尽可能数据分布的一致性，每次用k-1个子集的并集作为训练集，余下的作为测试集，这样可以得到k组训练/测试集，从而可进行k词训练和测试，最终返回这k个测试结果的均值，这种方法也被称为“k折交叉验证”（k-fold cross validation）。若D中有m个元素，且我们将数据集分为m个子集，此时可得到交叉验证法中的一个特例留一法（Leave-One-Out）。

自助法（bootstrapping）：给定包含m个样本的数据集D，对其进行采样产生数据集D'：每次随机从D中挑选一个拷贝放入D'，重复m次可得到包含m个样本的数据集D'，每个样本抽到的可能性为1/m。，即在m次采样中有36.8%的数据可能未被选择，若将D'作为训练集，D\D'（\表示减法）作为测试集，这样的测试结果称为“包外估计”（out-of-bag estimate）。