1.1 引言
人类可以对很多未知的事物作出有效的预判,是因为我们已经积累了许多经验,而通过对经验的利用,就能对心的情况作出有效的决策。
同样的预判能力,计算机能够完成吗?
机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。机器学习所研究的主要内容就是“学习算法”,“学习算法”就是指计算机通过从数据中产生“模型”的过程。有了学习算法,我们为它提供数据,算法基于数据产生模型。产生的模型就可以完成类似于人类的预判能力。
1.2 基本术语
一般地,令表示m个实例的数据集,每个示例由d个属性描述,则每个示例
是d维样本空间X中的一个向量,X,其中是在第j个属性上的取值,d称为样本的“维度”(dimensionality).