1.訓練集(training set/data)/訓練樣例(training examples):用來進行訓練,也是產生模型或者算法的數據集
測試集(testing set/data)/測試樣例(testing examples):用來專門進行測試已經學習好的模型或者算法數據集
特徵向量(features / feature vector):屬性集合,通常用一個向量來表示,附屬於一個實例
標記(label):c(x) , 實例類別的標記
正例(positive example)
反例(negative example)
2. 分類(classification):目標標記爲類別型數據
迴歸(regression):目標標記爲連續性數值
3.有監督學習(supervised learning):訓練集有類別標記(class label)
無監督學習(unsupervised learning):無類別標記
半監督學習(semi-supervised learning):有類別標記的訓練集+無標記的訓練集
4.機器學習步驟框架
(1)把數據拆分成訓練數據和測試數據
(2)用訓練集和訓練集的特徵向量來訓練算法
(3)用學習來的算法運用在測試集上評估算法(涉及調整參數 parameter tuning)