機器學習基本概念(訓練集測試集)

1.訓練集(training set/data)/訓練樣例(training examples):用來進行訓練,也是產生模型或者算法的數據集

 測試集(testing set/data)/測試樣例(testing examples):用來專門進行測試已經學習好的模型或者算法數據集

 特徵向量(features / feature vector):屬性集合,通常用一個向量來表示,附屬於一個實例

 標記(label):c(x) , 實例類別的標記

  正例(positive example)

  反例(negative example)

2. 分類(classification):目標標記爲類別型數據

   迴歸(regression):目標標記爲連續性數值

3.有監督學習(supervised learning):訓練集有類別標記(class label)

  無監督學習(unsupervised learning):無類別標記

 半監督學習(semi-supervised learning):有類別標記的訓練集+無標記的訓練集

4.機器學習步驟框架

(1)把數據拆分成訓練數據和測試數據

(2)用訓練集和訓練集的特徵向量來訓練算法

(3)用學習來的算法運用在測試集上評估算法(涉及調整參數 parameter tuning)


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章