典型的學習任務包括:
分類(classification)迴歸(regression)聚類(clustering)排序(ranking)密度估計(density estimation)特徵降維(dimensionality reduction)… …
1.1分類(classification)
基於已知類別標籤的樣本構成的訓練集,學習預測模型;最終預測模型,對新的觀測樣本,預測相應的輸出;預測結果爲事先指定的兩個或多個類別中的某一個,或預測結果來自數目有限的離散值之一。
兩類別 vs.多類別
類別數C=2, 兩類別分類(binary classification)
類別數C>2, 多類別分類(multiclass classification)
1.2迴歸(regression)
迴歸分析基於已知答案的樣本構成的訓練集,估計自變量與因變量之間關係的統計過程,進而基於該關係對新的觀測產生的輸出進行預測,預測輸出爲連續的實數值
1.3 聚類(clustering)
對給定的數據集進行劃分,得到若干“簇”;使得“簇內”樣本之間較“簇間”樣本之間更爲相似。通過聚類得到的可能各簇對應一些潛在的概念結構,聚類是自動爲給定的樣本賦予標記的過程。
聚類舉例
1.4特徵降維
將初始的數據高維表示轉化爲關於樣本的低維表示,藉助由高維輸入空間向低維空間的映射,來簡化輸入。
– 特徵提取,如PCA–高維數據的低維可視化
程序員陌然