關於機器學習中分類和迴歸的一點點思考

基本概念和案例對比

  我本來在想對體育賽事的勝負預測和短時交通流預測到底有什麼不同,都是利用前一段歷史數據來預測之後的結果,今天看到關於分類和迴歸的定義,也讓我對此有了更深的理解。

若我們欲預測的是離散值,此類學習任務稱爲“分類”(classification);若預測的是連續值,則此類學習任務稱爲“迴歸”(regression)

  體育賽事的勝負預測,從輸出結果來看,只存在有{"勝","負},是一個二分類問題(binary classification),只涉及兩個類別:正類(positive class)和反類(negative class)。 當涉及到多個類別時,則稱爲多分類(multi-class classification)任務。

形式化描述

  預測任務是希望通過對訓練集\left \{(x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m})}{ \right \}進行學習,建立一個從輸入空間X到輸出空間Y的映射:f:X\rightarrow Y

  •   對於二分類任務,通常令Y=\left \{ -1,+1 \right \}\left \{ 0,1 \right \};
  •   對於多分類任務,\left | Y \right |> 2;
  •   對於迴歸任務,Y=\mathbb{R},\mathbb{R}爲實數集。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章