1、算法分類
數據類型:離散型數據和連續型數據
數據的類型將是機器學習模型不同問題不同處理的依據
(1) 監督學習(預測):特徵值+目標值
- 分類(目標值離散型): k-近鄰算法、貝葉斯分類、決策樹與隨機森林、邏輯迴歸,神經網絡
- 迴歸(目標值連續型):線性迴歸、嶺迴歸
- 標註:隱馬爾科夫模型
(2)非監督學習:只有特徵值
- 聚類:k-means
(3)相關概念
- 監督學習:可由輸入數據中學到或建立一個模型,並依此推測新的結果。輸入數據是由輸入特徵值和目標值組成。函數的輸出可以是一個連續的值(稱爲迴歸),或是輸出有限個離散值(稱作分類)。
- 分類:分類是監督學習的一個核心概念,在監督學習中,當輸出變量取有限個離散值時,預測問題變成分類問題。最基礎的便是二分類問題,即判斷是非,從兩個類別中選擇一個作爲預測結果。
- 迴歸:迴歸是監督學習中的一個重要問題。迴歸用於預測輸入變量和輸出變量之間的關係,輸出是連續型的值。
- 非監督學習:可以由輸入數據中學到或建立一個模型,並依此模式推測新的結果。輸入數據是由輸入特徵值組成。