機器學習算法選擇(帶圖)

原創

2020-04-03 01:19

機器學習算法選擇

機器學習算法兩個重要的概念：

天下沒有白吃的午餐NFL(No Free Lunch)：沒有一個學習算法可以在任何領域總是產生最準確的學習器。
概率近似正確PAC(Probably Approximately Correct)：當訓練樣本足夠大時，“訓練準確率”與“預測準確率”的差值，超出容忍誤差範圍的概率非常小。當模型在訓練樣本表現很好時，就可以十分有把握地認爲它在“預測未來”時，表現一樣好。

上述算法沒有優劣之分，都僅適合特定的場景(選擇時Try ＆ Test)。對於機器學習、人工智能以及大數據行業來說，不要過於迷信！

$正則化時，採用絕對值：loss(f) + \lambda |w|$

$正則化時，採用平方：loss(f) + \lambda w^2$

$正則化時，同時採用絕對值和平方根：loss(f) + \lambda_1 |w| + \lambda_2 w^2$

不需要指定類別的聚類算法DB SCAN(基於密度的聚類算法)，可以聚類任意形狀
變分貝葉斯混合高斯模型VBGMM(Variational Beyesian Gaussian Mixed Model)，求出分佈密度，然後一般歸類爲最大概率的一類。
混合高斯模型GMM(Gaussian Mixed Model)，常用於智能摳圖算法，前景後景分離。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.