机器学习算法选择(带图)

原創

2020-04-03 01:19

机器学习算法选择

机器学习算法两个重要的概念：

天下没有白吃的午餐NFL(No Free Lunch)：没有一个学习算法可以在任何领域总是产生最准确的学习器。
概率近似正确PAC(Probably Approximately Correct)：当训练样本足够大时，“训练准确率”与“预测准确率”的差值，超出容忍误差范围的概率非常小。当模型在训练样本表现很好时，就可以十分有把握地认为它在“预测未来”时，表现一样好。

上述算法没有优劣之分，都仅适合特定的场景(选择时Try ＆ Test)。对于机器学习、人工智能以及大数据行业来说，不要过于迷信！

$正则化时，采用绝对值：loss(f) + \lambda |w|$

$正则化时，采用平方：loss(f) + \lambda w^2$

$正则化时，同时采用绝对值和平方根：loss(f) + \lambda_1 |w| + \lambda_2 w^2$

不需要指定类别的聚类算法DB SCAN(基于密度的聚类算法)，可以聚类任意形状
变分贝叶斯混合高斯模型VBGMM(Variational Beyesian Gaussian Mixed Model)，求出分布密度，然后一般归类为最大概率的一类。
混合高斯模型GMM(Gaussian Mixed Model)，常用于智能抠图算法，前景后景分离。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.