機器學習算法系列篇9：Lasso 和 Ridge迴歸算法

原創

2020-02-25 03:07

更多專業的人工智能相關文章，微信搜索 : robot-learner ，或掃碼

模型的參數空間過大可能導致過擬合，而Lasso和Ridge迴歸模型則是在線性迴歸模型的基礎上，通過正則規則增加了對參數的限制，從而達到參數稀疏化和減小過擬合的效果。

兩種迴歸模型分別對應的損失函數優化方法如下：

二者的區別是，Ridge迴歸算法的限制項是L2範數，而Lasso迴歸的限制條件是L1範數。根據優化過程的對等性，上面所列的有限制的優化過程其實等同於下面的優化過程：

可以看出，我們引進了了懲罰係數λ，從而使得有限制的優化過程簡單化。

在最小化上式的過程中，由於懲罰項的存在，λ越大，迴歸算法的係數越會被限制。而兩種迴歸算法的區別在於：

Ridge迴歸中，參數只是不斷接近於0，但是Lasso迴歸中，部分參數會完全被限制爲0。這個優化過程可以用下圖表示:

上面的示意圖反映了在Lasso （左圖）和Ridge （右圖）迴歸中的參數最小化的不同情況。在左圖中，β1被Lasso迴歸限制爲0，但在右圖中, β1和β2都變得很小但仍然無完全爲0。由於Lasso迴歸的這一特性，在需要得到比較稀疏的係數時候Lasso更爲常用。

比如下圖反映了，在Lasso迴歸中不斷調節λ係數的大小，可以達到不同的參數稀疏化程度。

上圖中，橫座標爲λ係數的大小，縱座標爲某個優化方程的各個β係數隨着λ係數變化而變化情況。可以看出，假設我們做許多的優化實驗，每次實驗中，λ係數不斷變大，則爲0的β係數越來越多。當λ係數大到一定程度，所有的β係數都爲0。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

機器學習算法原理系列篇12: 支撐向量機（support vector machine）算法推導

更多有趣和專業的人工智能相關文章，微信搜索 : robot-learner ，或掃碼支撐向量機算法（Support Vector Machine）是一種常用的分類算法，尤其在較小的樣本訓練集中能得到比其他算法更好的效果

2020-06-16 14:38:31

郵件地址賣到暗網！壞人學到了AI怎麼辦？

最近半年，博主經常受到信用監控的警告。剛看到警告比較緊張，還以爲信用卡信息被盜。仔細一看，說是電子郵件地址被放到了暗網上售賣。暗網是什麼，聽名字就不舒服：存在於黑暗網絡、覆蓋網絡上的萬維網內容，只能用特殊軟件、特殊授權、或對電腦做特殊設置

2020-06-16 14:38:31

AI分析：微信熱文有什麼特點？兼談中文分詞算法

我們能在朋友圈看到的許多傳閱多的公衆號文章，通常都是閱讀量達到10萬以上的熱文。即使是討論同樣的事情，爲什麼這些文章能夠被廣泛傳閱從而讓你忍不住點進去？我們不妨用大數據加上AI的方法來分析一下這個問題。爲了回答這個問題，

2020-06-16 14:38:31

想復工嗎？人體檢測原理先了解一下！

美國大面積的復工已經箭在弦上，不得不發了。一些人性化的州做出了一系列規定，比如保證人口密度，隔離間距等。這些規定，加大了僱主們復工的門檻，也是變相鼓勵遠程工作。可是，工作間的合作再算難免，很多面對面接觸的行業，僱主們如何才

2020-06-16 14:38:31

機器學習算法原理系列篇4：建模流程（上）

精彩人工智能相關文章，微信搜索 : robot-learner ，或掃碼機器學習建模流程涉及到幾個重要的步驟，如下圖所示。在下面的篇章中，我們就每一個步驟展開討論。數據收集獲得有效的數據是建模的第一個步驟。這

2020-06-16 14:38:31

機器學習算法原理系列篇13：決策樹和決策樹不同算法區別（decision tree)

決策樹算法，或者統稱Classification And Regression Tree (CART)，是在數據挖掘中常用的機器學習算法。決策樹也是一種非常直觀形象和易於理解的算法，總的來說是通過數學方法不斷區分數據的迭代方法。決

2020-06-16 14:38:31

梯度下降算法 (gradient descent agorithm)

更多專業的人工智能相關文章，微信搜索 : robot-learner ，或掃碼梯度下降並不是一種機器學習算法，而是在通過最小化損失函數從而獲得最佳參數的過程中常用的一種技術手段。微積分理論告訴我們，梯度爲函數在變量空間中任

2020-06-16 14:38:29

你的信用卡安全不？數據科學家怎麼破解信用卡欺詐？

2020-05-18 14:55:53

機器學習算法原理系列篇15：聚類算法

2020-04-26 11:17:06

機器學習算法原理系列篇14：集成算法，隨機森林和梯度增強機

2020-04-15 13:24:07

MIT: 深度學習發現新型抗生素，AI原理解析

2020-03-18 19:42:50

約束最優化問題：原問題和對偶問題，以及拉格朗日因子的符號

2020-02-25 03:07:25

機器學習算法原理系列篇1：金融風控中的機器學習

2020-02-25 03:07:25

機器學習算法原理系列篇6: 機器學習算法的推廣性

2020-02-25 03:07:25

機器學習算法原理系列篇3: 評分卡模型與邏輯迴歸

2020-02-25 03:07:25

24小時熱門文章

最新文章

機器學習算法系列篇9：Lasso 和 Ridge迴歸算法

最新評論文章