正則化方法 L1和L2

原創

nathan_deep

2020-04-27 18:52

模型訓練是圍繞解決模型的欠擬合問題展開的，通過最小化損失函數來減小模型預測值與真實值之間的誤差。因爲數據集中總會有一些噪聲，模型在擬合數據時可能會把噪聲也擬合進來，導致模型過擬合。

正則化是對損失函數的一種懲罰，即對損失函數中的某些參數進行限制。一般認爲，參數值較小的模型比較簡單，能更好地適應不同的數據集，泛化能力更強。正則化中最常用的正則項是L1範數和L2範數。

L1範數是權重向量中各元素的絕對值之和，一般用‖ω‖1表示；
L2範數是權重向量中各元素的平方和然後再求平方根，一般用‖ω‖2表示。假設模型只有兩個參數ω1和ω2，則L1範數爲‖ω‖1=|ω1|+|ω2|，L2範數爲‖ω‖2=.

L1範數和L2範數都可以降低模型過擬合的風險。L1範數是將權值變得更稀疏，可以使權值變爲0從而用於特徵選擇，使模型具有很好的可解釋性。L2範數不會使權值變爲0，而僅是儘可能地小，進而使每個特徵對模型的預測結果僅產生較小的影響。

對於L1範數，我們在參數ω1和ω2確定的平面上，分別畫出原始損失函數的等值線和正則項的等值線。橢圓曲線爲原始損失函數的等值線，其中點爲理想的最優解。圖中的方形線爲L1正則項等值線，它與原始損失函數等值線的交點即爲求得的最優解，可以看到，L1正則項等值線和原始損失函數等值線更容易相交於座標軸上，從而使L1得到稀疏解。

L2範數的正則項等值線與原始損失函數等值線更容易相交於某個象限中，因此L2範數會使權值更小，而非使其更稀疏。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

正則化方法 L1和L2

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

基於用戶的協同過濾算法(UserCF)

Q Learning 和SARSA算法

樸素貝葉斯算法(Naive Bayes) 原理總結

論文：Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

基於物品的協同過濾算法(ItemCF)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結