【精簡推導】線性迴歸、嶺迴歸、Lasso迴歸（最小二乘法）

原創

风后奇门‘

2020-06-20 21:38

嶺迴歸（Ridge）

線性迴歸

線性迴歸模型方程形式：

矩陣形式：

線性迴歸的任務就是要構造一個預測函數來映射，輸入的特徵矩陣和標籤的線性關係。這個預測函數的本質就是我們需要構建的模型，而構造預測函數的核心就是找出模型的參數向量。

損失函數：

是樣本i的真實標籤，是預測標籤。

從損失函數可以看出其實這就是L2範式的平方。L2範式本質就是歐式距離（歐氏距離就是兩點相減平方然後開根號）。因此損失函數在這裏也是衡量真實值與預測值之間的距離，所以我們希望它越小越好。

即：

這就是SSE（Sum of Sqaured Error，誤差平方和）或者RSS（Residual Sum of Squares 殘差平方和）

有了損失函數我們就來盤它：

矩陣運算規則：

和

所以上式有：

矩陣求導規則（下面 $\alpha$ 代表常數）有：

所以上式等於：

讓其一階導數爲0，因此有：

左乘一個，則最後的結果有：

這就是它的最終結果，最小二乘法推導很簡單，但是有一個前提就是，的逆矩陣一定要存在（充分必要條件是特徵矩陣不存在多重共線性（可以理解爲矩陣的行列式結果不等於0））

矩陣求逆矩陣公式：

One more thing

RSS殘差平方和，它的本質是預測值與真實值之間的差異,我們只知道求解它的最小值，因爲不能爲負數因此越接近0越好，

但是由於它的和是一個無限大的和，求解它的最小值，究竟它要多小纔算我們的模型訓練好了呢？

迴歸問題的另外兩個損失函數（評價指標）:MSE（均方誤差，mean squared error），（越接近1，越好）

在中，分子是真實值和預測值之差的差值，也就是我們的模型沒有捕獲到的信息總量，分母是真實標籤所帶的信息量（像極了方差公式），所以其衡量的是1 - 我們的模型沒有捕獲到的信息量佔真實標籤中所帶的信息量的比例，所以，越接近1越好。

--------------------------------------------------------------分割線--------------------------------------

線性迴歸能夠用最小二乘法求解的前提條件就是需要特徵矩陣不存在多重共線性（不然矩陣行列式爲0，就無法求可逆矩陣了）

嶺迴歸和Lasso的存在就是爲了來修補這個漏洞的。

嶺迴歸（Ridge）

嶺迴歸就是在線性迴歸的損失函數後面加了一個L2正則化項。

前半部分已經推導過了，後半部分很簡單

最後得到：

從這裏可以看書，即時的行列式等於0，那麼加上一個 $\alpha I$ ，肯定存在一個，總體的行列式不爲0的情況，因此

總體的逆矩陣肯定存在。這就避免了線性迴歸的漏洞了。

Lasso迴歸

lasso迴歸就是在線性迴歸的式子後面加了一個L1正則化。

前半部分很熟悉了，後半部分與嶺迴歸有一些不同

從這了可以看到，Lasso迴歸和嶺迴歸區別很大，求導的式子中發現，似乎無法解決高度共線性問題。但是在現實生活中，一般是很少會遇到數據是精確相關（樣本特徵之間存在直接的倍數關係）的，因此可以假設的逆矩陣是存在的。

那麼我們就有：

Lasso不是從根本上解決多重共線性問題，而是限制多重共線性帶來的影響。

以上兩個迴歸都加了正則化，正則化都會起到壓縮係數的大小.對標籤貢獻少的特徵,最後係數會更小，也更容易被壓縮。不過，L1正則化和L2正則化的區別是：L2正則化會將係數壓縮到接近0（不等於0），但L1正則化主導稀疏性，會將係數壓縮到0（因此也說明Lasso迴歸可以用來做特徵選擇）

推薦資料： https://live.bilibili.com/12582510

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

風控指南：國內車險欺詐呈現四大趨勢

2024年4月11日，國家金融監督管理總局官網發佈國家金融監督管理總局關於《反保險欺詐工作辦法（徵求意見稿）》公開徵求意見的公告。《徵求意見》共6章、37條，明確反保險欺詐工作目標是建立“監管引領、機構爲主、行業聯防、各方協同”四位一體的

2024-05-23 12:16:45

五款擴展組件齊發 —— Volcano、Keda、Crane-scheduler 等，邀你體驗

今年 3 月，KubeSphere 啓動了首屆擴展組件開發者訓練營，吸引了 60 名開發者報名。經過一個半月的密集培訓和實戰演練，這些開發者成功打造了五款創新的擴展組件，現已全部上架至 KubeSphere Marketplace，歡迎大家

2024-05-23 11:17:40

基於 Milvus + LlamaIndex 實現高級 RAG

隨着大語言模型（LLM）技術的發展，RAG（Retrieval Augmented Generation）技術得到了廣泛探討和研究，越來越多的高級 RAG 檢索方法也隨之被人發現，相對於普通的 RAG 檢索，高級 RAG 通過更深化的技術細

2024-05-22 21:25:18

站在岸上學不會游泳 | 算法校招生的高效成長總結

在這個由數據編織、由算法驅動的時代，AI大模型正成爲推動社會進步的重要力量。我們不僅是變革的見證者，更是推動者和塑造者。感謝零售UP技術人欄目的邀請，本文藉此機會回顧一下自己的算法之路上的一些故事和思考，希望能帶給讀者一些幫助。介紹自

2024-05-22 11:56:42

全球廠商之最，華爲17篇論文入選國際數據庫頂會ICDE

本文分享自華爲雲社區《全球廠商之最，華爲GaussDB&GeminiDB，17篇論文入選國際數據庫頂會ICDE》，作者：GaussDB 數據庫。 5月13-17日，國際數據庫頂級學術會議 ICDE 2024 於荷蘭烏得勒支舉行。華爲Gau

2024-05-22 10:58:13

Gen AI 連接非結構化數據，Unstructured Data Meetup 第二場官宣杭州！

定了！6 月 15 日，備受硅谷開發者喜愛的 Unstructured Data Meetup 第二場將在杭州舉辦！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 202

2024-05-20 21:25:07

探索未知：風靡硅谷開發者的 Unstructured Data Meetup 即將登陸中國

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過

2024-05-15 21:26:01

爲程序員和新手準備的 8 大 Python 工具

Python 是一種開源編程語言，用於 Web 編程、數據科學、人工智能和許多科學應用。學習 Python 使程序員能夠專注於解決問題，而不是專注於語法，其豐富的庫賦予它完成偉大任務所需的力量。 1) IDLE 安裝 Python 時

2024-05-14 01:06:43

我宣佈，這是我找到的史上AI最全論文體系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

探索未知：風靡硅谷開發者的 Unstructured Data Meetup 即將登陸中國l

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過 80% 的

2024-05-13 21:25:35

攻擊者正在利用AI，對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

理論+實踐，帶你瞭解分佈式訓練

本文分享自華爲雲社區《大模型LLM之分佈式訓練》，作者：碼上開花_Lancer。隨着語言模型參數量和所需訓練數據量的急速增長，單個機器上有限的資源已無法滿足大語言模型訓練的要求。需要設計分佈式訓練（Distributed Trainin

2024-05-08 22:38:41

2024年DataOps趨勢預測：AI不會取代數據工程師

APM digest收集了多位行業專家對DataOps在2024的發展形勢及對IT和業務的影響的預測，這些技術最高管理者，包括Confluent技術戰略負責人Andrew Sellers的深刻洞見可能與你的感覺一致嗎？快來探討一下。數據可

2024-04-30 11:49:29

數字化轉型新篇章：企業通往智能化的新範式

早在十多年前，一些具有前瞻視野的企業以實現“數字化”爲目標啓動轉型實踐。但時至今日，可以說尚無幾家企業能夠在真正意義上實現“數字化”。在實現“數字化”的征途上，人們發現，努力愈進，彷彿終點愈遠。究其原因，還在於轉型一直落後於技術邊界的拓展

2024-04-29 21:22:20

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

24小時熱門文章

最新文章

最新評論文章