深入理解線性迴歸算法（一）

原創

2018-11-13 01:59

前言

線性迴歸算法是公衆號介紹的第一個機器學習算法，原理比較簡單，相信大部分人對線性迴歸算法的理解多於其他算法。本文介紹的線性迴歸算法包括最小二乘法和最大似然法，進而討論這兩種算法蘊含的一些小知識，然後分析算法的偏差和方差問題，最後總結全文。

目錄

1、最小二乘法和最大似然法

2、算法若干細節的分析

3、偏差和方差

4、總結

最小二乘法和最大似然函數

最小二乘法

最大似然函數

假設訓練數據的目標變量t是由確定性方程y(x,w)和高斯噪聲疊加產生的，即：

其中是期望爲0，精度爲β（方差的倒數）的高斯噪聲的隨機抽樣。

目標變量t的分佈推導如下：

因此，目標變量t的分佈：

即觀測數據集的似然函數：

爲了書寫方便，求最大似然函數對應的參數：

似然函數取對數並不影響結果：

因此，對於輸入變量x，即可求得輸出變量t的期望。

期望值就是模型的預測輸出變量，與最小二乘法的預測結果相同。

算法若干細節的分析

偏置參數w0

線性迴歸表達式的偏置參數w0有什麼意義，我們最小化來求解w0，根據w0結果來說明其意義。

由w0結果可知，偏置參數w0補償了目標值的平均值（在訓練集）與基函數的值的加權求和之間的差。

圖形表示爲：

最小二乘法的幾何意義

根據最小二乘法的結果可以作如下推導：

圖形表示如下：

黑色線表示噪聲。

備註：推導公式是假設是非奇異矩陣（的行列式不等於0），若是奇異矩陣，則需要通過奇異值分解（SVD）成新的基向量，後續文章會講到。

噪聲模型分析

線性迴歸模型疊加的噪聲是假設均值爲0方差爲的高斯分佈，下面是筆者分析這一假設的原因。

假設噪聲是高斯分佈的原因：高斯分佈是實際生活中最常見的高斯分佈，採用高斯分佈的模型更貼近實際情況。

假設噪聲是均值爲0的原因：這個比較好理解，就是爲了方便計算，偏置參數w0包含了噪聲均值。

偏差和方差

最小二乘法和最大似然法構建的模型是一樣的，本文的線性迴歸表達式的複雜度用模型參數的個數來表示，模型參數個數越多，則模型複雜度越大；反之模型複雜度越小（只針對無正則化的線性迴歸方程）。本節討論模型複雜度與偏差和方差的關係。

高偏差

若模型參數個數比較少，即模型複雜度很低，模型處於高偏差狀態。

如下圖用直線去擬合正弦曲線。

高方差

若模型參數個數較大，即複雜度較高，則模型處於高方差（過擬合）狀態。

如下圖M=9擬合正弦曲線，模型訓練誤差爲0。

總結

本文介紹了最小二乘法和最大似然法來求線性迴歸的最優參數，分析了算法中容易忽視的某些細節，由於本文的線性迴歸表達式沒有正則化項，因此模型的複雜度等同於模型參數的個數，參數個數過多模型容易產生高方差（過擬合），參數個數過低模型容易產生高偏差，下節將要介紹貝葉斯線性迴歸算法，該算法很好的解決了複雜度的問題。

參考：

Christopher M.Bishop <<Pattern Reconition and Machine Learning>>

推薦閱讀文章

線性迴歸：不能忽視的三個問題

淺談頻率學派和貝葉斯學派

淺談先驗分佈和後驗分佈

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

CART實現

基於R的CART的實現包有tree,rpart. tree rpart

2020-07-07 22:26:30

Ridge regression

參考文獻 1.Hoerl A E, Kennard R W. Ridge regression: Biased estimation for nonorthogonal problems[J]. Technometrics, 19

2020-07-07 22:26:30

Python實現kd樹

kd樹的數據結構和二叉樹類似，每個節點存有當前節點的數值，左右子樹的節點，和以當前節點爲根節點的子樹的劃分維度。 class KdNode: def __init__(self, dim, val, left=None, ri

2020-07-07 00:33:04

PCA方法Python代碼實現

關於PCA方法的原理這裏就不介紹了，網絡上很多文章寫得都很好，這裏給出以三維點集的PCA爲例，在python裏實現PCA方法。 PCA方法的主要步驟是：數據中心化計算協方差矩陣根據協方差矩陣計算出特徵值和特徵向量 python代碼如

2020-07-07 00:33:04

hadoop 簡單入門與streaming常用配置參數說明

1. Hadoop包含兩核心部分 hdfs Hadoop distribute file system -- hadoop分佈式文件系統，存儲數據 Namenode、Datanode 常用命令形式：hadoop fs -ls / h

2020-07-06 23:19:09

假設空間版本空間&查全率查準率

一、假設空間版本空間根據P4表1.1和P5圖1.1得，假設空間爲： 1 色澤＝＊，根蒂＝＊，敲聲＝＊2 色澤＝青綠，根蒂＝＊，敲聲＝＊3 色澤＝烏黑，根蒂＝＊，敲聲＝＊4 色澤

liangyingyi1006

2020-07-04 10:41:01

Transformers與圖神經網絡的關係，我們能從transformer學習到什麼？

1、導讀這個觀點的目的是構建Transformer結構背後的NLP上的直覺，以及與圖神經網絡的聯繫。圖深度學習”聽起來很厲害，但有什麼大的商業成功的故事嗎？它有沒有被部署在實際app中？除了Pinterest、阿里巴巴和Tw

BUAA～冬之恋

2020-07-04 03:47:48

機器學習——分類算法之決策樹

機器學習——分類算法之決策樹前言1、信息熵2、條件熵ID3算法C4.5決策樹CART決策樹1、CART決策樹的分類算法2、CART決策樹的迴歸算法剪枝1、預剪枝2、後剪枝連續值和缺失值的處理1、連續值的處理2、缺失值的處理前言

2020-07-03 16:48:56

機器學習——分類算法之感知機

機器學習——分類算法之感知機前言符號函數感知機模型感知機算法1、原始形式2、對偶形式代碼前言感知機算法（perceptron）是用於二分類的線性分類模型，將輸入實例劃分爲正例和負例的一個超平面，屬於判別模型。感知機算法旨在求出

2020-07-03 16:10:50

機器學習——貝葉斯算法和樸素貝葉斯算法

機器學習——分類算法之貝葉斯算法和樸素貝葉斯算法前言一、貝葉斯算法算法示例二、樸素貝葉斯分類器1、貝葉斯決策論2、多元正太分佈參數的極大似然估計3、樸素貝葉斯分類器前言這部分的公式推導較多，涉及到了極大似然估計和貝葉斯估計，要

2020-07-03 16:10:50

機器學習——分類算法之邏輯迴歸

機器學習——分類算法之邏輯迴歸前言邏輯迴歸(Logistic Regression)1、Sigmoid函數2、算法推導3、代碼前言邏輯迴歸也被稱爲對數機率迴歸，注意這裏面說的迴歸並不是真正意義上的迴歸算法，其實它是一個經典的分

2020-07-03 16:10:50

邏輯迴歸解決多分類問題

邏輯迴歸解決多分類問題第一種方式：從類別入手1、OVO(one vs one)2、OVR(One Vs Rest)第二種方法：從算法入手傳統的邏輯迴歸只能處理二分類問題，對於多分類任務，主要有如下兩種方案。第一種方式：從類別入

2020-07-03 16:10:50

機器學習---線性迴歸算法梳理

線性迴歸算法梳理任務1 - 線性迴歸算法梳理一、基本概念二、線性迴歸的原理三、線性迴歸損失函數、代價函數、目標函數四、優化方法(梯度下降法、牛頓法、擬牛頓法等)五、線性迴歸的評估指標六、sklearn參數詳解任務1 - 線性迴歸

2020-07-03 16:09:47

windows系統下python快速註釋多行

以下才做適合於Windows系統。除了對每一行前面添加#的註釋方式外（如若要註釋多行，這種方式較慢），我們還可以考慮另外兩種註釋方式： 1、Ctrl + / （先選中要註釋的代碼，再按Ctrl + /） 2、用’’’ ‘’'或者

2020-07-03 16:09:36

淺談矩陣乘法與矩陣二次型

矩陣乘法是一種很有意思的運算，因爲說是乘法不如說是加法，或者說是向量的線性組合的過程。兩個矩陣的乘積C=AB,對於這個公式的線性組合方面理解有兩種，一種是從左邊看:，意思是矩陣C的第i行是B的行向量的線性組合，組合係數是A的第i

2020-07-05 02:10:13

24小時熱門文章

最新文章

最新評論文章