機器學習——線性模型

原創

2018-08-26 09:29

線性模型

１．線性迴歸

1.1 問題及定義

線性迴歸模型是機器學習中的基本算法模型之一，可以用來解決預測房價等問題。如下圖所示的一個例子，房子因房子大小、臥室數目、地板數量等不同而有不同的價格，那麼給定了房子大小、臥室數目、地板數量我們能否預測出一個房子的價格呢？

我們使用線性迴歸來解決上述問題。
給定一個 $n$ 個特徵的實例 $x$ , $x = (x_{1}; x_{2}; x_{3}; . . .; x_{n})$ , 對於線性迴歸的假設定義爲：

\begin{matrix} (1) & h_{θ} = θ_{0} + θ_{1} x_{1} + θ_{2} x_{2} + . . . + θ_{n} x_{n} \end{matrix}

其中

θ

表示參數，

θ = {θ_{0}; θ_{1}; θ_{2}; θ_{3}; . . .; θ_{n}}

。爲了方便，我們引入

x_{0} = 1

，從而

x = (x_{0}; x_{1}; x_{2}; x_{3}; . . .; x_{n})

，然後將上述式子使用向量表示爲：

\begin{matrix} (2) & h_{θ} = θ^{T} x \end{matrix}

我們使用均方誤差來作爲線性迴歸的代價函數，

其中 $x^{(i)}$ 表示第ｉ個訓練實例的特徵向量， $y^{(i)}$ 表示第ｉ個訓練實例的真實值， $m$ 表示實例的個數。
我們可以通過用很多數據來訓練這個模型，得到是代價函數最小的參數 $θ$ ，然後使用這個模型來預測房價。
這裏我介紹兩種方法，一種是梯度下降，一種是最小二乘法。

方法一：梯度下降

我們讓代價函數對參數 $θ$ 求導，得到梯度，然後讓參數朝着負梯度方向優化， $a$ 表示學習率(learning rate)，優化更新步驟如下：

將代價函數代入：

求導後得到：

開始的時候可以隨機的選擇一系列參數，計算所有的預測結果之後，再更新這(n+1)個參數，如此循環直至收斂！

方法二：最小二乘法

最小二乘法是直接通過使代價函數對於參數 $θ$ 的導數爲０，直接計算出參數 $θ$ 的值，不過需要滿足一定的條件，而且當特徵維度很大的時候計算會很慢！
假設 $X = (x^{(1)}, x^{(2)}, x^{(3)}, . . ., x^{(m)}) \in R^{m \times (n + 1)}$ ，實例真實值是 $Y = (y_{1}, y_{2}, y_{3}, . . ., y_{m}) \in R^{m}$ ， $ｍ$ 上面說過表示實例的個數，那麼使用均值方差的代價函數可以使用向量表示爲：

\begin{matrix} (3) & J (θ) = (Y - X θ)^{T} (Y - X θ) \end{matrix}

對

θ

求導得到：

\begin{matrix} (4) & \frac{\partial J (θ)}{\partial θ} = 2 X^{T} (X θ - Y) \end{matrix}

令

\frac{\partial J (θ)}{\partial θ} = 0

得到：

\begin{aligned} (5) & 2 X^{T} (X θ - Y) = 0 \\ (6) & X^{T} X θ = X^{T} Y \\ (7) & θ = (X^{T} X)^{- 1} X^{T} Y \end{aligned}

只有當

X^{T} X

爲滿秩矩陣或正定矩陣時，即可以求逆矩陣，我們纔可以通過上述方法求得參數

θ

的值。通過這種方法求得的線性迴歸模型爲：

\begin{matrix} (8) & h_{θ} (x) = ((X^{T} X)^{- 1} X^{T} Y)^{T} x \end{matrix}

1.2 梯度下降和最小二乘法比較

總體來說，梯度下降實用性更強！

梯度下降	最小二乘法
需要選擇學習率 $α$	不需要
需要多次迭代	一次運算得出
當特徵數量 n 大時也能較好適用	需要計算 $(X^{T} X)^{- 1}$ ,如果特徵數量 n 較大則運算代價大,因爲矩陣逆的計算時間複雜度爲 $O (n^{3})$ ,通常來說當 n 小於 10000 時還是可以接受的
適用於各種類型的模型	只適用於線性模型，不適合邏輯迴歸模型等其他模型

1.3 實現例子

(待補充－－－－)

參考資料：
[1]Andrew course機器學習學習筆記
[2]周志華《機器學習》

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習——線性模型

線性模型

１．線性迴歸

1.1 問題及定義

方法一：梯度下降

方法二：最小二乘法

1.2 梯度下降和最小二乘法比較

1.3 實現例子

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

Navicat安裝與激活教程

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

基礎知識面試準備

Linux學習筆記(一)-Linux操作系統啓動流程以及系統關機命令

機器學習筆記(2)-決策樹

Linux學習筆記(八)-基於AIX/Linux平臺的項目開發

Linux學習筆記(五)-安全管理以及開發基礎技術

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

機器學習——線性模型

線性模型

１．線性迴歸

1.1 問題及定義

方法一： 梯度下降

方法二： 最小二乘法

1.2 梯度下降和最小二乘法比較

1.3 實現例子

方法一：梯度下降

方法二：最小二乘法