機器學習（Coursera）（三、邏輯迴歸）

原創

qimo00

2018-08-31 03:28

機器學習（Coursera）（三、邏輯迴歸）

標籤（空格分隔）：機器學習邏輯迴歸

邏輯迴歸

分類問題

例如腫瘤診斷，電子郵件分類，是否存在欺詐等問題中，應用的是分類的特性。嘗試預測某一個樣本應該分在哪一類裏。

將因變量分爲正向類1(positive)和負向類0(negative)，則因變量 $y \in {0, 1}$
因此腫瘤二分類可以用 $y = 0 o r 1$ 表示良性和惡性。

分類問題不能用線性迴歸，因爲線性迴歸存在當x輸入較大y也就很大的問題。並且如圖如果有一個樣本點在很右側，那麼線性迴歸就會收到很大的影響，導致誤差很大。
這時候就需要一個類似階梯函數的假設函數來進行分類，也就是邏輯迴歸。適用於標籤y爲離散點的情況。

假說表示

分類中只需要輸出0/1，不需要預測連續的值，所以：

引入一個新的模型 $h_{θ} (x) = g (θ^{T} X)$ ，其中 $X$ 表示特徵向量， $g$ 表示邏輯函數(logistic function)通常用sigmoid函數
$g (z) = \frac{1}{1 + e^{- z}}$ 。

$h_{θ} (x)$ 的作用是對於給定的輸入變量，根據選擇的參數計算輸出變量=1的可能性(estimated probablity)，即 $h_{θ} (x) = P (y = 1 | x; θ)$ 。
給定樣本X，計算 $h_{θ} (x)$ 對應爲上述的概率。

判定邊界

決策邊界(decision boundary)。

決策邊界，就是我們學習後得到的分類的一條邊界線或這超平面。使這個超平面可以通過我們的樣本特徵進行劃線分類。

代價函數cost function

邏輯迴歸的代價函數和線性迴歸的代價函數不相同。如果按照線性迴歸的代價函數那麼會導致costfunction非凸。所以要重新定義。

$J (θ) = - \frac{1}{m} \sum_{i = 1}^{m} [y^{(i)} l o g (h_{θ} (x^{(i)})) + (1 - y^{(i)}) l o g (1 - h_{θ} (x^{(i)}))]$

這樣構建的特點：當實際y=1時且 $h_{θ} (x)$ 也爲1時，誤差爲0，當 $h_{θ} (x)$ 爲0時誤差很大代價很大。當y=0時類似。

也就是在不同的實際分類下，選取不同的函數，但是寫爲同一個函數。

有了代價函數後，就可以用梯度下降法求是代價函數最小的參數了。同樣也是對參數 $θ$ 求偏導。

推導過程：

得到的結果，與線性迴歸很相似。但是由於假設函數h不同導致推到過程完全不同，意義也不同。

多分類

分爲一對多進行。在分某一類時，把其他多個類看爲一類，這樣就簡化成了多個二分類，得到了多個假設函數 $h_{θ}^{(i)} (x) = p (y = i | x, θ)$ 。當使用分類時，需要對多個假設函數分別計算對應概率，然後取概率最高的那個分類。

正則化

過擬合問題

什麼是過擬合（overfit）和欠擬合（underfit）？
如果我們有很多的特徵，我們通過學習可以對訓練樣本有很好的擬合，但是可能不會推廣到新的數據。
欠擬合：不能很好的適應我們的訓練集。
過擬合：過分強調描述訓練集的特徵，而丟失了算法的本質，不能預測新數據。
在多項式中x次數越高，對訓練集擬合的越好，但相應的預測能力可能就變差了。

正則化函數

預測假設函數(模型)： $h_{θ} (x) = θ_{0} + θ_{1} x_{1} + θ_{2} x_{2} + θ_{3} x_{3}^{2} + θ_{4} x_{4}^{2}$
這個模型中，高次項的存在可能導致了過擬合，所以如果能讓高次項的係數近似等於0的話，就會減少過擬合，得到好的擬合效果。
修改代價函數，對 $θ_{3}, θ_{4}$ 做一些懲罰，使之對代價函數的影響減少。
$J (θ) = \frac{1}{2 m} [\sum_{i = 1}^{m} (h_{θ} (x^{(i)}) - y^{(i)}) + λ \sum_{i = 1}^{n} θ_{j}^{2}]$
其中 $λ$ 被稱爲正則化參數(Regularization Parameter)。按慣例不對 $θ_{0}$ 懲罰。這裏是對n個參量進行懲罰，對應的是n個特徵。

那爲什麼增加一項 $λ$ 可以使 $θ$ 減小？
因爲如果零 $λ$ 很大的話，爲了使costfunction儘可能小，那麼所有的 $θ$ 都會在一定程度上減小。
但若 $λ$ 太大，則所有值都趨近於0，只能得到一條直線。

正則化線性迴歸

梯度下降：增加了正則項，但是對於 $θ_{0}$ 不懲罰所以對j=0單獨處理。
正規方程：同樣可以用之前的推導公式進行推導。

正則化邏輯迴歸

模型：

加入正則項後代價函數：
$J (θ) = \frac{1}{m} \sum_{i = 1}^{m} [- y^{(i)} l o g (h_{θ} (x)) - (1 - y^{(i)}) l o g (1 - h_{θ} (x^{(i)}))] + \frac{λ}{2 m} \sum_{j = 1}^{n} θ_{j}^{2}$

import numpy as np
def costReg(theta, X, y, learningRate):
    theta = np.matrix(theta)
    X = np.matrix(X)
    y = np.matrix(y)
    first = np.multiply(-y, np.log(sigmoid(X*theta)
    second = np.multiply(1-y, np.log(1-sigmoid(X*theta.T)))
    reg = (learningRate/2*len(X))*np.sum(np.power(theta[:, 1:theta.shape[1], 2]))
    return np.sum(first, second)/(len(X)) + reg

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習（Coursera）（三、邏輯迴歸）

機器學習（Coursera）（三、邏輯迴歸）

邏輯迴歸

分類問題

假說表示

判定邊界

代價函數cost function

多分類

正則化

過擬合問題

正則化函數

正則化線性迴歸

正則化邏輯迴歸

10分鐘搞定Mysql主從部署配置

如何使用 JS 判斷用戶是否處於活躍狀態

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

lightdb數據庫超時相關控制參數

lightdb秒級增加列和刪除列（not null帶默認值）

Java ThreadPoolShutdown

Python算個開始吧

Python一些基礎的東西1

一些別的

面向對象OOP

第一篇嘗試

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結