Logistic Regression算法筆記

原創

趙大宝

2018-09-05 08:51

機器學習中的邏輯迴歸Logistic Regression

假設數據服從 u=0, s=1 的邏輯斯蒂分佈
logistic迴歸爲什麼要使用sigmoid函數

Logistic Function

邏輯迴歸（Logistic Regression）的名稱是由其使用的核心函數–Logistic function得來的。

Logistic函數也叫作Sigmoid函數，最初由統計學家發明用來描述生態學中人口增長的特點。起初階段大致是指數增長然後隨着接近環境容量開始變得飽和，增加變慢；最後，達到成熟時增加停止。

Logistic 函數曲線是S型，能將任何實數映射到0~1之間，但又無法達到其極限。

σ (z) = \frac{1}{1 + e^{- z}}

Representation Used for Logistic Regression

Logistic regression的公式表達出來很像線性迴歸。
邏輯迴歸與線性迴歸的關鍵不同在於：線性迴歸的輸出值爲二元值（0、1）而不是概率數值。
將輸入變量(x)與權重(weights)或偏差係數（ $β$ ）線性結合來預測輸出值(y)

\hat{y} = σ (w^{T} x + b) == \frac{e^{w^{T} x + b}}{1 + e^{w^{T} x + b}}

其中

w^{T}

是單一輸入變量x的權重係數，b是噪音係數。你輸入數據的每一列都有一個相關聯的實數常量係數b，其由訓練學習而來。

Logistic Regression損失函數

假設有m組訓練樣本 $(x^{(1)}, y^{(1)}), . . ., (x^{(m)}, y^{(m)})$ ,你需要訓練你模型的參數使 ${\hat{y}}^{(i)} \approx y^{(i)}$
Loss(error) function:

L (\hat{y}, y) = - (y \log \hat{y} + (1 - y) \log (1 - \hat{y}))

Why not 爲什麼不使用誤差平方和來作爲代價函數：

L (\hat{y}, y) = \frac{1}{2} (\hat{y} - y)^{2}

這時候的代價函數是非凸的，也就是函數圖像中會出現許多的局部最小值，導致梯度下降法極其容易得到局部最小值。如下：

Cost function:

J (w, b) = \frac{1}{m} \sum_{i = 1}^{m} L ({\hat{y}}^{i}, y^{i}) = - \frac{1}{m} \sum_{i = 1}^{m} [y^{i} \log {\hat{y}}^{i} + (1 - y^{i}) \log (1 - {\hat{y}}^{i})]

Sigmod函數求導

\begin{matrix} (1) & \begin{aligned} σ^{'} (z) & = {\frac{1}{1 + e^{- z}}}^{'} \\ = \frac{d}{d z} \frac{1}{1 + e^{- z}} \\ = \frac{e^{- z}}{(1 + e^{- z})^{2}} \\ = \frac{1 + e^{- z} - 1}{1 + e^{- z}} \cdot \frac{1}{1 + e^{- z}} \\ = \frac{1}{1 + e^{- z}} \cdot (1 - \frac{1}{1 + e^{- z}}) \\ = σ (z) [1 - σ (z)] \end{aligned} \end{matrix}

邏輯迴歸中我們的目標就是最小化損失函數

J (θ)

令

\hat{y} = h_{θ} (x)

J (θ) = - \sum_{i} (y^{(i)} \log (h_{θ} (x^{(i)})) + (1 - y^{(i)}) \log (1 - h_{θ} (x^{(i)}))) .

Logistic迴歸優缺點：

優點：實現簡單，易於理解和實現；計算代價不高，速度很快，存儲資源低；
缺點：容易欠擬合，分類精度可能不高

正則化的Logistic Regression

logistic迴歸通過正則化（regularization）懲罰參數，防止其取得過大，可以避免過擬合問題（overfitting），其代價函數如下：

References:
[1] https://www.coursera.org/learn/neural-networks-deep-learning/lecture/5sdh6/logistic-regression-gradient-descent
[2] [Machine Learning & Algorithm]CAML機器學習系列1：深入淺出ML之Regression家族

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Logistic Regression算法筆記

機器學習中的邏輯迴歸Logistic Regression

Logistic Function

Representation Used for Logistic Regression

Logistic Regression損失函數

Sigmod函數求導

Logistic迴歸優缺點：

正則化的Logistic Regression

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

Navicat安裝與激活教程

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

python正則表達式從字符串中提取數字的思路詳解

智能投顧

IPFS

【Leetcode】K sum problem

MinGW

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結