機器學習筆記--常見算法(8)--logistic regression

原創

VoidWalker96

2019-07-30 03:26

文章目錄

0.邏輯迴歸的引出

對分類問題應用線性迴歸不是一個好主意
二分類問題：
0：negative class
1：positive class

If h(x)>0.5, predict y=1
If h(x)<0.5, predict y=0

Logistic regression: 0<h(x)<1

1.假設函數hypothesis function

線性迴歸的假設函數爲： $h_\theta(x)=\theta^Tx$

S 型函數/Sigmoid function/logistic function: $g(z) = \frac{1}{1+e^{-z}}$

logistic迴歸的假設函數爲： $h_\theta(x)=g(\theta^Tx)$
其中， $g(z) = \frac{1}{1+e^{-z}}$
所以，logistic迴歸的假設函數爲： $h_\theta(x)= \frac{1}{1+e^{-\theta^Tx}}$

假設函數 $h_\theta(x)$ 的意義：
$h_\theta(x)=P(y=1|x;\theta)$
$h_\theta(x)$ 表示在 $x,\theta$ 條件下 $y=1$ 的條件概率

決策邊界(decision boundary)

預測輸出y等於0還是1：通過判斷z＞0或z ＜ 0,即通過判斷 $\theta^Tx>0$ or $\theta^Tx<0$

（上圖：通過增加複雜的多項式特徵變量(平方，三次方等)，可以得到更復雜的決策邊界）

2.代價函數cost function

如何擬合邏輯迴歸模型的參數 $\theta$ ，即給定訓練集，根據數據自動擬合參數。

如果繼續使用線性迴歸時的代價函數，是非凸函數，有局部最優值，當使用梯度下降算法時可能找不到最優值。故選擇另一種代價函數。（凸函數是單弓形狀，凸函數無局部最優值）

代價函數：

代價函數：
$J(\theta)=\frac{1}{m}\sum_{i=1}^{m}Cost(h_\theta(x^{(i)})-y^{(i)})$
$J(\theta)=-\frac{1}{m}[\sum_{i=1}^my^{(i)}log(h_\theta(x^{(i)}))+(1-y^{(i)})log(1-h_\theta(x^{(i)}))]$

3.優化-梯度下降算法

（特徵縮放：如果特徵範圍差距很大時，可以用特徵縮放的方法，讓梯度下降收斂更快(類比線性迴歸)）

其他優化算法：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習筆記--常見算法(8)--logistic regression

文章目錄

0.邏輯迴歸的引出

1.假設函數hypothesis function

2.代價函數cost function

3.優化-梯度下降算法

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

過失不會被當成恥辱，而是會被當成學習的機會--《黑匣子思維》讀書筆記

pycharm下遠程連接服務器jupyter notebook

吐血整理-周志華演講合集

機器學習筆記--常見算法(7)--牛頓法

擴展歸併排序--小和問題/逆序對問題

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結