機器學習常用算法：Logistic Regression

原創

2020-06-17 09:37

邏輯斯諦分佈

設 $X$ 是連續隨機變量， $X$ 服從邏輯斯諦分佈是指 $X$ 具有下列分佈函數和密度函數：
分佈函數

F (x) = P (X \leq x) = \frac{1}{1 + e^{- (x - μ) / γ}}

密度函數

f (x) = F^{'} (x) = \frac{e^{- (x - μ) / γ}}{γ (1 + e^{- (x - μ) / γ})^{2}}

式中，

μ

爲位置參數，

γ

爲形狀參數。
其分佈函數是S形函數，其特點是當x趨於無窮大時，概率值趨於1；當x趨於無窮小時，概率值趨於0.

邏輯斯諦迴歸模型

邏輯斯諦迴歸模型是由以下條件概率分佈表示的分類模型，可用於二類或多類分類。

P (Y = k | x) = \frac{e x p (w_{k} \cdot x)}{1 + \sum_{i = 1}^{K - 1} e x p (w_{k} \cdot x)}, k = 1, 2, . . ., K - 1

P (Y = K | x) = \frac{1}{1 + \sum_{i = 1}^{K - 1} e x p (w_{k} \cdot x)}

式中， $x$ 爲輸入特徵， $w$ 爲特徵的權值向量。

邏輯斯諦迴歸比較兩個條件概率值的大小，將實例 $x$ 分到概率值較大的那一類。

補充：
機率：一個事件的機率是指該事件發生的概率與該事件不發生的概率的比值。如果事件發生的概率爲p，那麼該事件的機率爲 $\frac{p}{1 - p}$ ，該事件的對數機率是

l o g i t (p) = l o g \frac{p}{1 - p}

在邏輯斯諦迴歸模型中，輸出Y=1的對數機率爲

l o g i t (P (Y = 1 | x)) = l o g \frac{P (Y = 1 | x)}{1 - P (Y = 1 | x)} = w \cdot x

即輸出Y=1的對數機率是由輸入x的線性函數表示的模型

模型參數估計

對於給定的訓練集 $T = {(x_{1}, y_{1}), (x_{2}, y_{2}), . . ., (x_{N}, y_{N})}$ ，其中， $x_{i} \in ℜ^{n}$ ， $y_{i} \in {0, 1}$ 。可以應用極大似然估計法估計模型參數 $w$ ，從而得到邏輯斯諦迴歸模型。
設： $P (Y = 1 | x) = π (x)$ , $P (Y = 0 | x) = 1 - π (x)$
其似然函數爲

\prod_{i = 1}^{N} [π (x_{i})]^{y_{i}} [1 - π (x_{i})]^{1 - y_{i}}

其對數似然函數爲

\begin{aligned} L (w) & = \sum_{i = 1}^{N} [y_{i} log π (x_{i}) + (1 - y_{i}) log (1 - π (x_{i}))] \\ = \sum_{i = 1}^{N} [y_{i} log \frac{π (x_{i})}{1 - π (x_{i})} + log (1 - π (x_{i}))] \\ = \sum_{i = 1}^{N} [y_{i} (w \cdot x_{i}) - log (1 + e x p (w \cdot x_{i}))] \end{aligned}

對

L (w)

求極大值，即問題轉變爲以對數似然函數爲目標函數的最優化問題，通常採用梯度下降法或擬牛頓法可得到

w

的估計值

\hat{w}

，則學習到的邏輯斯諦迴歸模型爲

P (Y = 1 | x) = \frac{e x p (\hat{w} \cdot x)}{1 + e x p (\hat{w} \cdot x)}

P (Y = 0 | x) = \frac{1}{1 + e x p (\hat{w} \cdot x)}

結論

應用場景：
二分類問題：
郵件：垃圾郵件/非垃圾郵件
在線交易：是否欺詐（是/否）
腫瘤：惡性/良性

多分類問題：
電子郵件分類/標註：工作郵件，朋友郵件，家庭郵件，愛好郵件
醫療圖表(medical diagrams): 沒有生病，着涼，流感
天氣：晴天，多雲，雨，雪

logistic迴歸一般用於類別之前有聯繫的多分類問題
類別之間互斥則一般選擇softmax迴歸

優點：
1.實現簡單
2.分類時計算量非常小，速度很快，存儲資源低；

缺點：
1.容易欠擬合，一般準確度不太高
2.必須線性可分；

參考資料

Coursera公開課筆記: 斯坦福大學機器學習第六課“邏輯迴歸(Logistic Regression)”
統計學習方法，李航著，清華大學出版社

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習常用算法：Logistic Regression

邏輯斯諦分佈

邏輯斯諦迴歸模型

模型參數估計

結論

參考資料

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

Java ThreadPoolShutdown

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

通義千問 2.5 “客串” ChatGPT4，你分的清嗎？

“她”來了，陪伴賽道鉅變！爲GPT-4o加上你的一個數字分身

京東秒送售後系統退款業務重構心得| 京東零售技術團隊

經典排序算法：歸併排序(python)

pandas數據索引：loc、iloc和ix

機器學習常用算法：Logistic Regression

經典排序算法：快速排序(python)

MySQL基本操作

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結