邏輯迴歸:
邏輯迴歸也被稱爲廣義線性迴歸模型,它與線性迴歸模型的形式基本上相同,最大的區別就在於它們的因變量(y)不同,如果是連續的,就是多重線性迴歸;如果是二項分佈(0或1、是或否等),就是邏輯迴歸。
Logistic迴歸雖然名字裏帶“迴歸”,但是它實際上是一種分類方法,主要用於兩分類問題(即輸出只有兩種,分別代表兩個類別)。邏輯迴歸就是這樣的一個過程:面對一個迴歸或者分類問題,建立代價函數,然後通過優化方法迭代求解出最優的模型參數,然後測試驗證我們這個求解的模型的好壞。
- 優點:速度快、適合二分類問題、簡單易於理解、可以直接看到各個特徵的權重、能更容易的更新模型吸收新的數據
- 缺點:對數據和場景的適應能力有侷限性,不如決策樹算法適應性強。
邏輯迴歸的用途主要有以下3個方面:
- 尋找危險因素:尋找某一疾病的危險因素等
- 預測:預測不同自變量情況下,發生某種疾病或某種情況的概率有多大
- 判別:根據模型,判斷某人屬於某種疾病或屬於某種情況的概率有多大
邏輯迴歸的常規步驟
- 尋找h函數(預測函數)
- 構造J函數(損失函數)
- 想辦法使得J函數最小,並求的迴歸參數