Python數據挖掘與機器學習實戰——迴歸分析——邏輯迴歸

邏輯迴歸:

邏輯迴歸也被稱爲廣義線性迴歸模型,它與線性迴歸模型的形式基本上相同,最大的區別就在於它們的因變量(y)不同,如果是連續的,就是多重線性迴歸;如果是二項分佈(0或1、是或否等),就是邏輯迴歸。

Logistic迴歸雖然名字裏帶“迴歸”,但是它實際上是一種分類方法,主要用於兩分類問題(即輸出只有兩種,分別代表兩個類別)。邏輯迴歸就是這樣的一個過程:面對一個迴歸或者分類問題,建立代價函數,然後通過優化方法迭代求解出最優的模型參數,然後測試驗證我們這個求解的模型的好壞。

  • 優點:速度快、適合二分類問題、簡單易於理解、可以直接看到各個特徵的權重、能更容易的更新模型吸收新的數據
  • 缺點:對數據和場景的適應能力有侷限性,不如決策樹算法適應性強。

邏輯迴歸的用途主要有以下3個方面:

  • 尋找危險因素:尋找某一疾病的危險因素等
  • 預測:預測不同自變量情況下,發生某種疾病或某種情況的概率有多大
  • 判別:根據模型,判斷某人屬於某種疾病或屬於某種情況的概率有多大

邏輯迴歸的常規步驟

  • 尋找h函數(預測函數)
  • 構造J函數(損失函數)
  • 想辦法使得J函數最小,並求的迴歸參數

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章