1.用自己的話描述一下,什麼是邏輯迴歸,與線性迴歸對比,有什麼不同?
線性迴歸:
邏輯迴歸:函數p = S(ax + b), 其中a和b是待求參數, S是邏輯斯蒂函數,然後根據p與1-p的大小確定輸出的值,通常閾值取0.5,若p大於0.5則歸爲1這類。
可以認爲邏輯迴歸的輸入是線性迴歸的輸出,將邏輯斯蒂函數作用於線性迴歸的輸出得到輸出結果。
線性迴歸與邏輯迴歸最大的區別就在於他們的因變量不同。
2.自述一下什麼是過擬合和欠擬合?
欠擬合的根本的原因是特徵維度過少,導致擬合的函數無法滿足訓練集,誤差較大。可以通過增加特徵維度來解決。
過擬合根本的原因則是特徵維度過多,導致擬合的函數完美的經過訓練集,但是對新數據的預測結果則較差。可以減少特徵維度; 人工選擇保留的特徵,或者模型選擇算法解決。或者將數據正則化; 保留所有的特徵,通過降低參數θ的值。
3.思考一下邏輯迴歸的應用場景有哪些?
(1)預測事件發生概率
(2)預測某個地方發病情況
(3)預測股票跌漲