“接着上一篇的內容,這篇主要講在PPT中提到的幾種分析方法以及每種方法的實現方式”
0、簡述
每一種分析方法都有整理好的案例介紹(在傳送鏈接裏,附python實現代碼),先馬後看。
1、分析方法
幾種主要的分析方法彙總如下:
種類 |
功能 |
算法 |
典型應用 |
分類 迴歸 |
分類 |
決策樹、神經網絡分類、區別分析、邏輯迴歸、概率迴歸 |
風險分析、客戶挽留分析、欺詐探測 |
迴歸 |
線性迴歸、非線性迴歸 |
收益率分析,收入預測,信用價值預測,客戶潛在價值預測 |
|
聚類 |
集羣分析 |
K-平均值,神經網絡聚類 |
客戶分割 |
關聯 規則 |
關聯分析 |
統計學,集合理論 |
交叉銷售。捆綁銷售 |
序列關聯分析 |
統計學,集合理論 |
交叉銷售 |
|
相似時間序列分析 |
統計學,集合理論 |
產品生命週期 |
|
時序 模型 |
時間序列預測 |
統計時間序列模型、神經網絡 |
銷售預測、利率預測、損失預測 |
分類模型和迴歸模型本質一樣,分類模型是將回歸模型的輸出離散化。
"talk is cheap, show you the code"
一定不能少的三個模型:
邏輯迴歸,決策樹,支持向量機
邏輯迴歸
Logistic 迴歸算法基於 Sigmoid 函數,或者說 Sigmoid 就是邏輯迴歸函數。
其函數曲線如下:
邏輯迴歸(Logistic Regression)是一種用於解決二分類(0 or 1)問題的機器學習方法,用於估計某種事物的可能性。比如某信用卡用戶發生逾期的可能性。
決策樹
決策樹對於單調的特徵變換是”indifferent”的,也就是說特徵的單調變換對於決策樹來說不會產生任何影響.優勢:
- 直觀的決策過程
- 能夠處理非線性特徵
- 考慮了特徵相關性
支持向量機
SVM最大的好處就是它只依賴於處於分類邊界的樣本來構建分類面,可以處理非線性的特徵,優勢:
- 可以處理高維特徵
- 使用核函數輕鬆應對非線的性特徵空間
- 分類面不依賴於所有數據
邏輯迴歸,決策樹,支持向量機三個模型的詳細介紹:
- 劃分聚類
- 層次聚類
- 基於密度的聚類
- 基於網格的聚類
- 用戶分羣
- 產品分類
- 異常檢測
- 市場組合分析
- 套裝產品分析
- 目錄設計
- 交叉銷售
2、數據分析工具
| 作者Info:
【作者】:A字頭
【原創公衆號】:數據札記倌(Data_Groom)
【簡介】:這是一個堅持原創的技術公衆號,每天堅持推送各種 Python基礎/進階文章,數據分析,爬蟲實戰,機器學習算法,不定期分享各類學習資源。
【福利】:送你新人大禮包一份,關注微信公衆號,後臺回覆:“CSDN” 即可獲取!