數據挖掘的知識點總結

數據挖掘的步驟:需求->數據抓取->特徵選擇->模型選擇->驗證->應用
雖然步驟是靈活的,但是筆面試還是以這樣的過程爲基準的

分析步驟:首先要做技術評估
1, 數據抽取統計分析:對於數據特徵有一個初步的把握
2, 數據清洗
3, 數據變換
4, 歸併和分類
5, 屬性選擇
6, 模型構建:如果採用低有效的算法,可以採用集成學習的方法來進行學習,得到一個評分的排名結果
7, 模型評價:採用幾種評價手段來進行分析:用戶召回率,人工分析,誤差分析,分類準確度分析,矩陣分析,28原則等
8, 結果分析:對算法的優缺點逐一分析,看有沒有提升的方法

需要了解的情況:
數據特徵
數據特性
從業務人員角度考慮得到的關鍵特徵
從運營方角度考慮的得到的關鍵特徵
固有模型

需要交付的文件:
模型及使用文檔
發現的一般規律
常見錯誤及解決方案
模型思路及今後可能的優化方向

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章