決策樹

如何構建決策樹

  1. 準備工作:
    1. 明確自變量和因變量
    2. 確定信息度量的方式
    3. 確定終止條件
  2. 選擇特徵
    1. 得到當前待處理子集
    2. 計算所有特徵信息度量
    3. 得到當前最佳分類特徵
  3. 創建分支
    • 根據選中特徵將當前記錄分成不同分支,分支個數取決於算法
  4. 是否終止
    • 判斷是否滿足終止條件
  5. 生成結果
    • 判斷是否需要剪枝

案例

根據部分電腦購買記錄,對購買者建模。該模型可以基於客戶的一些信息預測他是否會購買電腦。

記錄標識 人羣羣體 收入層次 是否單身 信用等級 是否購買電腦
1 青年 一般
2 青年 良好
3 中年 一般
4 老年 一般
5 老年 一般
6 老年 良好
7 中年 良好
8 青年 一般
9 青年 一般
10 老年 一般
11 青年 良好
12 中年 良好
13 中年 一般
14 老年 良好

準備工作

  1. 觀察數據,明確自變量和因變量
    • 自變量:人羣羣體、收入層次、是否單身、信用等級
    • 因變量:是否購買電腦
  2. 明確信息度量方式:信息增益
    • 基尼係數
  3. 明確分支終止條件
    • 純度
    • 記錄條數
    • 循環次數



  構建一棵決策樹


觀察各自的分支,再根據情況選擇是否還需要再次挑選特徵進行區分,最終的結果如下。

各類決策樹算法的對比

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章