決策樹ID3

簡介:
通過樣本數據集畫出決策樹,將測試數據從上到下依次做判斷即可得到結果


適用範圍:
標稱型數據(是/否),沒法處理數值型

步驟:
1.計算樣本數據集的香農熵;
2.按給定特徵劃分樣本數據集;
3.選擇最好的數據集劃分方式;
4.遞歸構建決策樹(沒有庫,自己定義畫圖函數)

缺點:
1.無法給出數據的內在含義;
2.容易出現過度匹配,可以裁剪決策樹,去掉一些不必要的葉子節點;
優點:
1.計算複雜度不高,輸出結果是決策樹,形式直觀,容易理解;
其他決策樹的構造算法,C4.5和CART;
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章