在機器學習中,決策樹是一種預測模型。
它代表的是對象屬性與對象值之間的一種映射關係。
樹中每個節點表示某個對象,而每個分叉路徑則代表的某個可能的屬性值,而每個葉結點則對應從根節點到該葉節點所經歷的路徑所表示的對象的值。每個決策樹可以依靠對源數據庫的分割進行數據測試。這個過程可以遞歸式的對樹進行修剪。 當不能再進行分割或一個單獨的類可以被應用於某一分支時,遞歸過程就完成了。
決策樹僅有單一輸出,若欲有複數輸出,可以建立獨立的決策樹以處理不同輸出。
於ID3算法在實際應用中存在一些問題,於是Quilan提出了C4.5算法,嚴格上說C4.5只能是ID3的一個改進算法。
load fisheriris
t = classregtree(meas,species,...
'names',{'SL' 'SW' 'PL' 'PW'})
treetype = type(t)
view(t)
%% 預測的實例
predicted = t([NaN NaN 4.8 1.6])