一開始,作者說如果使用準備好的數據集,可以下載他的decision_tree_example.txt。
然後通過my_data = [ line.split('/t') for line in file('decision_tree_example.txt') ]將數據加載進來。但是我發現,如果這樣做的話,每行後面那個字符串會有一個回車符/n(我一開始還沒注意,後來打印決策樹的時候發現不對勁)。
編寫個小函數去除最後那個回車符:
def loaddata():
data = []
for line in file('decision_tree_example.txt'):
#去掉回車符
line = line[0:-1]
#分割
data.append(line.split('/t'))
return data
注意:在數據中最後一行後面加一個回車,不然會去除最後一行最後一個字母。本可以在函數中進行操作,但修改數據最簡單。
使用時,在python shell中輸入data = treepredict.loaddata()。
PS:記錄下算是個小小的收穫。