chapter7的一個小bug

一開始,作者說如果使用準備好的數據集,可以下載他的decision_tree_example.txt。

然後通過my_data = [ line.split('/t') for line in file('decision_tree_example.txt') ]將數據加載進來。但是我發現,如果這樣做的話,每行後面那個字符串會有一個回車符/n(我一開始還沒注意,後來打印決策樹的時候發現不對勁)。

 

編寫個小函數去除最後那個回車符:

def loaddata():
    data = []
    for line in file('decision_tree_example.txt'):

        #去掉回車符
        line = line[0:-1]

        #分割
        data.append(line.split('/t'))
    return data

 

注意:在數據中最後一行後面加一個回車,不然會去除最後一行最後一個字母。本可以在函數中進行操作,但修改數據最簡單。

使用時,在python shell中輸入data = treepredict.loaddata()。

 

PS:記錄下算是個小小的收穫。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章