python——实现决策树分类


 
# -*- coding: utf-8 -*- from sklearn import tree #################################################################### #输入简单数据# "读入数据" X = [[0, 0], [1, 1]] Y = [0, 1] "训练数据" clf = tree.DecisionTreeClassifier() clf = clf.fit(X, Y) "预测 测试样本的类别" print(clf.predict([[2., 2.]])) #[1] "预测 测试样本属于某个类的概率大小" print(clf.predict_proba([[2., 2.]]))#[[ 0. 1.]] #################################################################### #输入sklearn提供的数据# "决策树适合二分类和多分类" from sklearn.datasets import load_iris from sklearn import tree "1、读入数据" iris = load_iris() clf = tree.DecisionTreeClassifier() "2、模型训练" clf = clf.fit(iris.data, iris.target) "如果我们有pydotplus,可以直接生成一个PDF文件" import pydotplus dot_data = tree.export_graphviz(clf, out_file=None) graph = pydotplus.graph_from_dot_data(dot_data) graph.write_pdf("iris.pdf") "3、预测样本所属类别" clf.predict(iris.data[:1, :])#iris.data[:1, :]表示取矩阵的几行几列,从0行到1行,0列到最后一列。(左包右闭) "4、预测样本所属类别的概率" print(clf.predict_proba(iris.data[:1, :])) #原文链接http://scikit-learn.org/stable/modules/tree.html#classification

 

 

 

 

 



 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章