机器学习中各种算法的python小样例

原創

2020-04-27 01:40

机器学习算法

线性模型

决策树

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split

data = load_iris()

x_train, x_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.2)#划分训练集和验证集  比例4:1


classifier=DecisionTreeClassifier(max_depth=4) #决策树最大深度，默认使用基尼指数
classifier.fit(x_train, y_train)   #训练

pred =classifier.predict(x_test)   #预测    返回预测值
score =classifier.score(x_test, y_test)   #用测试集测试正确率

print(pred, y_test)
print(score)

iris是sklearn中自带的机器学习数据集，非常容易分类。通过load_iris()函数可以加载数据集，返回的是一个对象，对象包含data，target，feature_names,target_names，DESCR，filename，分别对应属性值，数据标签，每列属性的名字，标签类别名，数据集描述，数据文件所在位置。
基尼值：从某属性所有样本中随机抽出两个，两个样本标签不一样的概率。显然，基尼值越小，该属性数据集的纯度越大。
$Gini(D)=1-\sum^{|y|}_{k=1}p^2_k$
基尼指数：属性a的基尼指数定义为：
$Gini\_index(D,a)=\sum^{V}_{v=1}\dfrac{|D^v|}{D}Gini(D^v)$
所以，决策树在某个节点时，应选择基尼指数最小的属性划分该节点。

神经网络

支持向量机

贝叶斯分类

聚类

参考

【1】周志华机器学习
【2】https://github.com/pgmpy/pgmpy_notebook/blob/master/notebooks/1.%20Introduction%20to%20Probabilistic%20Graphical%20Models.ipynb

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

机器学习中各种算法的python小样例

机器学习算法

线性模型

决策树

神经网络

支持向量机

贝叶斯分类

聚类

参考

「Pygors跨平台GUI」1：Pygors跨平台GUI应用研究

[转帖]

python列出centos7内存使用前50的进程信息

Garnet：微软官方基于.NET开源的高性能分布式缓存存储数据库

Flink执行图

Java响应式编程

评估统计算法在银行伪造钞票检测中的价值

最小表示法-解決O(n)找循環字符串最小字典序串

解決Python 下載包慢的問題

Open vSwitch安裝及部署

OpenFlow建立連接交互流程學習

Telegram入門

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結