Python模型开发和聚类分析

聚类分析

对空气数据进行聚类,对空气质量的数值型指标数据进行分析,
在这里插入图片描述

聚类code如下:

参数信息设置

file1=r’C:\Users\Administrator\Desktop\data.csv’ # 参数1:读取指定数据路径文件
nnn=3 # 参数2:确定聚类个数
file2=r’C:\Users\Administrator\Desktop’ # 参数3:输出数据到指定路径
yyy=0 ##参数3:是否包含头文件

安装包

from sklearn.cluster import KMeans
import pandas as pd
import numpy as np

df = pd.read_csv(file1, header=yyy, encoding=‘utf-8’)
df1 = df
kmeans = KMeans(n_clusters=nnn, random_state=10).fit(df1)
df1[‘cluster_varision’] = kmeans.labels_
df_count_type = df1.groupby(‘cluster_varision’).apply(np.size)
##各个类别的数目
df_count_type
##聚类中心
kmeans.cluster_centers_
##新的dataframe,命名为new_df ,并输出到本地,命名为new_df.csv。
new_df = df1[:]
new_df
new_df.to_csv(file2+r"\new_df.csv")

Python界面开发效果

通过Python的GUI界面进行开发,进行模型界面开发,效果如下所示:
在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章