聚類分析
對空氣數據進行聚類,對空氣質量的數值型指標數據進行分析,
聚類code如下:
參數信息設置
file1=r’C:\Users\Administrator\Desktop\data.csv’ # 參數1:讀取指定數據路徑文件
nnn=3 # 參數2:確定聚類個數
file2=r’C:\Users\Administrator\Desktop’ # 參數3:輸出數據到指定路徑
yyy=0 ##參數3:是否包含頭文件
安裝包
from sklearn.cluster import KMeans
import pandas as pd
import numpy as np
df = pd.read_csv(file1, header=yyy, encoding=‘utf-8’)
df1 = df
kmeans = KMeans(n_clusters=nnn, random_state=10).fit(df1)
df1[‘cluster_varision’] = kmeans.labels_
df_count_type = df1.groupby(‘cluster_varision’).apply(np.size)
##各個類別的數目
df_count_type
##聚類中心
kmeans.cluster_centers_
##新的dataframe,命名爲new_df ,並輸出到本地,命名爲new_df.csv。
new_df = df1[:]
new_df
new_df.to_csv(file2+r"\new_df.csv")
Python界面開發效果
通過Python的GUI界面進行開發,進行模型界面開發,效果如下所示: