scikit-learn:聚類算法K-Means

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

class sklearn.cluster.KMeans (n_clusters=8, 
								init=’k-means++, 
								n_init=10, 
								max_iter=300, 
								tol=0.0001,
								precompute_distances=’auto’, 
								verbose=0, 
								random_state=None, 
								copy_x=True, 
								n_jobs=None, 
								algorithm=’auto’
							)

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

from sklearn.metrics import silhouette_score
from sklearn.metrics import silhouette_samples
X
y_pred
silhouette_score(X,y_pred)
silhouette_score(X,cluster_.labels_)
silhouette_samples(X,y_pred)

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

from sklearn.metrics import calinski_harabaz_score
X
y_pred
calinski_harabaz_score(X, y_pred)

雖然calinski-Harabaz指數沒有界,在凸型的數據上的聚類也會表現虛高。但是比起輪廓係數,它有一個巨大的優
點,就是計算非常快速。
在這裏插入圖片描述
在這裏插入圖片描述

X y
plus = KMeans(n_clusters = 10).fit(X)
plus.n_iter_
random = KMeans(n_clusters = 10,init="random",random_state=420).fit(X)
random.n_iter_

在這裏插入圖片描述

random = KMeans(n_clusters = 10,init="random",max_iter=10,random_state=420).fit(X)
y_pred_max10 = random.labels_
silhouette_score(X,y_pred_max10)
random = KMeans(n_clusters = 10,init="random",max_iter=20,random_state=420).fit(X)
y_pred_max20 = random.labels_
silhouette_score(X,y_pred_max20)

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章