數據集:使用sklearn自帶的iris數據集,該數據集包含某種花類的觀察數據,包括四個特徵,花有三類。
①導入要用到的包:
from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
from sklearn.cluster import KMeans
②導入數據集:
iris = datasets.load_iris()
特徵值數據存儲在iris.data中,標籤在iris.target中:
③實現KNN:
neigh = KNeighborsClassifier(n_neighbors = 3)
neigh.fit(iris.data,iris.target)
print("預測結果:"+str(neigh.predict([[5,3,5,2]]))) #預測
④實現KMeans:
kmeans = KMeans(n_clusters = 3,random_state = 0).fit(iris.data)
print("kemeans:"+str(kmeans.labels_)) #打印聚類結果
print("target:"+str(iris.target)) #打印數據集標籤進行對比
結果:
藉助sklearn實現一些簡單的機器學習算法非常方便,但是要了解其中原理還是要花一些時間的!