機器學習實戰源碼第二章KNN算法

from numpy import *
import operator
from os import listdir
import matplotlib.pyplot as plt

"""程序清單2-1 K近鄰算法"""
def classify0(inX, dataSet, labels, k):
    dataSetSize = dataSet.shape[0]
    diffMat = tile(inX, (dataSetSize, 1)) - dataSet
    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()
    classCount={}
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel, 0) + 1
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]

def createDataSet():
    group = array([[1.0, 1.1],[1.0, 1.0],[0,0],[0,0.1]])
    labels = ['A', 'A', 'B', 'B']
    return group, labels

if __name__ == "__main__":
    group, labels = createDataSet()
    #print(group)
    """[[1.  1.1]
         [1.  1. ]
         [0.  0. ]
         [0.  0.1]]"""
    #print(labels)
    """['A', 'A', 'B', 'B']"""
    #圖2-2
    # plt.scatter(group[:,0], group[:,1])
    # plt.show()
    #預測
    """[0, 0]是測試向量
       group 訓練集
       labels 標籤
       3 K值
    """
    pre = classify0([0, 0], group, labels, 3)
    print(pre)
    """B"""


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章