k-近鄰算法（預）

原創

鲁鲁酱1996

2020-02-21 15:33

步驟1：準備，使用python導入數據

創建kNN.py文件，代碼如下：
注意格式！注意格式！注意格式！

#numpy爲科學計算包
from numpy import *
#operator爲運算符模塊，提供排序操作的函數
import operator
def createDataSet():
    group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels=['A','A','B','B']
    return group,labels

def classify0(inX,dataSet,labels,k):
    dataSetSize=dataSet.shape[0]
    diffMat=tile(inX, (dataSetSize,1))-dataSet
    sqDiffMat=diffMat**2
    sqDistances=sqDiffMat.sum(axis=1)
    distances=sqDistances**0.5
    sortedDistIndicies=distances.argsort()
    classCount={}
    for i in range(k): 
      voteIlabel=labels[sortedDistIndicies[i]]
      classCount[voteIlabel]=classCount.get(voteIlabel,0)+1
    sortedClassCount=sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)
    return sortedClassCount[0][0]

導入kNN模塊，並檢驗是否導入成功

>>> import kNN
>>> group,labels=kNN.createDataSet()
>>> group
array([[ 1. ,  1.1],
       [ 1. ,  1. ],
       [ 0. ,  0. ],
       [ 0. ,  0.1]])
>>> labels
['A', 'A', 'B', 'B']
>>>

步驟2：實施kNN分類算法

即我們在kNN.py中編寫的第二個函數classify0()，解析如下：

測試分類結果：

>>> kNN.classify0([0,0],group,labels,3)
'B'
>>> kNN.classify0([0,1],group,labels,3)
'B'

魯魯醬1996

發佈了53 篇原創文章 · 獲贊 27 · 訪問量 8萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

k-近鄰算法（預）

步驟1：準備，使用python導入數據

步驟2：實施kNN分類算法

R筆記之基礎建模技術

R語言筆記之裝袋樹和隨機森林

Numpy 函數庫基礎

R語言之數據操作

R語言筆記之數據科學算法總結

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結