本文是《機器學習從零到掌握》系列之第2篇
【機器學習】機器學習從零到掌握之一 -- 教你理解K近鄰算法
僞代碼如下:
對未知類別屬性的數據集中的每個點一次執行以下操作:
(1)計算已知類別數據集中的點與當前點之間的距離;
(2)按照距離遞增次序排序;
(3)選取與當前點距離最小的k個點;
(4)確定前k個點所在類別出現的頻率
(5)返回前k個點出現頻率最高的類別作爲當前點的預測分類;
本篇博文涉及到的知識請參考下述博文:
k近鄰算法原理請參考:《機器學習實戰》第2章閱讀筆記1 K近鄰算法概述
sum()函數參考:Numpy中sum函數的使用方法(Python自帶sum函數)