機器學習(二)-k-近鄰算法

優缺點:

優點: 精度高、對異常值不敏感、無數據輸入假定
缺點: 計算複雜度高、空間複雜度高
適用數據範圍: 數值型和標稱型

僞代碼

對未知類別屬性的數據集中的每個點依次執行以下操作:

  1. 計算已知類別數據集中的點與當前點之間的距離
  2. 按照距離遞增次序排序
  3. 選取與當前點距離最小的k個點
  4. 確定前k個點所在類別的出現頻率
  5. 返回前k個點出現頻率最高的類別作爲當前點的預測分類
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章