KNN中的kd樹筆記

原創

西红柿炒辣椒

2018-09-17 00:01

首先，講一下kd樹的概念，實現k近鄰法時，主要考慮的問題是如何對訓練數據進行快速k近鄰搜索。這在特徵空間的維數大及訓練數據容量大時尤其必要。k近鄰法最簡單的實現是線性掃描（窮舉搜索），即要計算輸入實例與每一個訓練實例的距離。計算並存儲好以後，再查找K近鄰。當訓練集很大時，計算非常耗時。爲了提高kNN搜索的效率，可以考慮使用特殊的結構存儲訓練數據，以減小計算距離的次數。

看來統計學習中的kd樹的講解，感覺講的有點囉嗦，我個人對kd樹的理解是這樣的。

首先，你對你的數據集中的第一個屬性進行一次劃分，可以根據他的中位數進行一個劃分，然後第一個屬性劃分完之後你可以再根據第二個屬性進行劃分，同樣的你可以根據他的中位數進行劃分，然後繼續對剩下的屬性進行一個劃分，劃分完之後就形成了一個如下圖的kd樹。假設數據集是

T={(2,3),(5,4),(9,6),(4,7),(8,1),(7,2)}T={(2,3),(5,4),(9,6),(4,7),(8,1),(7,2)}，構造一個平衡kd樹：

但是，就算形成了一個平衡樹，也可能這顆樹的搜索效率不是一個最好的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

基於DL的計算機視覺（2）--實現圖像分類最簡單的方法：KNN

1. 圖像分類問題這是人每天自然而然會做的事情，普通到大部分時候，我們都感知不到我們在完成一個個這樣的任務。早晨起牀洗漱，你要看看洗漱臺一堆東西中哪個是杯子，哪個是你的牙刷；喫早餐的時候你要分辨食物和碗碟… 抽象一下，對於一張輸

2020-07-04 22:45:57

【ML從入門到入土系列03】K近鄰

文章目錄1 理論1.1 距離的度量方式1.2 k 值的選擇1.3 分類決策規則2 代碼3 參考 1 理論簡單地講，KNN 思想就是給定一個訓練數據集，對於新的輸入實例，在訓練集中找到與該實例最近鄰的 k 個實例，這 k 個實例的

2020-07-03 16:10:50

【機器學習】k近鄰算法（kNN）

一、寫在前面本系列是對之前機器學習筆記的一個總結，這裏只針對最基礎的經典機器學習算法，對其本身的要點進行筆記總結，具體到算法的詳細過程可以參見其他參考資料和書籍，這裏順便推薦一下Machine Learning in A

2020-07-03 10:57:41

KNN（K近鄰）總結

一、KNN思想簡介 KNN 採用的是“物以類聚，人以羣分”的思想。也就是找出K個距離待遇測點最近的數據點，然後根據這K個點的類別（或者數值），根據一定的規則判斷（或者計算）得到帶預測點的類別（或者數值）。 KNN的核心就是找出

笨拙的石头

2020-07-03 00:36:35

機器學習~KNN算法

文章目錄概述原理算法描述實踐Sk-learn中調用KNN算法參考概述 KNN鄰近算法，或者說K最近鄰(kNN，k-NearestNeighbor)分類算法是數據挖掘分類技術中最簡單的方法之一。所謂K最近鄰，就是k個最近的鄰居的意

2020-07-02 09:52:07

機器學習~KNN算法的更多思考

文章目錄KNN算法引出的問題數據歸一化最值歸一化（normalization）均值方差歸一化（standardization）sklearn實現缺失數據處理分類特徵處理參考 KNN算法引出的問題迴歸我們最開始的KNN算法例子，具

2020-07-02 09:52:07

[Kaggle] Digit Recognizer 手寫數字識別

文章目錄1. Baseline Digit Recognizer 練習地址相關博文：[Hands On ML] 3. 分類（MNIST手寫數字預測） 1. Baseline 讀取數據 import pandas as pd

2020-07-01 16:17:31

[scikit-learn 機器學習] 3. K-近鄰算法分類和迴歸

文章目錄1. KNN模型2. KNN分類3. 使用sklearn KNN分類4. KNN迴歸本文爲 scikit-learn機器學習（第2版）學習筆記 K 近鄰法（K-Nearest Neighbor, K-NN）常用於搜索

2020-07-01 16:17:31

非參方法-K NearestNeighbor（KNN）

非參方法-K NearestNeighbor（KNN） KNN方法作爲一種無參方法，使用起來十分簡單，方便。更爲重要的是它往往能夠得到很好的效果。它既可以應用到分類中，也可以應用到迴歸中，是一種十分重要的方法。問題：給定一組訓

2020-06-29 17:16:15

第三章-KNN(分類和迴歸算法模型)

上上一章已經學習了感知機模型、策略和算法，感知機對於分類任務有着其優點，但是該模型是在具有強假設的條件下——訓練數據集必須是線性可分的，但是如果數據集是呈現無規則的分佈，那麼此時如果要做分類任務，還可以考慮k近鄰（KNN），這是一

2020-06-27 05:11:42

機器學習--KNN的使用（Pyhton篇&R篇）

機器學習–KNN的使用關於機器學習裏面的KNN有很多文章介紹了，這裏只是講解KNN的python使用方法我們採用的是kaggle上面的數據來學習knn。數據傳送門上面紅色框內就是我們需要的數據。 test.csv是測試

2020-06-27 03:54:16

KNN和K-means詳細介紹

在對於初學者來說的話，在學習這兩個算法的時候，容易搞混，下面將針對這兩個算法做了一個詳細的介紹。方便大家理解。 K近鄰算法（KNN）：有監督的學習首先，KNN是通過測量不同特徵值之間的距離進行分類，它的一個基本思路是，如

2020-06-26 01:07:34

DBLink的創建

create database link hr.com1connect to username identified by pwdusing 'conStr'; //conStr = 鏈接的數據庫sid

2020-07-04 22:08:31

自定義的事件調用方式

1.定義一個EventObject的子類public class XXXEvent extends EventObject 2.定義一個EventListener的子類接口public interface XXXListener ext

2020-07-04 22:08:31

增加快捷鍵

1.定義一個監聽類： class SetCurrentUserListener extends AbstractAction { public void actionPerformed(ActionEvent arg0)

2020-07-04 22:08:31

24小時熱門文章

最新文章

KNN中的kd樹筆記

最新評論文章