K-NN的算法思想

算距離
給定測試對象 ????，計算它與訓練集中每個對象的距離。依據公式計算 ???? 與 ?1 ,?2, … … ?j之間的相似度，得到??? (????, ?1), ??? (????, ?2), ??? (????, ?j)。
找鄰居
圈定距離最近的k個訓練對象，作爲測試對象的近鄰。將??? (????, ?1), ??? (????, ?2), ??? (????, ?j)排序，若是超過相似度閾值?，則放入鄰居集合??.
做分類
根據這k個近鄰歸屬的主要類別，來對測試對象進行分類。自鄰居集合??中取出前k名，查看它們的標籤，對這k個點的標籤求和，以多數決定，得到????可能類別。

數學原理

K-NN涉及的數學原理只有距離公式，計算距離的方法很多，這裏採用歐氏距離。下圖給處理在二維、三維座標中的計算歐氏距離的表達式：
當特徵數量有很多個形成多維空間時，再用上述的寫法就不方便了，我們換一個寫法，用 $X$ 加下角標的方式表示特徵維度。則在n維空間中，有兩個點 $A$ 和 $B$ ，它們的座標分別爲：
則 $A$ 和 $B$ 的歐氏距離 $d(A,B)$ 表達式如下：

手稿

R | Python的實現

$KNN$ 在R | Python 中均可手動編程實現，也有對應的R第三方包 $class$ 來實現 $KNN$ ，Python中也有對應的第三方庫來實現。

#R代碼
library（class）
knn_model = knn(train,test,cl,k = i)

python代碼點我
後期抽時間補上R手動編程源碼。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【算法3】 KNN

K-NN的算法思想

數學原理

手稿

R | Python的實現

探究職業發展的關鍵：能力模型解讀

高效率使用windows

智能決策新時代：可視化大屏是否能夠超越傳統白板？

解密Prompt系列28. LLM Agent之金融領域摸索：FinMem & FinAgent

分享幾個.NET開源的AI和LLM相關項目框架

【MYSQL】存儲過程在批量處理數據表中的應用

【EXCEL】在數據分析中的使用三

【算法2】Logistic迴歸

【Spark】DataFrame

【算法6】K-Means聚類

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結