分類預測&聚類

原創

un_lock

2020-06-16 07:07

分類預測&聚類

分類和聚類的不同，點擊進行學習。

聚類

什麼是聚類分析

簇

一個數據對象的集合

聚類分析(無監督)

把一個給定的數據對象分成不同的簇
在同一個簇中，對象之間具有相似性
不同簇的對象之間是相異的

典型應用

模式識別
空間數據分析
圖像處理
經濟學(市場研究)
分檔分類

eg：市場營銷、土地使用、保險、城市規劃、地震研究

數據挖掘對聚類的要求

可伸縮性
能夠處理不同類型的屬性
能發現任意形狀的簇
能夠處理噪聲和異常
對輸入數據隨想的順序不敏感
能處理高維數據
能產生一個好的，滿足用戶指定約束的聚類結果
結果是可解釋的、可理解的和可用的

評價方法

一個好的聚類方法要能產生高質量的聚類結果—簇，這些簇具有一下兩個特點：

高的簇內相似性
低的簇間相似性

So，如何計算相似性

通常使用距離來衡量兩個對象之間的相異度。

明考斯基距離(Minkowski distance):

相似性

So，如何計算相似性

通常使用距離來衡量兩個對象之間的相異度。

明考斯基距離(Minkowski distance):

[外鏈圖片轉存中…(img-kSASuJsQ-1591021899119)]
簡單匹配係數----評價二元變量之間的相似性

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

分類預測&聚類

分類預測&聚類

分類

概念

預測

有監督學習(分類)

無監督學習(聚類)

關於分類和預測的問題

決策樹

Overfitting

SLIQ算法

貝葉斯分類算法

粗糙集算法

聚類

什麼是聚類分析

簇

聚類分析(無監督)

典型應用

數據挖掘對聚類的要求

評價方法

So，如何計算相似性

So，如何計算相似性

如何使用 JS 判斷用戶是否處於活躍狀態

lightdb秒級增加列和刪除列（not null帶默認值）

lightdb數據庫超時相關控制參數

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

lightdb mysql 8.0兼容之不可見主鍵

使用 JS 實現在瀏覽器控制檯打印圖片 console.image()

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（四）使用域名訪問網站應用

Paddle_程序員必備的數學知識_轉發

一篇博客入門pandas模塊

一篇博客入門Numpy模塊

Numpy模塊下np.clip()方法的使用

數據挖掘和數據倉庫

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結