（十四）sklearn 均值漂移聚類

原創

2018-09-04 23:36

代碼大部分來自官方文檔，可以直接運行

import numpy as np

# estimate_bandwidth用於設置帶寬
from sklearn.cluster import MeanShift, estimate_bandwidth

# 生成測試數據所需要的庫
from sklearn.datasets.samples_generator import make_blobs

# 以(1，1),(-1，-1),(1，-1)爲中心生成10000個標準差爲0.6的測試數據集
centers = np.array([[1, 1], [-1, -1], [1, -1]])
X, _ = make_blobs(n_samples=10000, centers=centers, cluster_std=0.6)

# 自動更新帶寬
bandwidth = estimate_bandwidth(X, quantile=0.2, n_samples=500)

# 訓練模型
# bin_seeding參數將只初始化離散化的種子，即減少初始的種子的數量，加速算法
ms = MeanShift(bandwidth=bandwidth, bin_seeding=True)
ms.fit(X)
print(ms.cluster_centers_)
# [[ 0.93977984 -0.92092147]
# [ 0.9950939   0.95548339]
# [-0.94187918 -0.99804463]]

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

（十四）sklearn 均值漂移聚類

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

.NET週刊【5月第2期 2024-05-12】

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（一）部署K8s

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（三）數據卷掛載NFS（網絡文件系統）

T-SQL（一）遊標嵌套查詢

OpenGL（一）GLFW的使用

優化算法（四）蟻羣算法

優化算法（五）元胞自動機

優化算法（二）模擬退火算法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結