（十四）sklearn 均值漂移聚类

原創

2018-09-04 23:36

代码大部分来自官方文档，可以直接运行

import numpy as np

# estimate_bandwidth用于设置带宽
from sklearn.cluster import MeanShift, estimate_bandwidth

# 生成测试数据所需要的库
from sklearn.datasets.samples_generator import make_blobs

# 以(1，1),(-1，-1),(1，-1)为中心生成10000个标准差为0.6的测试数据集
centers = np.array([[1, 1], [-1, -1], [1, -1]])
X, _ = make_blobs(n_samples=10000, centers=centers, cluster_std=0.6)

# 自动更新带宽
bandwidth = estimate_bandwidth(X, quantile=0.2, n_samples=500)

# 训练模型
# bin_seeding参数将只初始化离散化的种子，即减少初始的种子的数量，加速算法
ms = MeanShift(bandwidth=bandwidth, bin_seeding=True)
ms.fit(X)
print(ms.cluster_centers_)
# [[ 0.93977984 -0.92092147]
# [ 0.9950939   0.95548339]
# [-0.94187918 -0.99804463]]

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

（十四）sklearn 均值漂移聚类

MySQL 核心模块揭秘 | 18 期 | 锁在内存里长什么样*

使用perf工具生成火焰图

HttpSecurity 是如何组装过滤器链的

数说海南——近6年海南各市县人口简单看

长序列中Transformers的高级注意力机制总结

WebStorm 创建 Vue 项目

大龄程序员思考

响应式界面控件DevExtreme * 更强的数据分析和可视化功能

T-SQL（一）遊標嵌套查詢

OpenGL（一）GLFW的使用

優化算法（四）蟻羣算法

優化算法（五）元胞自動機

優化算法（二）模擬退火算法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結