覆盖主要内容
版本: 6.1.0

DBSCAN

组件介绍

“DBSCAN” 控件主要是基于密度的聚类算法来划分数据。

DBSCAN(英语:Density-based spatial clustering of applications with noise)算法是以密度为本的:给定某空间里的一个点集合,这算法能把附近的点分成一组(有很多相邻点的点),并标记出位于低密度区域的局外点。


  • 输入:
    • data:数据集
  • 输出:
    • data:处理后的数据集

页面介绍

点击 “DBSCAN” 控件查看参数配置页面,如下图所示:

点击“查看图表”按钮,查看绘制的DBSCAN邻接点距离计算图:

参数选项

选项说明取值范围样例值
最小包含点数

核心点的邻节点树量

1~1004
扫描半径

两个样本点之间的最大距离

0.00000001~10000.5
度量

对数据进行分组的距离度量
  欧几里得(Eclidean):两点间的直线距离
  曼哈顿(Manhattan):所有属性的绝对差值之和
  余弦(Cosine):内积空间中两个向量的夹角的余弦值

欧几里得
曼哈顿
余弦

欧几里得

详细参数说明

使用案例

在下图所示的案例中,使用 “加载文件”(File) 控件加载数据集,连接 “DBSCAN” 控件进行聚类,之后连接 “查看数据”(Data Table) 控件查看聚类结果。

案例中加载 iris 数据集,案例中控件的配置以及执行结果如下图所示。