DBSCAN
组件介绍
“DBSCAN” 控件主要是基于密度的聚类算法来划分数据。
DBSCAN(英语:Density-based spatial clustering of applications with noise)算法是以密度为本的:给定某空间里的一个点集合,这算法能把附近的点分成一组(有很多相邻点的点),并标记出位于低密度区域的局外点。
- 输入:
- data:数据集
- 输出:
- data:处理后的数据集
页面介绍
点击 “DBSCAN” 控件查看参数配置页面,如下图所示:
点击“查看图表”按钮,查看绘制的DBSCAN邻接点距离计算图:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
最小包含点数 | 核心点的邻节点树量 | 1~100 | 4 |
扫描半径 | 两个样本点之间的最大距离 | 0.00000001~1000 | 0.5 |
度量 | 对数据进行分组的距离度量 | 欧几里得 | 欧几里得 |
使用案例
在下图所示的案例中,使用 “加载文件”(File) 控件加载数据集,连接 “DBSCAN” 控件进行聚类,之后连接 “查看数据”(Data Table) 控件查看聚类结果。
案例中加载 iris 数据集,案例中控件的配置以及执行结果如下图所示。