K-Modes
组件介绍
“K-Modes” 控件基于对分类属性型数据的采用的聚类算法来划分数据。
K-Modes聚类是标准k-means聚类过程的一个改进版本,它针对分类数据的聚类进行了优化。它通过使用匹配差异度量(也称为汉明距离)而不是欧氏距离来计算两个对象之间的距离。此外,它使用modes来表示聚类中心点。
- 输入:
- data:数据集
- 输出:
- data:处理后的数据集
- cen:每个簇的中心点
页面介绍
点击 “K-Modes” 控件查看参数配置页面,如下图所示:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
簇数量 | 指定簇数 | 1~1000 | 3 |
最大迭代数 | 算法运行的最大迭代次数 | 1~1000 | 200 |
使用案例
在下图所示的案例中,使用 “加载文件”(File) 控件加载数据集,连接 “K-Modes” 控件进行聚类,之后连接 “查看数据”(Data Table) 控件查看聚类结果。
案例中加载 iris 数据集,案例中控件的配置以及执行结果如下图所示。