K最近邻
组件介绍
“K最近邻”(KNN) 控件主要用于构建K最邻近算法模型。可用于分类任务或回归任务。
KNN是一种基于实例的学习,或者是局部近似和将所有计算推迟到分类之后的惰性学习。最近邻居法采用向量空间模型来分类,概念为相同类别的案例,彼此的相似度 高,而可以借由计算与已知类别案例之相似度,来评估未知类别案例可能的分类。
- 输入:
- data:数据集
- pre: 预处理方法
- 输出:
- lrn: 在交互页面中配置参数后的KNN学习算法
- mod: 已训练的模型(仅当输入端data存在时,才会有输出信息)
页面介绍
点击 “K最近邻”(KNN) 控件查看参数配置页面,如下图所示:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
模型名称 | 设置模型名称,用于在其他组件中区分不同的模型 | 非空字符串 | KNN |
邻节点个数 | 邻节点个数 | 1~100 | 5 |
度量 | 用于距离计算的度量 | 欧几里得(Enclidean):“直线”,两点之间的距离 | 欧几里得 |
权重 | 预测中使用的权重函数 | 统一(Uniform):每个邻居的所有点都是平等的 | 统一 |
使用案例
在下图所示的案例中,使用 “加载文件”(File) 控件加载数据集,连接 “K最近邻”(KNN) 控件进行模型构建,之后把 “加载文件”(File) 控件以及 “K最近邻”(KNN) 控件与 “预测”(Predictions) 控件连接起来查看预测的结果。
案例中加载 iris 数据集,其余参数使用默认值。案例中控件的配置以及执行结果如下图所示。