决策树
组件介绍
“决策树”(Tree) 控件主要构建决策树算法模型。可用于分类任务或回归任务。
决策树模型代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。
- 输入:
- data:数据集
- pre: 预处理方法
- 输出:
- lrn: 在交互页面中配置参数后的决策树学习算法
- mod: 已训练的模型(仅当输入端data存在时,才会有输出信息)
页面介绍
点击 “决策树”(Tree) 控件查看参数配置页面,如下图所示:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
模型名称 | 设置模型名称,用于在其他组件中区分不同的模型 | 非空字符串 | Tree |
叶子节点中的最小实例数 | 如果选中,算法不会将小于指定数量的训练实例放入任何分支 | 2~1000 | 2 |
分割子集不小于 | 禁止算法用小于给定数量的实例来分割节点 | 1~1000 | 5 |
限制最大的树深度 | 将分类树的深度限制为指定的节点级数 | 1~1000 | 100 |
使用案例
在下图所示的案例中,使用 “加载文件”(File) 控件加载数据集,连接 “决策树”(Tree) 控件进行聚类,之后把 “加载文件”(File) 控件以及 “决策树”(Tree) 控件与 “预测”(Predictions) 控件连接起来查看预测的结果。
案例中加载 iris 数据集,其余参数使用默认值。案例中控件的配置以及执行结果如下图所示。