梯度提升决策树
组件介绍
**“梯度提升决策树”(Gradient Boosting Decision Tree)**控件为迭代决策树模型。可用于分类任务或回归任务。
**“梯度提升决策树”(Gradient Boosting Decision Tree)**控件是一种基于决策树的集成学习方法,该方法利用所有树的结论累加起来做最终答案,常用于各种分类和预测问题。
- 输入:
- data:数据集
- pre: 预处理方法
- 输出:
- lrn: 在交互页面中配置参数后的GBDT学习算法
- mod: 已训练的模型(仅当输入端data存在时,才会有输出信息)
页面介绍
点击**“梯度提升决策树”(Gradient Boosting Decision Tree)**控件查看参数配置页面,如下图所示:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
模型名称 | 设置模型名称,用于在其他组件中区分不同的模型 | 非空字符串 | GBDT |
迭代次数 | 迭代次数,值过小可能会导致欠拟合,值过大可能会导致过拟合 | 1~1000 | 100 |
学习率 | 每个提升迭代阶段学习的步长 | 0.01~1 | 0.01 |
最大深度 | 控制决策树模型的复杂程度,默认不勾选,数值为3 | 1~1000 | 10 |
最小样本数 | 限制子树继续划分的条件 | 1~1000 | 10 |
分类损失函数 | 对于分类任务,提供deviance一种损失函数供用户选择 |
GradientBoostingClassifier详细参数说明
GradientBoostingRegressor详细参数说明
使用案例
在下图所示的案例中,使用**“加载文件”(File)控件加载数据集,连接“梯度提升决策树”(Gradient Boosting Decision Tree)控件构建模型,之后把“加载文件”(File)控件以及“梯度提升决策树”(Gradient Boosting Decision Tree)控件与“预测”(Predictions)**控件连接起来查看预测的结果。
案例中加载 iris 数据集,**“梯度提升决策树”(Gradient Boosting Decision Tree)**控件参数使用默认值。案例中控件的配置以及执行结果如下图所示。