覆盖主要内容
版本: 6.1.0

梯度提升决策树

组件介绍

“梯度提升决策树”(Gradient Boosting Decision Tree) 控件为迭代决策树模型。可用于分类任务或回归任务。

“梯度提升决策树”(Gradient Boosting Decision Tree) 控件是一种基于决策树的集成学习方法,该方法利用所有树的结论累加起来做最终答案,常用于各种分类和预测问题。


  • 输入:
    • data:数据集
    • pre: 预处理方法
  • 输出:
    • lrn: 在交互页面中配置参数后的GBDT学习算法
    • mod: 已训练的模型(仅当输入端data存在时,才会有输出信息)

页面介绍

点击 “梯度提升决策树”(Gradient Boosting Decision Tree) 控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
模型名称

设置模型名称,用于在其他组件中区分不同的模型

非空字符串GBDT
迭代次数

迭代次数,值过小可能会导致欠拟合,值过大可能会导致过拟合

1~1000100
学习率

每个提升迭代阶段学习的步长

0.01~10.01
最大深度

控制决策树模型的复杂程度,默认不勾选,数值为3

1~100010
最小样本数

限制子树继续划分的条件

1~100010
分类损失函数

对于分类任务,提供deviance一种损失函数供用户选择
对于回归任务,提供ls、lad、huber、quantile四种损失函数供用户选择

GradientBoostingClassifier详细参数说明

GradientBoostingRegressor详细参数说明

使用案例

在下图所示的案例中,使用 “加载文件”(File) 控件加载数据集,连接 “梯度提升决策树”(Gradient Boosting Decision Tree) 控件构建模型,之后把 “加载文件”(File) 控件以及 “梯度提升决策树”(Gradient Boosting Decision Tree) 控件与 “预测”(Predictions) 控件连接起来查看预测的结果。

案例中加载 iris 数据集, “梯度提升决策树”(Gradient Boosting Decision Tree) 控件参数使用默认值。案例中控件的配置以及执行结果如下图所示。