LightGBM
组件介绍
“LightGBM” 控件主要用于构建LightGBM算法模型。可用于分类任务或回归任务。
LightGBM是微软开源的一个基于树的学习算法的梯度提升框架。
- 输入:
- data:数据集
- pre: 预处理方法
- 输出:
- lrn: 在交互页面中配置参数后的LightGBM学习算法
- mod: 已训练的模型(仅当输入端data存在时,才会有输出信息)
页面介绍
点击 “LightGBM” 控件查看参数配置页面,如下图所示:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
模型名称 | 设置模型名称,用于在其他组件中区分不同的模型 | 非空字符串 | LightGBM |
学习器类型 | 算法学习器 | GBDT(traditional Gradient Boosting Decision Tree) | GBDT |
树的数量 | 值过小可能会导致欠拟合,值过大可能会导致过拟合 | 1~1000 | 10 |
学习率 | 每个提升迭代阶段学习的步长 | 0.01~1 | 0.1 |
抽样率 | 若此参数小于1.0,LightGBM将会在每次迭代中在不进行重采样的情况下随机选择部分数据(row),可以用来加速训练及处理过拟合。 | 0.01~1 | 0.1 |
最大深度 | 限制树模型的最大深度,默认不勾选 | 1~1000 | 10 |
最大叶子数 | 一棵树上的叶子节点个数 | 2~131072 | 10 |
使用案例
在下图所示的案例中,使用 “加载文件”(File) 控件加载数据集,连接 “LightGBM” 控件构建模型,之后把 “加载文件”(File) 控件以及 “LightGBM” 控件与 “预测”(Predictions) 控件连接起来查看预测的结果。
案例中加载 iris 数据集,其余参数使用默认值。案例中控件的配置以及执行结果如下图所示。