覆盖主要内容
版本: 6.1.0

Lift曲线

组件介绍

“Lift曲线”(Lift Curve) 控件根据随机分类器来衡量所选分类器的性能。

Lift曲线展示了预测为真的实例数量与确实为真的实例数量之间的关系,从而可以确定最佳的分类器及其阈值。图中的 x 轴为累计实例占比,y 轴为累计真阳性(预测正确)实例占比。


  • 输入:
    • evr:分类器对数据的测试结果
  • 输出:

页面介绍

点击 “Lift曲线”(Lift Curve) 控件查看参数配置页面,如下图所示:

点击 “查看结果” 按钮,查看曲线:

参数选项

选项说明取值范围样例值
目标类

离散目标属性的取值

离散目标属性的取值默认选中的值是离散目标属性取值的第一个
分类器

要评估的数据挖掘模型,选择后系统会绘制对应的Lift曲线

要评估的数据挖掘模型,支持多选
显示升力凸包

为所有分类器绘制凸起曲线,曲线显示了每个期望的真阳率/阳率的最佳分类器

勾选/不勾选不勾选

使用案例

在下图所示的案例中,使用 “加载文件”(File) 控件加载数据,使用 “K近邻”(KNN)“决策树”(Tree)“逻辑回归”(Logistic Regression) 等模型在 “测试和评分”(Test & Score) 控件中进行测试和评估,最后将评估结果在 “Lift曲线”(Lift Curve) 控件中进行展示。

案例中加载 titanic 数据集,针对 “K近邻”(KNN)“决策树”(Tree)“逻辑回归”(Logistic Regression) 算法进行模型测试和评估, “测试和评分”(Test & Score) 显示每个分类器的评估结果。然后根据 “测试和评分”(Test & Score) 的结果绘制升力曲线。在下面的例子中,我们试图看到 titanic 数据集上“幸存者”的预测质量。本例在 “测试和评分”(Test & Score) 控件中比较了三个分类器,并将结果送发到 “Lift曲线”(Lift Curve) 控件以查看其随机模型的性能,从图中可看到决策树是三者中最好的。因此可以将其设置为最优分类的阈值。案例中控件的配置以及执行结果如下图所示。