混淆矩阵
组件介绍
“混淆矩阵”(Confusion Matrix) 控件显示预测类和实际类之间的比例。
混淆矩阵是一种特殊的, 具有两个维度的(实际和预测)列联表(英语:contingency table),并且两维度中都有着一样的类别的集合。从混淆矩阵可得出预测类和实际类之间实例的数量或比例。通过这种方式可以得到哪些实例被错误分类以及被分成了哪一类。矩阵的每一列代表一个类的实例预测,而每一行表示一个实际的类的实例。
- 输入:
- evr:分类器对数据的测试结果
- 输出:
- 无
页面介绍
点击 “混淆矩阵”(Confusion Matrix) 控件查看参数配置页面,如下图所示:
点击 “查看结果” 按钮,查看曲线:
参数选项
选项 | 说明 | 样例值 | |
---|---|---|---|
分类器 | 要评估的数据挖掘模型,当选择后会绘制该模型的混淆矩阵 | 要评估的数据挖掘模型 | |
显示 | 选择在矩阵中显示的数据: | 实例个数 | 实例个数 |
使用案例
在下图所示的案例中,使用 “加载文件”(File) 控件加载数据,使用 “K近邻”(KNN) 、 “决策树”(Tree) 、 “逻辑回归”(Logistic Regression) 等模型在 “测试和评分”(Test & Score) 控件中进行测试和评估,最后将评估结果在 “混淆矩阵”(Confusion Matrix) 控件中进行展示。
案例中加载 titanic 数据集,针对 “K近邻”(KNN) 、 “决策树”(Tree) 、 “逻辑回归”(Logistic Regression) 算法进行测试和评估, “测试和评分”(Test & Score) 显示每个分类器的评估结果。然后根据 “测试和评分”(Test & Score) 的结果绘制混淆矩阵,以进一步交叉验证算法的预测结果。 “混淆矩阵”(Confusion Matrix) 可以查看有多少实例被错误分类以及错误的类型,案例中控件的配置以及执行结果如下图所示。