版本: 6.1.0

混淆矩阵

组件介绍

“混淆矩阵”（Confusion Matrix） 控件显示预测类和实际类之间的比例。

混淆矩阵是一种特殊的, 具有两个维度的（实际和预测）列联表（英语：contingency table），并且两维度中都有着一样的类别的集合。从混淆矩阵可得出预测类和实际类之间实例的数量或比例。通过这种方式可以得到哪些实例被错误分类以及被分成了哪一类。矩阵的每一列代表一个类的实例预测，而每一行表示一个实际的类的实例。

输入：
- evr：分类器对数据的测试结果
输出：
- 无

页面介绍

点击 “混淆矩阵”（Confusion Matrix） 控件查看参数配置页面，如下图所示：

点击 “查看结果” 按钮，查看曲线：

参数选项

选项	说明	样例值
分类器	要评估的数据挖掘模型，当选择后会绘制该模型的混淆矩阵	要评估的数据挖掘模型
显示	选择在矩阵中显示的数据：实例个数：以数字形式显示正确和不正确的分类实例预测的概率：显示分类的真实类别是多少实际的概率：显示与预测概率相反的关系	实例个数预测的概率实际的概率	实例个数

使用案例

在下图所示的案例中，使用 “加载文件”（File） 控件加载数据，使用 “K近邻”（KNN） 、 “决策树”（Tree） 、 “逻辑回归”（Logistic Regression） 等模型在 “测试和评分”（Test & Score） 控件中进行测试和评估，最后将评估结果在 “混淆矩阵”（Confusion Matrix） 控件中进行展示。

案例中加载 titanic 数据集，针对 “K近邻”（KNN） 、 “决策树”（Tree） 、 “逻辑回归”（Logistic Regression） 算法进行测试和评估， “测试和评分”（Test & Score） 显示每个分类器的评估结果。然后根据 “测试和评分”（Test & Score） 的结果绘制混淆矩阵，以进一步交叉验证算法的预测结果。 “混淆矩阵”（Confusion Matrix） 可以查看有多少实例被错误分类以及错误的类型，案例中控件的配置以及执行结果如下图所示。

组件介绍​

页面介绍​

参数选项​

使用案例​

组件介绍

页面介绍

参数选项

使用案例