版本: 6.1.0

CN2规则归纳

组件介绍

“CN2规则归纳”（CN2 Rule Induction） 控件主要使用CN2算法从数据中推导出规则。可用于分类任务。

CN2归纳算法是一种用于规则归纳的学习算法，其设计目的是在训练数据不完善的情况下也能发挥作用。它基于AQ算法和ID3算法的思想。因此，它能创建类似AQ算法的规则集，但又能像ID3算法一样处理噪声数据。

输入：
- data：数据集
- pre: 预处理方法
输出：
- lrn: 在交互页面中配置参数后的CN2学习算法
- mod: 已训练的模型（仅当输入端data存在时，才会有输出信息）

页面介绍

点击 “CN2规则归纳”（CN2 Rule Induction） 控件查看参数配置页面，如下图所示：

参数选项

选项	说明	样例值
学习器名称	设置学习器的名称，用于在其他组件中区分不同的学习器	字符串	CN2 Rule Induction
规则排序	有序：归纳有序的规则（决策列表）查找规则条件，大部分分类被归纳到规则的头部无序：归纳无序的规则（规则集）针对原始数据分别学习每个分类的规则	有序无序	有序
覆盖算法	独有：在覆盖学习实例之后，将其从进一步考虑中移除。加权：在覆盖学习实例之后，减小其权重（乘以γ）同时反过来减小其对进一步迭代算法的影响	独有加权： γ：0~1	独有
规则搜索	评估方法：选择一个启发式评估找到假设： Entropy：衡量内容的不可预测性 Laplace Accuracy Weighted Relative Accuracy 波束宽度：保存迄今为止发现的最佳规则，并检测固定数量的替代方案（波束）	评估方法： Entropy Laplace Accuracy Weighted Relative Accuracy 波束宽度：1~100	评估方法：Entropy 波束宽度：5
规则过滤	最小规则覆盖范围：发现的规则必须至少涵盖所要求的最小数量的例子，无序的规则必须涵盖大多数目标类的例子最大规则长度：发现的规则可以最多组合选择器（条件）的最大允许数量统计显著性（默认 α）：重要性测试来删除关于类的初始分配的特有的规则（不常用）相对重要性（父系 α）：重要性测试来删除关于父类分布的特有的规则（不常用）	最小规则覆盖范围：110000 最大规则长度：1100 统计显著性（默认 α）：01 相对重要性（父系 α）：01	最小规则覆盖范围：1 最大规则长度：5 统计显著性（默认 α）：1 相对重要性（父系 α）：1

使用案例

在下图所示的案例中，使用 “加载文件”（File） 控件加载数据集，连接 “CN2规则归纳”（CN2 Rule Induction） 控件进行聚类，之后把 “加载文件”（File） 控件以及 “CN2规则归纳”（CN2 Rule Induction） 控件与 “预测”（Predictions） 控件连接起来查看基于已经构建的 “CN2规则归纳”（CN2 Rule Induction） 模型对输入数据进行预测的结果。

案例中加载 iris 数据集，其余参数使用默认值。案例中控件的配置以及执行结果如下图所示。

组件介绍​

页面介绍​

参数选项​

使用案例​

组件介绍

页面介绍

参数选项

使用案例