覆盖主要内容
版本: 6.1.0

朴素贝叶斯

简介

朴素贝叶斯算法是一种基于贝叶斯定理的分类算法。它假设每个特征与其他特征之间相互独立,从而简化了计算。在分类时,朴素贝叶斯算法会计算每个类别的先验概率,并且对于给定的样本数据,计算每个类别的后验概率,最终将样本数据归为后验概率最大的类别。

该算法在文本分类、垃圾邮件过滤等领域得到了广泛应用。

算法参数及说明

参数说明

案例

案例数据下载iris.xlsx

案例介绍:Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。

  • Sepal.Length(花萼长度),单位是cm;
  • Sepal.Width(花萼宽度),单位是cm;
  • Petal.Length(花瓣长度),单位是cm;
  • Petal.Width(花瓣宽度),单位是cm;
  • 种类:Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢尾)。

制作流程

  1. 选择iris数据集;

  2. 在智能分析图表中选择朴素贝叶斯;

  3. 在设置中的基础配置中选择状态为成功的朴素贝叶斯模型,** 注意:数据集字段必须包含已选择的朴素贝叶斯模型所使用的训练集字段 **;

    如果模型列表中没有模型,需要创建模型,创建模型的链接:机器学习模型管理

  4. 进行数据探索,结果以表的方式展示