覆盖主要内容
版本: 6.1.0

SMOTE

组件介绍

SMOTE 控件主要用于处理类别不平衡问题,通过合成少数类样本增强数据集的平衡性


  • 输入:
    • data:数据集
  • 输出:
    • data: 经过SMOTE过采样增强后的平衡数据集

页面介绍

点击 SMOTE 控件查看参数配置页面,如下图所示:

参数选项

选项说明样例值
随机种子数

控制SMOTE算法的随机性,确保结果可重现性

42

近邻个数

SMOTE算法中用于生成新样本的近邻样本数量,影响合成样本的质量

5

使用案例

在下图所示的案例中,使用 “文件加载”(File) 控件加载数据,使用 SMOTE 给数据生成新样本,通过 “查看数据”(Data Table) 控件查看数据集内容。

案例中加载 iris-smote 示例数据集,SMOTE 控件参数如下:

分别查看原始数据和增强后的数据: