SMOTE
组件介绍
SMOTE 控件主要用于处理类别不平衡问题,通过合成少数类样本增强数据集的平衡性
- 输入:
- data:数据集
- 输出:
- data: 经过SMOTE过采样增强后的平衡数据集
页面介绍
点击 SMOTE 控件查看参数配 置页面,如下图所示:
参数选项
| 选项 | 说明 | 样例值 |
|---|---|---|
| 随机种子数 | 控制SMOTE算法的随机性,确保结果可重现性 | 42 |
| 近邻个数 | SMOTE算法中用于生成新样本的近邻样本数量,影响合成样本的质量 | 5 |
使用案例
在下图所示的案例中,使用 “文件加载”(File) 控件加载数据,使用 SMOTE 给数据生成新样本,通过 “查看数据”(Data Table) 控件查看数据集内容。
案例中加载 iris-smote 示例数据集,SMOTE 控件参数如下:
分别查看原始数据和增强后的数据: