噪声注入
组件介绍
“噪声注入”(Noise Injection) 控件主要用于向数据集中添加人工噪声,以增强模型的鲁棒性和泛化能力。该控件读取包含数值型和分类型特征的数据集,根据配置参数对数据进行两种类型的噪声处理:
- 对于数值型特征:
- 添加高斯(正态分布)噪声,噪声强度基于原数据标准差与配置参数计算得出
- 自动保留原始数据的小数位精度
- 对于分类型特征:
- 按照设定 比例(随机选择部分样本
- 将选中样本的特征值替换为同列中的其他随机类别值
- 输入:
- data:数据集
- 输出:
- data:添加噪声后的增强表格数据集
页面介绍
点击 “噪声注入”(Noise Injection) 控件查看参数配置页面,如下图所示:
参数选项
| 选项 | 说明 | 取值范围 | 样例值 |
|---|---|---|---|
| 数值噪声的标准差 | 控制添加到数值型特征的高斯噪声强度,实际噪声标准差 = 数据标准差 × 该参数值 | 0.01-1 | 0.01 |
| 分类特征被扰动的比例 | 0.01-1 | 0.05 |
使用案例
在下图所示的案例中,使用 “文件加载”(File) 控件加载数据,使用 “噪声注入”(Noise Injection) 给数据添加噪声,通过 “查看数据”(Data Table) 控件查看数据集内容。
案例中加载 iris 示例数据集,“噪声注入”(Noise Injection) 控件参数如下:
分别查看原始数据和增强后的数据: