覆盖主要内容
版本: 6.1.0

噪声注入

组件介绍

“噪声注入”(Noise Injection) 控件主要用于向数据集中添加人工噪声,以增强模型的鲁棒性和泛化能力。该控件读取包含数值型和分类型特征的数据集,根据配置参数对数据进行两种类型的噪声处理:

  • 对于数值型特征:
    • 添加高斯(正态分布)噪声,噪声强度基于原数据标准差与配置参数计算得出
    • 自动保留原始数据的小数位精度
  • 对于分类型特征:
    • 按照设定比例(随机选择部分样本
    • 将选中样本的特征值替换为同列中的其他随机类别值

  • 输入:
    • data:数据集
  • 输出:
    • data:添加噪声后的增强表格数据集

页面介绍

点击 “噪声注入”(Noise Injection) 控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
数值噪声的标准差

控制添加到数值型特征的高斯噪声强度,实际噪声标准差 = 数据标准差 × 该参数值

0.01-1

0.01

分类特征被扰动的比例

0.01-1

0.05

使用案例

在下图所示的案例中,使用 “文件加载”(File) 控件加载数据,使用 “噪声注入”(Noise Injection) 给数据添加噪声,通过 “查看数据”(Data Table) 控件查看数据集内容。

案例中加载 iris 示例数据集,“噪声注入”(Noise Injection) 控件参数如下:

分别查看原始数据和增强后的数据: