数据混淆
组件介绍
“数据混淆”(Randomize) 控件用于混洗输入数据集的分类属性、一般属性和元属性。
“数据混淆”(Randomize) 控件不会改变属性值,只会打乱指定属性类别的数据。
- 输入:
- data:数据集
- 输出:
- data:处理后的数据集
页面介绍
点击 “ 数据混淆”(Randomize) 控件查看参数配置页面,如下图所示:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
列混淆 | 用户可以选择需要对哪些属性进行混洗操作,该部分可多选 | 分类属性 | 分类属性 |
行混淆 | 选择需要混洗的数据集的比例。选择是否可以重复输出 | 0%~100% | 10% |
使用案例
在下图所示的案例中,使用 “加载文件”(File) 控件加载数据,通过 “查看数据”(Data Table) 控件查看加载数据的信息,同时使用 “数据混淆”(Randomize) 控件对数据集进行混洗,之后通过 “查看数据”(Data Table) 控件查看处理后的数据集。
案例中加载 iris 数据集,对分类属性进行混洗,混洗数据的比例设为 100%。案例中控件的配置以及执行结果如下图所示。