随机交换
组件介绍
“随机交换”(Random Swap) 控件主要用于通过对文本数据进行随机词语交换来实现数据增强,提高模型的泛化能力。
- 输入:
- text:文本数据集
- 输出:
- text:包含原始数据和增强后数据的文本数据集
页面介绍
点击 “随机交换”(Random Swap) 控件查看参数配置页面,如下图所示:
参数选项
| 选项 | 说明 | 取值范围 | 样例值 |
|---|---|---|---|
| 增强强度因子 | 控制随机交换词语的比例,值越大交换越多词语 | 0.01-1 | 0.01 |
| 文本字段 | 指定需要进行随机交换处理的文本列名称 | text |
使用案例
在下图所示的案例中,使用 “文本”(Text) 控件加载数据,使用 “随机交换”(Random Swap) 随机交换词语,通过 “保存文本”(Save Text) 控件将增强后的数据保存。
案例中加载文本示例数据集,“随机交换”(Random Swap) 控件参数如下:
运行 “保存文本”(Save Text) 控件,将增强后的数据保存到本地文件中。