覆盖主要内容
版本: 6.1.0

图像缩放

组件介绍

“图像缩放”(Image Resizing) 是一种图像数据预处理控件,用于将输入图像统一调整为指定尺寸,常用于模型输入标准化,确保所有图像在进入神经网络前具有相同的分辨率。

目前该组件仅支持 ImageNet 格式数据集(即包含 images/ 子目录及 *_list.txt 文件的结构),并会保留原始目录结构。

遵循以下处理流程:

  1. 检查输入是否为 ImageNet 格式,若非则直接返回原数据;
  2. images/ 目录下的每张图像执行缩放操作,生成带 _resize 后缀的新图像;
  3. 自动更新所有 *_list.txt 文件(如 train_list.txtval_list.txt 等),将增强图像及其标签(如有)追加写入;
  4. 输出增强后的完整数据集对象。

  • 输入:
    • img:特定格式的图像数据集(含 images/*_list.txt
  • 输出:
    • img:增强后的特定格式数据集(包含原始图像 + _resize 增强图像)

页面介绍

点击 “图像缩放”(Image Resizing) 控件进入参数配置页面,如下图所示:

图像缩放 参数配置界面

参数选项

选项说明取值范围样例值
目标宽度设置输出图像的宽度(像素)。默认为 224。正整数(1~10000)800
目标高度设置输出图像的高度(像素)。默认为 224。正整数(1~10000)600

使用案例

下图展示了一个典型使用流程:通过 “图像” 组件加载 ImageNet 格式数据集,经 “图像缩放” 预处理后,由 “保存图像” 组件保存增强后的数据集。

图像缩放工作流

本案例使用自定义数据集“图像缩放” 参数配置如下:

参数配置示例

增强前后图像对比如下:

原始图像

增强后图像(_resize)

同时,*_list.txt 标签文件已自动更新。