XML 文件输入
组件介绍
组件作用
“XML 文件输入”组件用于读取 XML 文件中的数据。
输入输出描述
- 输入:需要读取的 XML 文件
- 输出:读取的 XML 文件的内容
组件图标
页面介绍
文件标签
在“文件”标签卡中,可以定义要从中读取的 XML 文件位置。
参数选项
“XML 输入”组件的文件标签页面包含如下选项:
选项 | 说明 | 样例值 |
---|---|---|
XML源定义在一个字段里 | 如果勾选该选项,则此步骤会从上一个数据流中读取相应的数据并且当作 XML 文件名读取 数据 | |
XML源是文件名 | 如果勾选该选项,则此步骤会从上一个数据流中读取相应的数据并且当作 XML 文件名读取数据 | |
以URL的形式读取XML源? | 从URL中读取XML流。 | |
XML源字段名 | 选择从上一步骤中哪一个字段读取相应的文件名数据 | |
文件或目录 | 指定输入XML文件的位置和/或名称。 | |
正则表达式 | 在上一个选项中指定的目录中指定要用于选择文件的正则表达式。例如,您要处理所有扩展名为 .xml的文件。 | |
正则表达式(排除) | 在上一个选项中指定的目录中指定要用于排除文件的正则表达式。例如,您要排除所有扩展名为 .xml的文件。 |
字段表
组件底部表格为字段表,在配置好参数后,点击“添加”按钮即可根据上述配置信息自动填充字段表。该表包含以下列:
列名 | 说明 | 样例值 |
---|---|---|
文件/目录 | 文件或者目录的名称 | |
通配符(正则表达式) | 与参数中的正则表达式部分相同 | |
通配符(排除) | 与参数中的正则表达式(排除)部分相同 | |
要求 | 是否必须 | |
包含子目录 | 是否匹配子目录 |
内容标签
在 “内容”标签卡中,可以设置读取的 XML 文件数据的内容。
参数选项
“XML 文件输入”组件的内容标签页面包含如下选项:
选项 | 说明 | 样例值 |
---|---|---|
循环读取路径 | 选择XML源的循环读取路径,指定XML源的层次结构 | |
编码 | 指定XML源文件的编码 | |
考虑命名空间 | 选中此项即可识别XML文档名称空间 | |
忽略注释 | 解析时忽略XML文档中的所有注释 | |
验证XML | 在解析之前验证XML | |
使用标记 | 标记用在XPath中,可以在XPath中使用标记来引用其他字段字段的值,标记的语法是@_FieldName-,在运行中会使用当前行的Fieldname字段的值来代替路径中的这个标记 | |
忽略空文件 | 如果希望跳过空文件,请勾选此选项。否则一旦发现空文件,该组件会停止运行 | |
如果没有文件不要报告错误 | 如果您希望没有找到文件时不报错,请勾选此选项 | |
限制 | 限制结果中的行数 | |
用于截取数据的XML路径(大文件) | 和循环读取路径 基本一样,与处理大数据相关 | |
在输出中包含文件名 | 如果选中,则会添加一个包含文件名的字段 | |
文件名 字段 | 文件名字段的名称 | |
在输出中包括行数 | 如果选中,则会添加一个包含行数的字段 | |
行数名字段 | 行数名字段的名称 | |
将文件名添加到结果文件中 | 将文件名添加到结果文件中 |
字段标签
在“字段”标签卡中,可以获取到当前文件下的相关字段参数。
字段表
右击选择“获取字段”,组件可根据当前指定设置从源文件获取相应内容填充字段表。该表包含以下列:
列名 | 说明 | 样例值 |
---|---|---|
名称 | 字段名 | |
XML路径 | 要读取的元素节点或属性的路径 | |
节点 | 要读取的元素类型:节点或属性 | |
结果类型 | 指定结果是值还是单节点,单节点表示结果是一个 XML 片段。 | |
类型 | 字段类型,可以是String、Date或Number等类型。 | |
格式 | 用于转换原始字段格式的可选掩码。 | |
长度 | 字段的长度取决于以下字段类型:Number:数字中有效数字的总数。String:字符串的总长度。Date:字符串的打印输出长度。 | |
精度 | 数字类型字段的浮点位数。 | |
货币符号 | 用于表示货币的符号(例如¥或$)。 | |
小数 | 小数点可以是“.”或“,”(例如5,000.0或5.000,0)。 | |
组 | 分组可以使“.”或“,”(例如5,000.0或5.000,0)。 | |
去除空格符号 | 应用于字符串中空格的修剪方法。 | |
重复 | 如果在当前行中对应的值为空,则重复最后一次不为空的值。 |
其他输出字段标签
在“其他输出字段”标签卡中,可以设置要输出的额外信息的字段名。
参数选项
“XML 文件输入”组件的其他输出字段标签页面包含如下选项:
选项 | 说明 | 样例值 |
---|---|---|
文件名字段 | 如果想要输出包括文件名称以及扩展名,以及文件路径的整体,请填写此项指定输出包括文件名称以及扩展名,以及文件路径的整体的字段 | |
扩展名字段 | 如果想要输出包括文件名称以及扩展名称,请填写此项指定输出文件名称以及扩展名称的字段 | |
路径 字段 | 如果想要输出文件路径,请填写此项指定输出文件路径的字段 | |
文件大小字段 | 如果想要输出文件大小,请填写此项指定输出文件大小的字段 | |
是否为隐藏文件字段 | 如果想要输出文件是否为隐藏文件,请填写此项指定输出文件是否为隐藏文件的字段 | |
最后修改时间字段 | 如果想要输出最后一次修改文件的时间,请填写此项指定输出最后一次修改文件的时间的字段 | |
Uri字段 | 如果想要输出Uri,请填写此项指定输出Uri的字段 | |
Root Uri字段 | 如果想要输出XML源的根路径,请填写此项指定输出文件大小的字段 |
案例示例
该案例读取用户上传的 xml 文件的信息,总体流程如下图所示:
案例数据
该文件保存了两个学生的信息,包括姓名以及年龄信息。
案例操作
文件上传
该步骤将本地的 xml 文件上传至 UDI 文件库中,为【XML 文件输入】组件提供数据输入来源。
文件上传操作详情请见 文件上传
需要上传的数据文件:student.xml
上传成功的 xml 文件可在 UDI 文件库中看到。
XML 文件输入
读取 UDI 中的 xml 文件的信息。 输入预览:
该组件配置主要分为 3 步:
第一步:选择需要加载的文件;
第二步:选择读取 XML 文件的循环读取路径,点击内容标签,再点击获取 XML 文档的所有路径,弹出选择框,选择需要的循环读取路径点击确定;
第三步:选择输出字段,右键弹出菜单,选择获取字段,根据前面配置的循环读取路径获取要输出的字段;
结果预览
UDI最终读取的 student.xml 文件信息如下图所示: