集中管理文件分隔元数据17 Mar 2025 | 4 分钟阅读 在本节中,我们将学习如何在 Talend Studio 中集中管理用于数据集成平台的 文件分隔元数据。 在深入本章之前,我们首先了解为什么使用文件分隔。 它可以用于定义 tFileInputDelimited、tFileOutputDelimited 组件的属性,并从分隔文件中读取和写入数据。 我们必须在存储库中集中管理它们的元数据,并进行重用。 注意:所有类型的文件连接(如“分隔、正则表达式、XML、位置或 LDIF”)的文件模式创建都非常相似。从头开始创建文件分隔连接
存储库 → 元数据 → 文件分隔 ![]() 注意:要在我们的作业中使用集中的文件分隔,请转到必要组件的基本设置视图,将其属性类型设置为内置,以打开“文件元数据设置”窗口。将打开“新建分隔文件”窗口,其中文件连接和模式定义分四个步骤完成。
步骤 1:定义常规属性 在第一步中,我们将填写所有必要的详细信息,例如名称(必填字段),以及“目的”和“描述”字段。 我们还可以在项目设置对话框中管理存储库项的版本和状态字段。 单击“路径”字段旁边的“选择”按钮,以选择“文件分隔”节点下的一个文件夹来保存我们新创建的文件连接。 注意:如果我们正在编辑现有连接,则无法选择文件夹,但我们可以随时将其拖放到新文件夹中。填写完常规属性的所有详细信息后,单击“下一步”按钮。 ![]() 步骤 2:定义文件路径和格式 在下一步中,我们将单击“浏览”按钮以从本地系统加载文件。 例如,我们将从我们的系统中选择 custmore.txt 文件。
![]()
步骤 3:定义文件解析参数 在此步骤中,我们可以根据需要更改设置。
![]()
在 文件设置区域 中,我们可以设置 编码类型、字段 和 行分隔符,如下面的屏幕截图所示 ![]()
在 要跳过的行 部分中,我们可以指定给定的参数,例如“标头”和“页脚”。
![]() 我们可以选中“限制”复选框,并在“行数限制”部分中指定所需的行数,如上面的屏幕截图所示 要查看新设置的影响,请查看文件审查面板,并选中将处理行设置为列名称框,以将第一个解析的行转换为模式列的标签。 并且还看到要跳过的标头行数增加了 1。 ![]() 要在查看器上查看效果和结果视图,请单击“刷新预览”按钮。 之后,单击“下一步”按钮。 步骤 4:检查和自定义文件模式 在最后一步中,我们将检查和自定义文件模式。
![]() 要在 Talend Studio 中查看新创建的元数据。
存储库 → 元数据 → 文件分隔 → customer_Metadata ![]() 要将元数据作为新组件或现有组件重复使用,只需从存储库的元数据节点拖动文件连接或模式,然后将其放到设计工作区窗口中。 要修改现有文件连接
![]() 要向现有文件连接添加新模式
![]() 下一个主题集中管理位置元数据 |
我们请求您订阅我们的新闻通讯以获取最新更新。