集中管理文件 Regex 元数据17 Mar 2025 | 4 分钟阅读 在本节中,我们将学习如何在 Talend Studio for Data Integration 平台中集中管理 Regex 文件元数据。 在本章深入探讨之前,我们首先了解为什么要使用 Regex 文件。 Regex 文件模式使用正则表达式构成的文件。 例如:日志文件 如果我们要连接到 Regex 文件,我们将集中管理存储库中的连接和模式信息,以便重复使用。 从头开始创建 Regex 文件连接
存储库 → 元数据 → 文件 Regex → 创建文件 Regex ![]() 注意:要在作业中使用集中式文件 Regex,请转到必要组件的基本设置视图,并将其属性类型设置为内置,以打开文件元数据设置窗口。然后将打开新建 RegEx 文件窗口,其中文件连接和模式定义分四个步骤完成
步骤 1:定义常规属性 在第一步中,我们将填写所有必要的详细信息,例如名称(必填字段)以及目标和描述字段(如果我们想要更具体的信息)。 我们还可以在项目设置对话框中管理存储库项的版本和状态字段。 单击“路径”字段旁边的“选择”按钮,以选择“文件 Regex”节点下的文件夹来保存我们新建的文件连接。 注意:如果我们正在编辑现有连接,则无法选择文件夹,但我们可以随时将其拖放到新文件夹中。填写完常规属性的所有详细信息后,单击“下一步”按钮。 ![]() 步骤 2:定义文件路径和格式 在下一步中,我们将单击“浏览”按钮,从本地系统找到我们的文件。 例如,我们将从系统中选择 customer_regex.txt 文件。
![]()
步骤 3:定义文件解析参数 在此步骤中,我们描述文件解析变量以正确恢复文件模式。
注意:正则表达式:用于搜索特定的文本模式;我们可以为任何文本模式创建正则表达式。正如我们在下面的屏幕截图中看到的那样 ![]() 注意:Regex 代码将用单引号或双引号编写。我们的文本文件的正则表达式是:"custname=(.+)city=(.+)" 此处, [.] 它是一个特殊字符,用于匹配任何单个字符。 [+] 它用于匹配前面元素一次或多次。
要在查看器上查看效果和结果,请单击“刷新预览”按钮。 ![]() 之后,单击“下一步”按钮。 步骤 4:检查和自定义文件模式 在最后一步中,我们将检查和自定义文件模式
![]() 要在 Talend studio 中查看新创建的元数据
存储库 → 元数据 → 文件 Regex → customer_regex ![]() 要将元数据作为新组件或现有组件重复使用,只需从存储库的元数据节点拖动文件连接或模式,然后将其放到设计工作区窗口中。 要修改现有文件连接
![]() 要向现有文件连接添加新模式
![]() 下一个主题集中式 FTP 连接 |
我们请求您订阅我们的新闻通讯以获取最新更新。