Talend 数据集成特性

2025年3月17日 | 阅读 3 分钟

Talend open studio 被分为不同的部分,每个部分都有其功能。我们有 Talend open Studio 的四个不同组件,如下所示,

  • 存储库
  • 设计工作区
  • 组件面板
  • 配置选项卡
Talend Data Integration features

存储库

存储库是 Talend open studio 用于设计作业创建作业管理元数据等技术项目的场所, 就像我们在下面的屏幕截图中看到的那样,

Talend Data Integration features

元数据

  • 元数据是存储库的重要组成部分,因为它包含有关 Talend studio 中可用数据的完整信息。
  • 如果我们想开发任何项目,我们可以通过从存储库中拖动对象并将其拖放到设计工作区窗口来在我们的作业中使用元数据。
  • 元数据包含许多来源,例如,数据库连接,不同类型的文件,如Azure, LDAP, Marketo, Salesforce, web services, Hadoop 集群, FTP 等选项可以在 Talend 元数据存储库下找到, 就像我们可以在下图中看到的那样,
Talend Data Integration features

设计工作区

Talend studio 的下一个功能是设计工作区窗口, 我们可以在其中布局和设计作业,因为我们可以访问设计器选项卡,它以图形方式显示作业,以及用于生成和识别可能错误的代码选项卡

设计工作区包含两个字段,如下所示,

  • 设计器选项卡
  • 代码选项卡
Talend Data Integration features

设计器选项卡

默认情况下,创建作业时会打开设计器选项卡,该选项卡以图形模式显示作业。

代码选项卡

代码选项卡帮助我们可视化代码并突出显示可能的语言错误。

组件面板

Talend Studio 中可用的下一个功能是面板,它用于包含用于构建作业的不同技术组件,并按系列分组。

组件面板用于执行特定的数据集成操作,因为它是一个预配置的连接器。

而且,它还可以最大限度地减少手动编码的数量,而手动编码是处理来自多个和异构数据源的数据所必需的。

下图表示 Talend studio 中的面板面板,

Talend Data Integration features

配置选项卡

配置选项卡用于显示和编辑设计工作区中特定组件的属性。

可以编辑这些属性以更改或设置与特定组件或整个作业相关的参数,并且运行选项卡用于执行我们的作业。

Talend Data Integration features

配置选项卡包含四个部分,如下所示,

  • 作业选项卡
  • 上下文变量
  • 组件选项卡
  • 运行选项卡

作业选项卡

作业选项卡用于提供有关设计工作区窗口中当前作业的信息,其中包括名称、版本、创建时间、用途、描述、状态等。

上下文变量

我们将使用上下文变量在各个平台中设置不同的值,并且我们还可以创建一个上下文组,我们可以在其中保存多个上下文变量。

它也用于将代码移到开发中。

对于任何作业,我们可以转到上下文选项卡,并添加上下文变量, 如下面的快照所示,

Talend Data Integration features

组件选项卡

组件选项卡显示配置组件所需的所有参数。

Talend Data Integration features

运行选项卡

运行选项卡显示作业执行的进度,并且日志窗格显示错误消息的开始和结束, 就像我们可以在下图中看到的那样,

Talend Data Integration features
下一个主题数据集成组件