Talend 数据集成架构

17 Mar 2025 | 阅读 2 分钟

在本节中,我们将了解 Talend Open Studio for Data Integration 平台的架构。

Talend Open Studio 的架构模型标识了 Talend 数据集成功能、交互以及相应的 IT 需求。

下图显示了数据集成架构的架构和功能块

Talend Data Integration Architecture

让我们了解数据集成架构的各种功能块

  • 客户
  • 服务器
  • 数据库
  • 仓库 (Repositories)
  • 执行服务器

客户

  • 客户端块用于构建和监控 Talend 作业。
  • 客户端块可以有一个或多个 Talend Studio,以及可以在同一台或不同机器上的 Web 浏览器。
  • Talend Studio 允许我们在获得授权的情况下处理任何项目。
  • 我们可以通过安全的 HTTP 协议,借助 Web 浏览器连接到远程的 Talend 管理中心。
  • 无论数据量大小和流程复杂程度如何,我们都可以从 Studio 中进行数据集成流程。

Server (服务器版)

  • 服务器块用于管理和监控。
  • 服务器块包含基于 Web 的应用程序服务器,而 Talend 管理中心 用于启用所有项目的管理和管理
  • 管理元数据存储在管理数据库中。
    例如: 用户帐户、访问权限和项目授权。
  • 项目项的数据,例如 作业、业务模型例程 存储在 SVNGit 服务器 中。

数据库

  • 数据库用于存储元数据和配置信息。
  • 管理、审计和监控数据库 属于数据库块。
  • 管理数据库 用于管理用户帐户、访问权限、项目授权等。
  • 审计数据库 用于检查作业的不同条件,并在 Talend Studio 中开发的项目中实现。

仓库 (Repositories)

  • 在存储库块中,我们将托管 项目元数据和二进制文件
  • SVN 或 Git 服务器Nexus 存储库 属于存储库块。
    SVN 或 Git 服务器: 它用于集中管理所有项目项,例如 作业和业务模型, 它们在不同的最终用户之间共享,也可以从 Talend Studio 访问以开发项目项。
  • Talend 管理中心 用于 发布、部署和监控项目
  • Nexus 存储库 用于检查是否有可供下载的软件更新。 从 Talend Studio 发布并准备好部署和执行的作业。

执行服务器

  • 执行服务器用于 部署和启动作业
  • Talend 执行服务器块 包含一个或多个执行服务器,这些服务器部署在我们的信息系统中。
  • Talend 作业通过管理中心的作业执行程序部署到作业服务器,该程序将在预定的时间、日期或事件上执行。

下一个主题数据集成功能