Tableau XML

2025年1月12日 | 阅读 6 分钟

引言

Tableau 使用 XML(可扩展标记语言)文件用于各种目的,例如保存工作簿、仪表板和数据源定义。以下是一些与 Tableau 关联的关键 XML 文件

TWB (Tableau 工作簿)

文件扩展名: .twb

描述:此 XML 文件包含工作簿元数据,包括工作表、仪表板、计算字段以及与数据源的连接。它不存储数据本身,而是引用数据源。

TWBX (Tableau 打包工作簿)

文件扩展名: .twbx

描述:这是一个打包工作簿,包含工作簿 (TWB) 和数据源。它本质上是一个包含 TWB 文件和相关数据提取的 zip 文件。

TDE (Tableau 数据提取)

文件扩展名: .tde

描述:此文件格式用于存储数据源的数据提取。它是一个针对 Tableau 性能优化的二进制文件。

TBM (Tableau 书签)

文件扩展名: .tbm

描述:此 XML 文件用于保存 Tableau 书签,它是 Tableau 工作簿中可重用、可共享的片段。

TDEINFO

文件扩展名: .tdeinfo

描述:此文件伴随 TDE 文件,包含有关提取的信息,例如架构和索引详细信息。

TDIMENSION, TDMEASURE, TDATTRIBUTE

文件扩展名: .tdimension, .tdmeasure, .tdattribute

描述:当您将 Tableau 中的单个字段导出为自定义 SQL 计算时,会生成这些 XML 文件。

TBM (Tableau 书签)

文件扩展名: .tbm

描述:此 XML 文件用于保存 Tableau 书签,它是 Tableau 工作簿中可重用、可共享的片段。

HYPER (Tableau Hyper 数据提取)

文件扩展名: .hyper

描述:从 Tableau 10.5 开始,Hyper 是 Tableau 数据提取的默认文件格式。它是一种高度压缩且高效的用于分析的列式存储格式。

这些文件可以使用文本编辑器打开和查看,但不建议手动修改它们,除非您对 Tableau XML 结构有很好的理解。XML 文件存储 Tableau 工作的配置和元数据信息,错误的更改可能导致损坏或数据丢失。

应用

Tableau XML 文件主要用于存储与 Tableau 工作簿、仪表板、数据源和其他组件相关的元数据、配置和定义。以下是 Tableau XML 文件的一些常见用途

1. 工作簿存储 (TWB)

  • 用途:TWB 文件存储 Tableau 工作簿的元数据和配置。它们包含有关工作表、仪表板、计算字段以及与数据源的连接的信息。
  • 场景:当您保存 Tableau 工作簿而不提取数据时,它将保存为 TWB 文件。

2. 打包工作簿 (TWBX)

  • 用途:TWBX 文件是打包工作簿,包含工作簿 (TWB) 和相关数据源。它们用于与他人共享 Tableau 工作簿,同时保留数据。
  • 场景:当您想与他人共享 Tableau 工作簿及其数据时,可以将其保存为 TWBX 文件。

3. 数据提取存储 (TDE)

  • 用途:TDE 文件存储在 Tableau 中创建的数据提取。它们是针对 Tableau 性能优化的二进制文件。
  • 场景:当您在 Tableau 中创建数据提取时,它将保存为 TDE 文件。

4. Tableau 书签 (TBM)

  • 用途:TBM 文件存储 Tableau 书签,它们是 Tableau 工作簿中可重用、可共享的片段。
  • 场景:当您想保存和共享 Tableau 工作簿的特定视图或配置时,可以使用 TBM 文件。

5. 数据提取信息 (TDEINFO)

  • 用途:TDEINFO 文件伴随 TDE 文件,包含有关提取的附加信息,例如架构和索引详细信息。
  • 场景:它们用于提供有关相关 TDE 文件的补充信息。

6. 自定义 SQL 计算 (TDIMENSION, TDMEASURE, TDATTRIBUTE)

  • 用途:当您将 Tableau 中的单个字段导出为自定义 SQL 计算时,会生成这些 XML 文件。
  • 场景:当您在 Tableau 中创建自定义 SQL 计算时,可能会生成这些文件来存储有关计算的信息。

7. Tableau Hyper 数据提取 (HYPER)

  • 用途:HYPER 文件是 Tableau 数据提取的默认文件格式(从 Tableau 10.5 开始)。它们是高度压缩且高效的用于分析的列式存储格式。
  • 场景:当您在较新版本的 Tableau 中创建数据提取时,它将保存为 HYPER 文件。

这些 XML 文件在存储和组织 Tableau 工作簿和数据提取的元素方面发挥着关键作用,从而促进数据分析和可视化。它们对于共享、协作和维护 Tableau 项目的完整性至关重要。

优点

Tableau XML,特别是与 Tableau 工作簿和数据源相关的 XML,提供了一种以编程方式与 Tableau 文件交互和操作的方式。以下是使用 Tableau XML 的一些优点

  • 自动化和脚本

可以使用脚本和自动化工具来操作 XML 文件。这对于重复性任务特别有用,例如更新数据连接或修改多个 Tableau 文件中的工作簿设置。

  • 版本控制

XML 文件可以使用 Git 等版本控制系统进行版本控制。这允许团队跟踪 Tableau 工作簿和数据源随时间的变化,从而促进协作并确保每个人都在使用最新版本。

  • 定制

Tableau XML 允许在 Tableau 用户界面功能之外自定义工作簿和数据源。这可以包括微调参数、调整格式或实施通过标准 Tableau 界面不容易实现的特定业务逻辑。

  • 与其他系统的集成

XML 可用于将 Tableau 文件与其他系统和应用程序集成。当 Tableau 是更大数据生态系统的一部分时,这尤其相关,并且需要在 Tableau 和其他工具之间交换数据或元数据。

  • 批量更新

XML 提供了一种同时对多个 Tableau 文件进行批量更新的方法。这对于管理大规模 Tableau 部署非常有利,在这些部署中,需要将更改传播到众多工作簿或数据源。

  • 脚本化部署

XML 操作允许对 Tableau 资产进行脚本化部署。这对于自动化部署过程、确保一致性以及减少部署期间人为错误的发生率非常有用。

缺点

虽然 Tableau XML 提供了几个优点,但直接操作 XML 文件也存在一些潜在的缺点和注意事项

  • 复杂度

直接使用 XML 需要对 Tableau XML 架构和结构有很好的理解。复杂性会随着工作簿或数据源的复杂性而增加,这对于不熟悉 XML 的用户来说是一个挑战。

  • 易出错

手动编辑 XML 文件会增加错误、拼写错误或语法错误的风险。XML 结构中的小错误可能导致 Tableau 文件损坏,因此谨慎处理 XML 操作非常重要。

  • 缺乏验证

与通过 Tableau 用户界面或受支持的 API 进行的更改不同,直接的 XML 操作可能会绕过某些验证过程。这意味着在 XML 中所做的更改可能无法彻底验证其兼容性,从而可能导致意外行为或问题。

  • 有限的文档

尽管 Tableau 提供了有关其 XML 结构的文档,但它可能无法涵盖所有细节或边缘情况。用户可能会发现自己对于更复杂的场景依赖于试错或社区支持。

  • 版本兼容性

Tableau XML 结构可能会随着新软件版本的发布而演变。在一个 Tableau 版本中直接操作使用另一个 Tableau 版本创建的 XML 文件可能会导致兼容性问题或意外行为。

  • 无撤销功能

与通常提供撤销功能的 Tableau 用户界面不同,直接对 XML 文件所做的更改可能没有简单的撤销机制。用户应谨慎并在进行大量修改之前考虑创建备份。

  • 安全风险

如果操作不安全,直接的 XML 操作可能会引入安全风险。例如,在 XML 中暴露敏感信息或对权限进行不正确的更改可能会危及 Tableau 工作簿和数据源的安全性。

  • 不友好

对于不熟悉 XML 或喜欢用户友好界面的用户,直接操作 XML 文件可能是一种不太容易访问或不太直观的更改 Tableau 资产的方法。

虽然 Tableau XML 对于高级用户和自动化场景来说是一个强大的工具,但权衡优缺点至关重要。在许多情况下,Tableau 提供的工具、API 和用户界面可能提供更安全、更用户友好的替代方案来完成特定任务。用户应选择最符合其专业知识和手头任务复杂性的方法。

结论

简而言之,Tableau XML 提供了强大的自动化和自定义功能,使用户能够编写脚本更改、版本控制和执行批量更新。然而,它的复杂性、易错性和潜在的缺乏验证使其与 Tableau 的标准工具和界面相比,用户体验较差且风险较高。用户在选择直接操作 XML 之前,应仔细考虑其专业知识、任务复杂性和替代方法的可用性。