Tableau 面试题及答案

2025年3月17日 | 阅读11分钟
Tableau Interview Questions

下面列出了一些 Tableau 中最常被问到的面试题及答案。

1) 什么是 Tableau?

  • Tableau 是一个强大的数据可视化工具,广泛应用于商业智能行业。
  • 它能将原始数据转化为非常易于理解的格式。
  • 它能够可视化并创建交互式、可共享的仪表板。
  • Tableau 不需要任何技术或编程技能。

2) 请解释 Tableau 的特性?

Tableau 主要有三个特性,分别是:

  1. 数据混合 (Data Blending): 数据混合是 Tableau 的一项重要功能。当我们需要将来自多个数据源的相关数据合并在一起,并在单个视图中进行分析,以图表形式呈现时,就会用到它。
  2. 实时分析 (Real-time Analysis): 实时分析使您能够在数据速度快且实时分析复杂的情况下,快速理解和分析动态数据。Tableau 可以帮助从快速变化的数据中提取有价值的信息,并进行交互式分析。
  3. 数据协作 (The Collaboration of Data): 数据分析不是孤立的任务。因此,Tableau 是为协作而设计的。团队成员可以共享数据,跟进查询,并将易于理解的可视化结果转发给可能从中受益的其他人。确保每个人都能理解数据并做出明智的决策对于成功至关重要。

3) Tableau 有多少个工具?

Tableau 有五个工具,分别是:

  1. Tableau Desktop: Tableau Desktop 建立了数据仓库与其他各种文件类型之间的连接。在此创建的仪表板和工作簿可以本地或公开共享。它允许我们编写代码并自定义报表。从建立故事、图表到将它们组合成仪表板,所有必要的工作都在 Tableau Desktop 中完成。
  2. Tableau Public: 这个 Tableau 版本专为注重成本的用户而设计。“Public”意味着创建的工作簿无法本地保存。它们必须保存在 Tableau 的公共云中,任何人都可以访问和查看。
  3. Tableau Online: 它的功能类似于 Tableau Server,但数据存储在 Tableau 团队托管的云服务器上。在 Tableau Online 中发布的数据没有存储限制。Tableau Online 可与 40 多个云端数据源建立直接连接,例如 Hive, MySQL, Spark SQL, Amazon Aurora 等。
  4. Tableau Server: 该软件用于在组织内部共享 Tableau Desktop 应用程序创建的工作簿和可视化。要在 Tableau Server 中共享仪表板,您首先需要在 Tableau Desktop 中发布工作簿。一旦工作簿上传到服务器,它将仅对授权用户可用。
  5. Tableau Reader: Tableau Reader 是一个免费工具,允许我们查看使用 Tableau Desktop 或 Tableau Public 创建的可视化和工作簿。数据可以过滤,但修改和编辑受到限制。Tableau Reader 中没有安全性,因为任何人都可以使用 Tableau Reader 查看工作簿。

4) 请解释 Tableau 中的所有数据术语?

Tableau 中有几种数据术语,分别是:

  1. 书签 (Bookmark): Tableau 存储库中的书签文件夹中的 .tbm 文件,其中包含单个工作表。它有助于改进数据分析。与网页浏览器书签不同,.tbm 文件是一种快速显示各种研究的兼容方式。
  2. 工作簿 (Workbook): 工作簿是一个 .twb 扩展名的文件,其中包含一个或多个工作表、仪表板和故事。
  3. 仪表板 (Dashboard): 仪表板是将多个视图组合在一起,并排列在单个页面上的。在 Tableau 中,仪表板用于同时观察和比较各种数据,并且还允许与其他工作表进行交互。
  4. 数据源页面 (Data Source Page): 数据源页面是您设置数据源的地方。这个数据源页面通常由四个主要区域组成:连接区域、左窗格、预览区域和元数据区域。
  5. 工作表 (Worksheet): 工作表是工作表的集合。它是通过将各种字段拖放到架子上来构建数据视图的地方。
  6. 维度 (Dimensions): 维度通常被称为分类数据字段。维度包含离散数据,例如不能聚合的成员和层次结构。它还包含日期、名称和地理数据等特征值。维度用于揭示您信息的详细信息。
  7. 度量 (Measures): 度量是数据的可测量数量,可以由维度表进行分析。度量存储在包含引用关联维度表唯一键的表中。该表支持原子级数据存储,因此允许一次插入多条记录。
    例如,销售表可以有一个产品键、客户键、促销键,用于特定事件的销售商品。
  8. 筛选器架 (Filters shelf): 筛选器架位于工作簿的左侧。筛选器架用于通过使用维度和度量进行筛选来排除视图中的数据。
  9. 页面架 (Pages shelf): 页面架位于视图的左侧。通过页面架,您可以根据连续或离散字段中的值和成员将视图分解为一系列页面。在页面架中添加字段类似于在行架中添加字段。对于每一行新行,都会创建一个新页面。
  10. 标记卡 (Marks card): 标记卡位于工作表的左侧。用户可以将字段拖到标记属性控件上,例如颜色、类型、形状、大小、标签、详细信息和工具提示。

5) .twb 和 .twbx 扩展名有什么区别?

.twb.twbx
.twb 是一个 xml 文档,其中包含有关您的仪表板、工作表和故事的信息。它不包含任何数据,因此要共享您的工作簿,您需要同时发送工作簿文件和 Tableau 的数据源文件。
.twbx 是一个打包在一起的文件“压缩包”。它包括数据源文件和用于生成工作簿的任何其他文件,包括图像。

6) 传统 BI 工具和 Tableau 有什么区别?

传统 BI 工具Tableau
传统的 BI 架构存在硬件限制。Tableau 没有依赖性。
它基于复杂的技术集。Tableau 基于关联搜索,使其快速且动态。
它不支持内存、多线程和多核计算。与高级技术结合使用时,它支持内存。
它具有预定义的数据视图。它使用预测性分析进行各种业务运营。

7) Tableau 中有哪些不同的数据类型?

Tableau 会自动显示字段并分配数据类型。如果数据源指定了数据类型,Tableau 将使用该数据类型。如果数据源未单独指定数据类型,Tableau 将为其分配一个。Tableau 包含以下数据类型:

  • 日期值
  • 文本值
  • 数值
  • 日期和时间值
  • 布尔值(真或假条件)
  • 地理值(用于地图的经纬度)

8) Tableau 中有哪些不同类型的连接?

Tableau 中的连接与 SQL 连接相同。有五种主要连接,分别是:

1) 交叉连接 (Cross Joins): 交叉连接会生成行,将第一个表中的每一行与第二个表中的每一行进行组合。

Tableau Interview Questions

2) 内连接 (Inner Joins): 内连接返回正在合并的表中匹配的行。

Tableau Interview Questions

3) 左外连接 (Left Outer Join): 左外连接返回正在连接的表中匹配的行,以及结果中左表中不匹配的行,并在来自右表的属性中放置 NULL 值。

Tableau Interview Questions

4) 右外连接 (Right Outer Join): 右外连接操作返回正在合并的表中匹配的行,以及结果中右表中不匹配的行,并在来自左表的属性中放置 NULL 值。

Tableau Interview Questions

4) 全外连接 (Full Outer Join): 全外连接用于组合表。结果包含两个表中的所有值。

Tableau Interview Questions

9) Tableau 中可以连接多少张表?

在 Tableau 中,最多可以连接 32 张表。


10) 请解释您可以与数据集建立的各种连接?

我们可以通过两种方式连接数据集,分别是:

 

  1. 实时 (Live): 实时连接会向数据库发送查询并检索数据。这些查询将返回数据库中当前的任何数据。
  2. 提取 (Extract): 提取连接会保存数据子集,用于提高性能,或利用 Tableau 的功能,而这些功能在原始数据中可能不支持或不可用。

11) 什么是架子 (Shelves)?

架子是放置在工作簿视图的左侧和顶部的命名区域。您可以通过将字段拖放到架子上来构建视图。选择特定标记类型时,某些架子可用。

Tableau Interview Questions

12) 什么是集 (Sets)?

在 Tableau 中,集用于根据用户定义的特定条件创建数据子集。集仅基于维度字段创建。

Tableau 中有两种类型的集:

  1. 动态集 (Dynamic Sets): 当底层数据发生变化时,动态集中的值或成员会发生变化。
  2. 固定集 (Fixed Sets): 当底层数据发生变化时,固定集中的值或成员不会发生变化。

13) 什么是分组 (Groups)?

分组是将维度成员组合起来,形成更高级别的类别。


14) 什么是分层字段 (Hierarchical Field)?

在 Tableau 中,分层字段用于下钻数据。这意味着以更细粒度的级别查看数据。


15) 什么是 Tableau 数据服务器 (Tableau Data Server)?

Tableau Server 作为数据和 Tableau 用户之间的中间件。Tableau 数据服务器允许您共享和上传数据提取,保存数据库连接,以及重用计算和字段元数据。

这意味着您对计算字段、数据集、别名、定义或参数所做的任何更改都可以保存并与他人共享,从而实现安全、集中管理和标准化的数据集,并且您可以利用服务器资源在提取文件上运行查询,而无需先将其传输到本地计算机。


16) 什么是 Tableau 数据引擎 (Tableau Data Engine)?

Tableau 数据引擎是 Tableau 中的一项很棒的功能。它是一个分析数据库,旨在实现即时查询响应、预测性性能,无缝集成到现有数据基础架构中,并且不受限于将整个数据集加载到内存中。

如果您处理大量数据,创建索引、导入和排序数据需要一些时间,但之后一切都会加速。Tableau 数据引擎不是内存技术。数据在导入后存储在磁盘上,而 RAM 的利用率很低。


17) 如何在 Tableau 中创建计算字段?

  • 单击数据窗格上维度右侧的下拉选项,然后转到“创建”选项,选择“计算字段”以打开计算编辑器。
  • 为计算字段命名并创建公式。

18) 定义双轴 (Dual axis)。

双轴用于可视化两种不同图表类型的两种不同度量。日期列和两个度量是构建双轴图所必需的。

图表中使用了不同的刻度,这有助于用户理解这两个度量。

Tableau Interview Questions

19) 树状图 (Tree map) 和热力图 (Heat map) 有什么区别?

树状图热力图
树状图的作用与此类似,并且可用于说明分层数据和整体中的部分关系。热力图可以通过颜色和大小比较类别。
在热力图中,您可以同时比较两个不同的度量。

20) 数据连接 (Data Joining) 和数据混合 (Data blending) 有什么区别?

数据连接数据混合
当您组合来自同一数据源的数据时,会使用数据连接。数据混合需要报告中有两个完全定义的数据源。

21) 什么是 TDE 文件?

TDE 是一个 Tableau 桌面文件,扩展名为 .tde。它指的是包含从 MS Access 或 CSV 文件、MS Excel 等外部源提取的数据的文件。

TDE 文件有两个方面使其非常适合支持分析和数据发现。

  • TDE 是列式存储。
  • TDE 使用计算机内存的所有部分,从 RAM 到硬盘,并使每个部分都能发挥其特长。

22) 什么是 Tableau 中的故事 (Story)?

故事是一个工作表,其中包含一系列协同工作的仪表板或工作表,以传递信息。

您可以创建故事来展示事实如何联系起来,提供背景信息,演示决策如何与结果相关,或者提出引人入胜的论点。故事中的每个工作表都称为一个故事点。


23) Tableau 中离散数据 (discrete) 和连续数据 (continuous) 有什么区别?

离散连续性
离散数据是可计数、独立或分开的值。连续数据用于度量连续数据。
它只能取范围内单个的值。它可以取有限和无限范围内任意值。

24) Tableau 一次可以利用多少行数据?

Tableau 不受表中行数的限制。Tableau 可以访问 PB 级数据,因为它只检索所需的行和列。


25) Tableau 可以安装在 macOS 上吗?

是的,Tableau Desktop 可以在 Mac 和 Windows 操作系统上安装。


26) Tableau 软件是否适合战略性收购?

是的,Tableau 软件适合战略性收购,因为它提供了其他工具无法比拟的数据洞察力。


27) 我们可以将 Excel 文件放在 Tableau 的共享位置吗?

是的,我们可以将 Excel 文件放在共享位置,但为了获得更好的性能,我们应该使用提取。


28) 假设许可证今天到期,用户是否仍然能够查看发布在服务器上的仪表板或工作表?

如果 Tableau Desktop 许可证今天到期,您将无法访问仪表板或工作表,因为服务器上的用户名将需要取消授权。

但其他人可以访问,因为站点管理员可以更改所有权给另一个人,这样提取就不会失败。


29) 有哪些不同的 Tableau 文件?

  • 书签 (Bookmarks): 它只包含单个工作表,是一种方便共享工作的方式。
  • 工作簿 (Workbooks): 工作簿可以包含一个或多个仪表板和工作表。
  • 打包工作簿 (Packaged workbooks): 它包含工作簿以及任何支持的本地文件数据和背景图像。
  • 数据提取文件 (Data extraction files): 数据提取文件是数据源或其子集的本地副本。
  • 数据连接文件 (Data connection files): 数据连接文件是一个小的 XML 文件,包含各种连接信息。

30) 已发布数据源 (published data source) 和嵌入式数据源 (embedded data source) 有什么区别?

已发布数据源嵌入式数据源
它包含与任何工作簿无关的连接信息,多个工作簿可以使用它。它包含连接信息,并与某个工作簿相关联。