Azure SQL Stretch Database 和 SQL 数据仓库

2025年3月17日 | 阅读 3 分钟

SQL Stretch Database

它可以将我们的冷数据透明且安全地迁移到 Microsoft Azure 云。 Stretch Database 将数据分为两种类型。一种是热数据,可以频繁访问;第二种是冷数据,不经常访问。此外,我们可以为硬数据和冷数据定义策略或标准。

Azure SQL Stretch Database & SQL Data Warehouse

例如 - 如果我们有一个销售订单表,所有那些未完成的和正在处理的销售订单都可以是热数据,而所有已关闭的销售订单都可以是冷数据。冷数据将透明地迁移到 Azure SQL Stretch Database。但是,这并不意味着我们需要更改我们的应用程序,以便对于未完成的销售订单,我们需要访问 Azure SQL Stretch Database。

我们可以在应用程序中使用相同的查询来获取数据,并且根据数据的位置,查询将自动发送到 Stretch Database。

SQL Stretch Database 的优点

  • 它为冷数据提供经济高效的可用性,受益于 Azure 的低成本,而不是扩展昂贵的本地存储。
  • 它不需要更改现有查询或应用程序。数据的位置对应用程序是透明的。
  • 它减少了我们数据的本地维护和存储。我们本地数据的备份运行速度更快,并在维护窗口内完成。我们云部分数据的备份自动运行。
  • 即使在迁移过程中,它也能保证我们数据的安全。它为我们传输中的数据提供加密。行级安全性和其他高级 SQL Server 安全功能也适用于 Stretch Database 来保护我们的数据。

SQL 数据仓库

Azure 中的 Microsoft SQL 数据仓库是一个基于云的、可横向扩展的数据库,能够处理海量数据,包括关系数据和非关系数据。 SQL 数据仓库基于大规模并行处理架构。

在这种架构中,请求由控制节点接收、优化,并传递到计算节点以并行执行工作。 SQL 数据仓库将数据存储在高级本地冗余存储中,并链接到计算节点以进行查询提取。

SQL 数据仓库的组件

数据仓库单元: 分配给我们的 SQL 数据仓库的资源以数据仓库单元 (DWU) 来衡量。 DWU 衡量的是底层资源,例如 CPU、内存、IOPS,这些资源被分配给我们的 SQL 数据仓库。

数据仓库单元提供了对三个精确指标的衡量,这些指标与数据仓库工作负载性能高度相关。

  • 扫描/聚合: 扫描/聚合采用标准的数据仓库查询。它扫描大量行,然后执行复杂的聚合。它是一种 I/O 和 CPU 密集型操作。
  • 加载: 此指标衡量将数据摄取到服务中的能力。此指标旨在强调服务的网络和 CPU 方面。
  • 创建表并选择 (CTAS): CTAS 衡量复制表的能力。它涉及从存储读取数据,将其分布在设备的节点上,然后再次将其写入存储。它是一种 CPU、IO 和网络密集型操作。

下一个主题Azure DevOps