Snowflake 跨云协作2025年8月2日 | 阅读 12 分钟 持续拓展全球业务:Snowgrid 的全新跨云功能如今,许多企业都在国际化运营,但这可能会带来诸多挑战。为了实现数据协作,构建和维护数据管道是必要的,然而,在能够访问数据之前,可能需要漫长的等待时间。在多个云和地理位置强制执行统一的数据治理变得更加困难。此外,您还必须确保在发生故障或中断的情况下,能够正常运行。 "这意味着它可以在超过 35 个云区域以及三大主要云提供商:AWS、Azure 和 Google Cloud 上以相同的方式运行。" 这也意味着您将获得相同的平台和产品体验,包括相同的安全和治理功能。Snowflake 在今年的 Snowday 上发布了新的 Snowgrid 功能,这些功能解决了跨云业务连续性、跨云数据治理和跨云协作的问题。 ![]() 跨云协作过去,用户必须在不同环境之间传输数据才能进行协作。他们可以通过从 FTP 服务器收集文件、抓取 API、使用 ETL 工具或设置各种数据仓库来实现这一点,以便团队访问数据。构建和维护这些数据管道既昂贵又耗时。它们也不安全,因为用户在数据移动后无法控制数据。 通过利用 Snowflake 的 Snowgrid 技术,组织可以跨云和地理位置共享实时、可查询的数据、数据服务和应用程序,而无需 ETL。实际上,这意味着无论客户身在何处或使用何种云,当数据提供商将其共享给全球商业生态系统时,客户都可以自动访问和处理数据。 ![]() Avanes 解释道:“Snowgrid,即 Snowflake 协作底层技术,正在彻底改变跨不同区域和云共享和安全访问数据的方式。”“因此,涉及的数据集将受到所有必需的安全控制,包括用于对敏感数据进行分类和保护的数据访问策略或用户定义的标签。” Snowflake 为 Snowgrid 的跨云协作宣布的新功能为用户在交换列表时提供了更多选择,例如:
跨云数据治理为了实现对组织整个数据资产的治理,客户必须能够理解、保护和连接他们的数据生态系统。Snowflake 的跨云数据治理能够更轻松地实现大规模治理,同时确保企业在其生态系统内拥有一致的可见性并遵守全球要求。得益于最近宣布的跨云治理功能,客户将能够更有效地利用 Snowflake 的原生治理功能和平台优化来保护其全球数据。 ![]() 使用行访问策略和屏蔽来加速数据搜索,为了最大化 Snowflake 的效率,同时保持隐私和合规性,Search Optimisation Service 现在支持带有屏蔽和行访问控件的表,目前处于私有预览阶段。(在此处阅读有关 Snowflake 的 Search Optimisation Service 性能改进的更多信息。) Avanes 表示:“无论您使用何种云、区域或工作负载,您都可以获得始终如一地执行的策略和数据保护。”此外,Snowflake 的 Data Governance Accelerated 项目提供深度连接器,让您无需额外的设置或基于脚本的变通方法即可更有效地连接和管理所有数据。所有这些共同确保了即使是敏感数据也能为您的公司和团队带来益处。这些数据可以开辟新的协作途径。
选择 Snowflake 云和区域以实现业务连续性在决定将哪些云区域用作主要和次要数据源时,选择支持您的业务连续性计划的云区域至关重要。在选择两个区域用于主要和次要存储时,请考虑以下因素:
控制跨云自动交付的成本。作为供应商,您可以激活列表的跨云自动交付,从而将您的数据产品自动提供到其他 Snowflake 区域。当您为列表设置跨云自动交付时,它无需数据复制。为了帮助您的列表购买者,您仍然需要为您的数据产品在其他 Snowflake 区域的传输和存储付费。 ![]() 与传统的自动手动数据库复制不同,跨云自动交付无需在您服务的每个位置拥有单独的账户。相反,Snowflake 会将账单费用与区域相关联,并为组织创建单个、安全的共享区域来管理到该区域的自动交付。因此,与手动数据库复制相比,跨云自动交付的成本分配方式不同。 关于跨云自动交付无需手动复制数据,跨云自动交付可让您在任何支持的 Snowflake 区域中提供数据产品,具体取决于您为列表选择的可用性和访问选项。请了解跨云自动交付的成本。 跨云自动交付的使用费用类似于正常 Snowflake 使用产生的费用。
![]() 源帐户的位置(即,包含主数据库的帐户)以及目标区域和云决定了数据传输速率。有关数据传输成本的信息,请参阅定价指南(可在 Snowflake 网站上找到)。 对于您拥有活跃列表购买者的每个区域,当您使用跨云自动交付时,这些使用费用会分配到一个由 Snowflake 管理的单个安全共享区域(有关归因费用的信息,请参阅查看实际成本)。有关 Snowflake 成本组成部分的更多详细信息,请参阅了解总体成本。 计算和管理费用。当您将列表设置为自动交付到其他位置时,以下变量可能会影响您列表的交付成本:
要降低自动交付成本,请检查您的列表使用情况,并详细了解如何准备数据以进行自动交付。即插即用的故障转移和复制数据管道 对于数据工程工作负载,Snowflake 提供最佳体验。为了确保用户和应用程序能够访问最新、准确的数据,数千名客户使用外部阶段、内部阶段、Snowpipes 和存储连接器来创建摄取管道。 这些过程不仅增加了复杂性,还增加了在发生中断时发生人为错误的风险,导致漫长的恢复时间,这对于关键任务工作负载来说并不理想。现在,您可以轻松地重新播放您的管道,因为 Snowflake 将确保您获得幂等的加载。 ![]() 当由于中断故障转移到备份区域时,客户可以实现零数据丢失,因为您数据管道将恢复并继续摄取数据,同时确保幂等加载。消除复杂的专有工具和变通方法极大地简化了 Snowflake 业务连续性体验,并使用户能够满足更低的恢复点目标 (RPO) 和恢复时间目标 (RTO)。
![]() 部署跨云自动交付如果您希望自动交付与您的列表相关联的数据产品到其他 Snowflake 区域,请设置跨云自动交付。启用列表的自动交付后,Snowflake 会自动将您的数据产品交付给客户区域。列表附带的共享或应用程序包称为数据产品。 通过使用自动交付,客户可以更快地获取您的列表,这消除了手动复制您的数据产品和批准您的列表请求的需要。 注意:只有 Microsoft Azure 和 Amazon Web Services (AWS) 允许在 Snowflake Native App 中使用 Snowpark Container Services 进行跨云自动交付。有关更多详细信息,请参阅使用容器的应用程序的已知限制。关于跨云自动交付无需手动复制数据,跨云自动交付可让您在任何支持的 Snowflake 区域中提供数据产品,具体取决于您为列表选择的可用性和访问选项。可以为草稿和已发布的列表设置和激活自动交付。当列表启用了自动交付后,Snowflake 将自动将产品发送到适当的区域。 ![]() 您的数据产品以及客户查看您列表的方式将决定您如何在其他区域中提供它。
Snowsight 会自动确定目标帐户是否在其他区域,并为共享给特定客户帐户的所有列表激活自动交付。私有列表不能手动复制到其他区域。 跨云自动交付的操作当您为列表启用跨云自动交付时,Snowflake 会处理安全共享区域 (SSA) 的部署以及您的数据产品到远程区域的自动交付。SSA 由 Snowflake 负责。如果远程区域中的客户已可获得您的数据产品,则他们可以立即获得。 数据产品,例如应用程序包或共享,与您的列表相关联。数据产品包含应用程序包的应用程序逻辑以及来自一个或多个数据库的对象。 ![]() 您提供列表的方式决定了您的数据产品自动交付到远程区域的确切时间。
请注意,像 VPS 这样的高安全性设置与 Business Critical Edition (BCE) 对共享数据的处理方式不同。尽管 BCE 不强制为每个区域创建单独的 SSA,但它通过 Tri-Secret Secure 加密等功能强制执行严格的数据安全和合规性。 每个部署都有其安全共享区域 (SSA),包括政府特定的 Snowflake 环境和 Virtual Private Snowflake (VPS)。这确保了自动交付将继续遵守特定于这些设置的严格安全和数据隔离规范。 ![]() 在您的数据产品首次自动交付到区域中的 SSA 后,您的数据产品中的更改将根据所选的刷新频率从您的帐户进行同步。
深入了解自动交付注意事项当您为列表使用自动交付时,请考虑以下事项:
![]() 跨云 Snowflake 复制这确保了多云数据访问、灾难恢复和业务连续性的最小停机时间。 1. 跨云复制用例
提供选择最适合特定工作负载的云提供商的自由。
![]() 2. 财务方面
3. 跨云复制最佳实践
4. 实际示例
对于重视高可用性和数据完整性的公司来说,在发生中断时能够快速故障转移并平稳地重新启动数据管道至关重要。到目前为止,客户被迫要么创建自定义脚本,要么承担手动生成这些重要对象的繁琐任务。客户必须确保在应用程序层进行数据去重,并重放其数据管道以实现零数据丢失。 结论总而言之,我们可以得出结论,企业可以通过利用自动同步、故障转移组和增量复制来最大化跨多个云位置的成本、性能和业务连续性。通过实践最佳实践,例如跟踪复制状态、最大化故障转移准备就绪状态以及降低出口成本,可以确保有效且可靠的多云方法。 下一主题 |
我们请求您订阅我们的新闻通讯以获取最新更新。