Snowflake 多集群仓库2025年8月1日 | 阅读11分钟 什么是仓库?在 Snowflake 中,虚拟仓库(也称为仓库)是计算资源的集合。为了完成数据仓库中涉及的任务,仓库提供了必要的资源,例如 CPU、内存和临时存储。对于查询和 DML 过程(例如将数据加载到表中),仓库至关重要。 仓库的大小是一个决定性因素,其他项目可以安排来帮助组织和规范仓库操作。您可以随时启动和停止仓库。它们甚至可以一个接一个地调整大小,以适应处理能力的需求。仓库的操作为其提供支持。 ![]() Snowflake 账户何时需要多个虚拟仓库?假设您的公司雇佣了一名数据分析师,他负责管理所有 Snowflake 相关任务,并且每天执行复杂的数据库查询。他们可能会等待几分钟而不是几个小时,因此他们会扩展单个虚拟仓库的容量,直到查询处理速度合适。在这种情况下,一个 Snowflake 仓库是理想的选择。 什么是 Snowflake 多集群虚拟仓库?在处理复杂的并发请求时,您可能会对 Snowflake 的多集群仓库感兴趣,它为并发提供了全自动扩展。多集群仓库是 Snowflake 企业版独有的功能,允许您创建更大的处理能力池来执行查询。一个多集群仓库可以拥有多达十个计算资源集群,而一个普通的虚拟仓库只有一个集群。 ![]() 您的 Snowflake 账户中可以拥有的多集群仓库数量似乎是无限的,就像传统仓库一样,但每个多集群仓库最多只能包含 10 个计算集群。多集群仓库为您提供了许多仓库的并发优势,此外,Snowflake 会根据需要自动启动和停止运行中的集群,以适应用户并发需求的峰值和低谷。 有哪些两种多集群仓库模式可用?在 Snowflake 中,多集群虚拟仓库可以以两种不同的方式运行
![]()
利用 Snowflake 多集群仓库Snowflake 中的多集群虚拟仓库非常适合构建具有众多用户的任何数据应用程序,尤其是产品内分析。假设一家公司在其产品中加入了一个排行榜指标,该产品拥有数千名用户。为了解决查询缓慢和数据加载问题,他们最初满足于扩大一个仓库,但后来他们注意到了成本。他们通过切换到自动扩展的多集群虚拟仓库来应对,这以更低的成本提供了更好的性能。 ![]() 该公司最初实施了标准扩展方法,但由于启动了许多仓库,它仍然产生了过高的成本。由于其 SaaS(软件即服务)产品的用户习惯于看到其排行榜指标延迟十五分钟,因此该公司可以有效地将来自其无服务器功能的请求排队。 ![]() 经过几次测试后,他们能够以自动扩展模式使用单个多集群虚拟仓库,并采用经济扩展策略,在 1 到 6 个集群之间选择,以向排行榜提供新数据。当然,为了在其 数据仓库之上开发产品内分析软件,该公司可能不得不雇佣一个完整的数据工程师团队。如果您正在考虑这样的项目,您应该了解 Propel Data,在那里您可以与您当前的团队合作开发分析。
仓库如何调整大小?Snowflake 仓库提供一系列 T 恤尺寸。T 恤尺寸的增加(XS-4XL)表示 CPU、内存和临时存储按预定百分比增加。虽然您不能自行更改尺寸,但您可以通过选择 T 恤尺寸来更改仓库大小。由于 Snowflake 存储和计算仍然松散耦合,您可以随时启动和停止仓库。您需要在创建时提供规模、扩展策略和多集群属性(企业版及以上)。 ![]() 什么是多集群仓库?通过多集群仓库,您可以调整计算资源,以满足不断变化的用户和查询并发需求,例如在高峰和非高峰时段。默认情况下,虚拟仓库可以用来运行查询的计算资源由其维度决定。每个仓库都可以代表一组计算机资源。当仓库接收到查询时,它会为每个查询分配资源并开始处理它们。 如果剩余的资源不足以运行发送到仓库的每个查询,Snowflake 会将额外的查询排队,直到必要的资源可用。多集群仓库允许 Snowflake 静态或动态地分配额外的仓库,从而创建更大的可用计算资源池。下面列出的功能可用于定义多集群仓库
![]() 此外,多集群仓库支持单个仓库的所有属性和操作,例如
多集群仓库的优势如果您的操作员/查询负载增加到您需要通过典型的单集群仓库获得额外计算资源的程度:要么扩大仓库的整体大小,要么构建新的仓库并将额外的操作员和查询重定向到它们。 ![]() 然后,必须手动合理化更大的仓库,或者在不再需要资源时附加额外的仓库,以节省积分。另一方面,多集群仓库允许更多用户连接到单个、大小相同的仓库。此外
扩展的需求在数字时代,数据量仍在快速增长,企业必须处理海量数据,同时保持成本和功能。 Snowflake 多集群仓库旨在满足这一需求。
![]()
零散管理服务虽然 Snowflake 多集群仓库释放了高性能潜力,但扩展和管理仓库设置可能具有挑战性。我们的零散管理服务可以帮助解决这个问题。我们是管理 Snowflake 多集群仓库中涉及的日常、重复性任务的专家,让您的团队能够专注于他们的领域专业知识真正发挥作用的高价值用例。Snowflake 的多集群仓库提供了一种强大而灵活的方法来动态扩展计算资源,以有效管理波动需求。 ![]() 多集群仓库:它们是什么?Snowflake 多集群仓库是一种虚拟仓库,可以根据波动的查询工作负载自动更改计算集群的数量。为了保持性能和成本效益,它可以水平扩展,通过添加或减少计算集群,而不是依赖单个集群。 基本要素:动态扩展
管理并发
![]() 自扩展 可扩展性不取决于每个集群的大小。集群数量和集群大小(例如 X-Small、Small)都是可配置的。 按使用付费模式 由于费用仅取决于集群运行的时间,因此成本最低。 扩展策略如何运作Snowflake 根据仓库扩展策略决定是否添加或删除集群 标准: 集群根据稳定负载添加或删除。 经济: 为了削减开支,集群的添加或删除更为谨慎。 配置规范
集群激活
应用
![]() 工作负载可变性
优点
最佳技术
此处提供了对 Snowflake 多集群仓库的更全面检查,包括其设计、可扩展性、监控功能和优化技术。 1. 设计
关键要素
2. 扩展机制
扩展策略
经济扩展策略
![]() 3. 观察和管理Snowflake 提供视图和工具来帮助管理和监控多集群仓库 系统视图
要跟踪的指标
警告 要获取有关利用不足或过度配置的信息,请使用 Snowflake 与第三方监控解决方案(例如 Snowflake Partner Connect)的连接设置警报。 4. 配置选项基本参数
高级配置
5. 应用实时分析
数据共享
ETL 工作负载
6. 成本优化调整集群大小 虽然较大的集群大小(如 Large 或 X-large)更适合资源密集型查询,但较小的集群大小(如 Small 或 Medium)在高并发下表现更好。 将集群数量减少到一个
7. 典型障碍
结论总之,我们可以得出结论,通过动态扩展计算资源,Snowflake 多集群仓库提供了一个可靠的解决方案,用于处理波动的工作负载和高查询并发。通过根据需求自动添加或删除集群,它们可以在无需人工干预的情况下提供一致的性能。 下一主题 |
我们请求您订阅我们的新闻通讯以获取最新更新。