Snowflake 数据货币化框架

2025年8月2日 | 阅读 9 分钟

市场上有两种不同的列表:私有和公共

通过将其设置为私有,您可以创建仅对您指定的客户可见的共享。您可以使用列表功能,通过使用私有列表,直接在任何 Snowflake 区域与其他 Snowflake 账户通信数据和其他信息。另一方面,Marketplace 中的任何 Snowflake 账户都可以看到公共列表。

Snowflake Framework for Data Monetization

Snowflake Marketplace 中金融数据的定价结构

数据供应商可以在 Snowflake Marketplace 中使用两种灵活的定价模型——按使用量计费或按订阅计费——来为其服务创收。

1. 基于使用量

  • 此定价允许供应商根据客户的实际数据使用量进行计费。有三种方法可以实现这一点:
  • 月度基本费:当至少有一个访问付费数据的查询执行时,每月收取固定费用。如果没有对列表数据执行查询,则不收取固定费用。
  • 月度费用不按比例计算。例如,以下是美国股市情绪指标的列表,每月售价 1,500 美元。

2. 按查询计费

对运行在数据上的每个查询收取固定费用。这可以与固定月费一起或不一起实现。例如,这是 Marketplace 上提供的一份美国股市短期份额量数据,每项查询收费 1 美元。

可计费事件

自定义事件计费(根据可计费事件收费)仅适用于共享应用程序的列表。您可以使用自定义事件计费为您的应用程序的特定用途设置费用。例如,您可以向以下对象收费:

  • 应用程序修改的每行数据
  • 按应用程序的函数调用
  • 应用程序使用的每行数据
  • 您每月更新的每行唯一数据(每月活跃行)
  • 您还可以为应用程序代码中指定的其他事件收费。请记住,此功能目前对公众可用。
  • 基于订阅
  • 选择此价格计划的客户预先支付一定时间段内使用数据包的费用。

哪种模型最合适将取决于具体的数据产品及其目标受众。除了为客户提供选择外,按使用量计费的定价还可以帮助那些处理使用量不规律趋势的供应商。需要稳定访问数据的客户可能会发现基于订阅的定价很有吸引力,因为它提供了稳定的收入来源。

用于商业智能的丰富数据

通过提取见解并将其重新销售到 Marketplace 来丰富您的原始数据是第二种策略。潜在的数据消费者可能会发现这更具吸引力,因为他们不必聘请自己的数据分析师。

丰富您的基本财务数据涉及几个关键步骤:

  • 时间与地理增强
  • 如果适用,提供地理空间数据,特别是对于具有地理组成部分的金融数据。为了便于基于时间的分析,请添加时间信息,例如日期和时间戳。
Snowflake Framework for Data Monetization

计算比率和指标

计算财务比率和派生指标,以提供更多信息。为了提供对经济数据的更全面了解,例如,计算盈利能力比率、流动性比率或财务绩效指标。

1. 金融文件文本分析

对包含金融文件或报告的数据集进行文本分析,以提取有价值的信息。

2. 数据洁净室

  • 您还可以利用 Marketplace 来宣传您用于数据洁净室的数据。数据洁净室是一个安全、受控的空间,多个企业或公司部门可以在其中聚合数据以进行协作分析,同时遵守规则和法规。
  • 数据洁净室规定了哪些信息可以进入洁净室、如何与其他内部信息连接、每方可以对信息进行何种分析,以及(如果有的话)哪些信息可以退出。
  • 数据供应商和消费者可以通过 Marketplace 中的私有列表交换数据,将它们结合起来以获得更全面的结果。

出售数据的道德和法律方面

企业在出售金融数据——或者任何数据——时,必须处理一系列道德和法律问题,以保持合规并赢得公众信任。从法律上讲,数据隐私法对个人数据的收集、处理和传输施加了严格的要求。

Snowflake Framework for Data Monetization

企业在出售某人的数据之前必须获得知情同意。数据销售引发了关于公平性、用户同意和负责任信息使用的道德问题。企业必须确保个人对他们的数据保持开放和诚实,并了解其使用方式。

延迟歧视性做法或向弱势群体出售私人信息也至关重要。要在业务目标和道德价值观之间取得平衡,对于保持积极声誉和赢得客户来说是必要的。

数据货币化趋势

随着数据量的急剧增长,现代数据交换每年都在增长。尽管“数据是新的货币”和“每个公司都是数据公司”等说法可能显得陈词滥调,但在当今竞争激烈且全球化的市场中,及时且相关联的业务数据至关重要。

数据货币化和 Snowflake

如果您刚刚开始一个数据货币化项目,API 似乎是一种快速便捷的数据共享方式。

在踏上这段旅程之前,请考虑基于 API 的策略可能带来的一些主要挑战,例如:

  • 数据量始终可用的限制
  • 创建和管理 API 所需的内部资源知识
  • 用户可以使用的分析类型受限
  • 让数据用户熟悉您的自定义 API
  • 性能和质量方面的常见问题

与依赖性能受限且难以维护的 API 相比,请考虑实施现代数据共享技术,例如 Snowflake Marketplace。它使企业能够轻松发布各种数据集,这些数据集可以立即供其他 Snowflake 用户使用或购买。

Snowflake Framework for Data Monetization

Snowflake Marketplace 是一个蓬勃发展的资源,拥有数百家供应商,提供数千种可供试用或购买的第三方数据集、应用程序和服务。许多供应商将他们的商品列在 Snowflake Marketplace 上供 Snowflake 客户购买,他们利用我们集成的 Marketplace 货币化功能来简化流程并加速销售和采购周期。

Marketplace 货币化:它是什么?

通过 Marketplace 货币化,供应商可以将其商品销售给 Snowflake 客户,并直接向他们开具发票。客户可以立即开始使用数据产品,因为他们是从信誉良好的供应商处购买的,从而避免了为新供应商进行尽职调查、入职和验证安全标准等可能耗时的过程。更快的价值实现得益于更短的销售、采购和合同周期,这使客户和供应商都受益。

  • 自然,价格由供应商设定和控制。对于面向公众的标准商品,可以将其做得更通用;或者,它可以定制并私密提供或对选定的客户可见。
  • 无论供应商选择哪种模式,在将定价和货币化策略转移到 Snowflake 时,都不必担心不同渠道之间定价不匹配的问题。

如果客户有机会彻底测试解决方案并稍微“试用”一下,他们可能会不愿意为数据产品付费。Snowflake Marketplace 通过提供多种选项来解决此问题,使买家能够在购买前预览列表。

有时限的试用

  • 有限功能试用,例如SaaS公司的“免费增值”商业模式。
  • 按使用量计费的试用(私有预览现已推出)
  • 为了提高现有客户和潜在客户的认知度,许多成功的供应商在 Snowflake Marketplace 上提供公开付费列表,提供免费试用。
  • 通过这种方法,他们可以在解决自助服务客户群体的同时,为向上销售生成潜在客户,并就定制产品进行私人讨论。
Snowflake Framework for Data Monetization

有多少客户发起了试用?

  • 消耗的产品数量和正在使用的共享中的项目
  • 谁使用了或购买了您的商品,连同他们的联系方式和总成本
  • 有多少钱已转入您的银行账户?
  • 尽管供应商始终可以完全访问整个客户生命周期视图,但他们可以将其精力集中在漏斗中最关键的部分,以生成新业务并达成新交易。
  • 除了帮助我们的供应商降低列在 Snowflake Marketplace 上的商品的管理费用外,Snowflake 还提供所有这些开箱即用的功能,以加快使用其产品的客户的价值实现速度。

提供哪些货币化模型?

按使用量计费和订阅货币化是两种可用模型。我们的按使用量计费定价策略(这也是 Snowflake 使用按使用量计费的原因之一)使供应商能够降低客户的入门门槛。

Snowflake Framework for Data Monetization

自定义事件计费(目前处于公开预览状态)是 Snowflake Native Apps 提供的另一种独特的按使用量计费定价机制。借助此基于 API 的计费,供应商可以根据其应用程序提供的几乎任何价值进行收费和计量。例如,您可以将计费事件包含在应用程序代码中,从而仅根据用户如何使用您的应用程序来收费。供应商可以通过这种灵活的、按使用量计费的定价策略根据其应用程序的价值进行定价。典型示例包括:

  • 数据洁净室和数据丰富程序的定价基于应用程序吸收或输出的行数或字节数。
  • 按使用应用程序的唯一用户数量定价。按应用程序使用的每月活跃行数定价,包括ETL和反向 ETL。
  • 随着客户对数据产品或应用程序的使用增加并从中获得更多价值,供应商可能希望采用基于订阅的定价模型,以向这些客户提供更一致的定价。

通过在整个期限内分期付款的选项,订阅付款可以变得更加灵活。根据供应商的需求和客户的意愿,您可以将订阅设置为在订阅期间平均分配部分付款、后加载或前加载。

Snowflake Framework for Data Monetization

自然,下面将概述 Snowflake 的列式数据库架构以及它如何最大化数据检索和存储。

1. Snowflake 的列式存储

  • Snowflake 将数据以列式方式存储,而不是将整个行保存在一起,这意味着每列的数据被存储在一起。
  • 这种架构提高了查询性能,特别是对于只需要特定列的分析工作负载。
  • 由于列中的项目类型相同且通常具有相似的值,因此可以实现更好的压缩。

2. Snowflake 微分区

  • 当数据导入 Snowflake 时,它会自动被划分为微分区。
  • 压缩的微分区以列式格式存储。
  • 由于 Snowflake 会根据查询模式自动优化分区,因此用户无需显式定义分区。
  • 每个微分区都包含元数据,例如行数、不同值的数量以及最小值/最大值。

3. 存储优化

  • Snowflake 使用先进的编码方法,包括字典编码、游程长度编码 (RLE) 和增量编码,来存储压缩的列式数据。
  • 时间旅行和故障:安全特性使得查询历史数据成为可能,而不会增加存储的复杂性。
  • 与典型数据库不同,Snowflake 分离计算和存储,从而降低了存储成本并提高了性能。

4. 列式格式查询性能

  • 修剪,即跳过不必要的行分区,是 Snowflake 查询引擎用于缩短查询执行时间的一种技术。
  • 由于只扫描所需的列而不是整行,因此 I/O 操作减少了。
  • 由于查询结果被缓存,因此不必重复计算频繁请求的数据。

5. 架构设计注意事项

  • Snowflake 兼容反规范化的扁平表、星型架构和雪花型架构。
  • 由于在大规模分析中,连接(join)可能成本高昂,因此建议进行反规范化以优化性能。
  • 通过使用物化视图和聚类键,可以显著提高查询效率。

6. 处理和计算

  • Snowflake 使用虚拟仓库(计算节点集合)来处理查询。
  • 动态地扩展或缩减计算资源,从而实现计算与存储的分离。
  • 使用大规模并行处理 (MPP) 来处理查询,将任务分配给多个计算节点。
Snowflake Framework for Data Monetization

随着客户对数据产品或应用程序的使用增加并从中获得更多价值,供应商可能希望采用基于订阅的定价模型,以向这些客户提供更一致的定价。Snowflake 提供递归和非递归订阅模型,其期限从一个月到几个月不等,甚至几年。用户可以选择现在付款以获得访问权限,或者稍后付款。

通过在整个期限内分期付款的选项,订阅付款可以变得更加灵活。根据供应商的需求和客户的意愿,您可以将订阅设置为在订阅期间平均分配部分付款、后加载或前加载。

结论

总之,我们可以得出结论,对于分析应用程序,Snowflake 的列式数据库设计提供了一种非常高效、可扩展且优化的解决方案。Snowflake 通过使用列式存储、微分区、智能修剪和查询缓存,确保了快速的查询性能和经济高效的存储。计算和存储的分离所实现的灵活资源管理对于大数据处理和实时分析非常有益。

Snowflake 通过自动化许多优化过程、降低维护要求并提高速度,而无需复杂的索引或调优,从而简化了数据仓库的构建。对于现代云数据分析来说,它是一个绝佳的选择。


下一主题