什么是数据集市?17 Mar 2025 | 4 分钟阅读 一个 数据集市 是一个指导性信息存储的子集,通常面向特定的目的或主要数据主题,它可以被分发以满足业务需求。数据集市是分析记录存储,旨在专注于组织内特定社区的特定业务功能。数据集市来源于数据仓库中的数据子集,尽管在自下而上的数据仓库设计方法中,数据仓库是由组织数据集市的联合创建的。 数据集市的基本用途是 商业智能 (BI) 应用程序。BI 用于收集、存储、访问和分析记录。 小型企业可以使用它来利用他们积累的数据,因为它比实施数据仓库便宜。 ![]() 创建数据集市的原因
数据集市的类型设计数据集市主要有两种方法。 这些方法是
依赖数据集市一个依赖数据集市是一个更高级别的数据仓库的物理子集的逻辑子集。 根据此技术,数据集市被视为数据仓库的子集。 在此技术中,首先创建一个数据仓库,然后可以从中创建更多各种数据集市。 这些数据集市依赖于数据仓库并从中提取必要的记录。 在此技术中,由于数据仓库创建了数据集市; 因此,不需要数据集市集成。 它也称为 自顶向下方法。 ![]() 独立数据集市第二种方法是独立数据集市 (IDM)。这里,首先创建独立的数据集市,然后使用这些独立的多个数据集市设计数据仓库。 在这种方法中,由于所有数据集市都是独立设计的; 因此,需要集成数据集市。 它也被称为 自下而上方法,因为数据集市被集成以开发数据仓库。 ![]() 除了这两个类别之外,还存在一种称为“混合数据集市”的类型。 混合数据集市它允许我们结合来自数据仓库以外的来源的输入。 这对于许多情况都可能有用; 尤其是在需要临时集成时,例如在新组或产品添加到组织之后。 实施数据集市的步骤实施数据集市的重要步骤是设计模式、构建物理存储、使用来自源系统的数据填充数据集市、访问它以做出明智的决策并在一段时间内对其进行管理。 所以,步骤是 设计设计步骤是数据集市过程中的第一步。 此阶段涵盖了从启动数据集市请求到收集有关需求的数据并开发数据集市的逻辑和物理设计的所有功能。 它涉及以下任务
构建此步骤包含创建物理数据库和与数据集市关联的逻辑结构,以提供对数据的快速高效访问。 它涉及以下任务
填充此步骤包括与从源获取数据、清理数据、将其修改为正确的格式和详细程度以及将其移动到数据集市相关的所有任务。 它涉及以下任务
访问方式此步骤包括使用数据:查询数据、分析数据、创建报告、图表和图形并发布它们。 它涉及以下任务
管理此步骤包含在其生命周期内管理数据集市。 在此步骤中,执行的管理功能如下
数据仓库和数据集市之间的区别![]()
下一个主题数据仓库交付流程 |
我们请求您订阅我们的新闻通讯以获取最新更新。