数据仓库教程:它是什么,定义,概念2025年4月7日 | 阅读7分钟 ![]() 数据仓库是关系数据库管理系统 (RDBMS) 的一个构造,用于满足事务处理系统的需求。它可以被宽泛地描述为任何可以为了业务利益而被查询的集中式数据存储库。它是一个存储面向满足决策请求信息的数据库。它是一组决策支持技术,旨在使知识工作者(高管、经理和分析师)能够做出更优越、更高质量的决策。因此,数据仓库支持业务高管系统地组织、理解和使用其信息来做出战略决策的架构和工具。 数据仓库环境包含一个提取、传输和加载 (ETL) 解决方案、一个联机分析处理 (OLAP) 引擎、客户分析工具以及处理信息收集并将其交付给业务用户的其他应用程序。 什么是数据仓库?数据仓库 (DW) 是一个关系数据库,它被设计用于查询和分析,而不是事务处理。它包含从单个和多个来源的事务数据派生的历史数据。 数据仓库提供集成化的、企业范围内的、历史数据,并专注于为决策者提供数据建模和分析支持。 数据仓库是组织整体的特定数据组,而不仅仅是特定用户组。 它不用于日常操作和事务处理,而是用于做出决策。 数据仓库可以被视为具有以下属性的数据系统:
"数据仓库是面向主题的、集成的、随时间变化的信息存储,以支持管理层的决策。" 数据仓库的特点![]() 面向主题数据仓库的目标是为决策者进行数据建模和分析。因此,数据仓库通常围绕特定主题(如客户、产品或销售)提供简洁明了的视图,而不是整个组织的持续运营。这是通过排除与主题无关的数据,并包含用户理解主题所需的所有数据来实现的。 ![]() 整合数据仓库集成了各种异构数据源,如 RDBMS、平面文件和联机事务记录。它要求在数据仓库过程中执行数据清理和集成,以确保不同数据源之间在命名约定、属性类型等方面的一致性。 ![]() 随时间变化历史信息保存在数据仓库中。例如,可以从数据仓库中检索 3 个月、6 个月、12 个月甚至更早的数据。这与事务系统不同,事务系统通常只保留最新的文件。 ![]() 非易失性数据仓库是物理上独立的数据存储,它从源操作 RDBMS 转换而来。数据仓库中的数据不会发生操作性更新,即不执行更新、插入和删除操作。它通常只需要两种数据访问过程:数据的初始加载和数据的访问。因此,DW 不需要事务处理、恢复和并发能力,这可以大大加快数据检索速度。非易失性定义了数据一旦进入仓库,就不应更改。 ![]() 数据仓库的历史数据仓库的概念出现在 20 世纪 80 年代末,当时 IBM 研究员 Barry Devlin 和 Paul Murphy 创立了“业务数据仓库”。 本质上,数据仓库的概念旨在支持信息从操作系统流向决策支持环境的架构模型。该概念试图解决与信息流相关的各种问题,特别是与其相关的高成本。 在没有数据仓库架构的情况下,需要大量的空间来支持多个决策支持环境。在大公司中,各种决策支持环境独立运行是很常见的。 数据仓库的目标
数据市场数据市场(Datamart)是主数据仓库的一个子集,它被分割以满足业务需求,通常侧重于特定目的。 例如:如果我们假设一所荣誉学院是数据仓库,那么,
这些都是部门。每个部门都是数据仓库的一个数据市场。 可能存在独立的财务、销售、生产或营销数据市场。部门包括与公司内特定部门相关的软件、硬件、程序和数据。
数据仓库和数据市场之间的区别
元数据您的数据仓库的内容列在一个名为元数据(Meta Data)的目录中。 元数据的形式数据仓库中的元数据可以找到三种主要类型:
1. 操作元数据 数据仓库的数据来自组织内的多个操作系统,因为操作元数据包含有关操作数据源的所有相关信息。 2. 元数据提取和转换 它包含有关曾经发生过的每次数据转换的详细信息。 3. 最终用户元数据(索引) 数据仓库的导航图是最终用户信息。它使最终用户能够找到数据仓库中的信息。 元数据的特殊意义
数据仓库架构![]() 后端工具和实用程序
底层
中间层
顶层这是一个前端客户端层,包括数据挖掘、分析以及查询和报告功能。 对数据仓库的需求数据仓库之所以需要,原因如下: ![]()
数据仓库的优势
前提条件在学习数据仓库之前,您必须具备基本数据库概念(如模式、ER 模型、结构化查询语言等)的基础知识。 目标受众本教程将帮助计算机科学专业的学生理解与数据仓库相关的基础到高级的概念。 问题我们保证您在使用此数据仓库教程时不会遇到任何问题。但如果存在任何错误,请通过联系表单提交问题。 一些重要的选择题1. OLAP 代表
答案:a 解释:联机分析处理是 OLAP 的缩写。 2. OLTP 代表
答案:b 解释:联机事务处理是 OLTP 的缩写。 3. 元数据是
答案:c 解释:关于数据或信息的数据基本上是元数据。 4. 元数据的类型基本上是
答案:d 解释:数据仓库中有 3 种类型的元数据。 5. ROLAP 代表
答案:a 解释:关系联机分析处理是 ROLAP 的缩写。 下一主题数据仓库组件 |
我们请求您订阅我们的新闻通讯以获取最新更新。