什么是数据库?定义、类型、示例

2025年5月5日 | 阅读11分钟

什么是数据?

数据是信息的一个独立的、微小的单元的集合。它可以以各种形式使用,如文本、数字、媒体、字节等。它可以存储在纸张碎片或电子内存中,等等。

“Data”一词源于“datum”一词,意思是“单一的信息片段”。它是“datum”这个词的复数。

在计算中,数据是信息,它可以被转换成一种高效移动和处理的形式。数据是可互换的。

数据库中数据的属性

数据库中数据的基本属性是

  • 数据库中的数据应该是井井有条的。
  • 它应该是经过良好整合的。
  • 它应该永久存储,以便以后使用。
  • 在数据库损坏的情况下,它应该是可恢复的。
  • 数据应该是具有弹性的。
  • 它应该在不同用户之间以及在应用程序内共享。
  • 数据应该在需要时、在需要的地方就可以访问。

为了维护大型数据库,我们需要一些操作来有效地维护数据库中的数据。对数据库执行的操作如下:

  • 插入:此操作用于向数据库添加新记录。例如:向电话号码目录添加新号码。
  • 更新:此操作用于更新现有数据。例如:假设某个人的姓氏发生了变化,那么您必须通过用新姓氏替换旧姓氏来修改姓氏。
  • 删除:此操作用于从数据库中删除现有数据。例如:假设某人从卢迪亚纳搬到了昌迪加尔,那么关于该人的信息应该从卢迪亚纳的电话号码目录中删除。
  • 选择:此操作用于检索现有数据。例如:要查看特定人员的电话号码目录,我们可以从电话号码目录中搜索他的号码。
  • 排序:此操作用于按升序或降序排列数据。例如:在电话号码目录中,为了快速检索,电话号码应该按字母顺序排列。

除了上述对数据库中数据执行的基本操作外,我们还可以执行合并等操作。

数据库在现实世界中的重要性

数据库并非新概念。在计算机不常用的时候,它曾被用作手动管理数据的记录保存系统。手动文件系统传统上由文件和文件夹的集合组成。这些文件和文件夹被正确标记并存放在文件柜中。每当组织中的员工需要一些信息时,他们就会从第一个条目开始,按顺序搜索特定的文件夹。为了加快搜索速度,这些文件通常会被索引。因此,办公室里的文件夹可能包含员工详细信息,如工作详细信息、薪资和休假状况,可以按员工工作状况的类别进行组织。办公室里的一个特定柜子可能有一个包含所有销售部门员工的文件夹。

从上面的例子可以看出,只要数据收集相对较少,并且组织的管理者报告要求不多,手动系统就能很好地工作。然而,随着组织的成长和报告要求的日益复杂,在手动系统中跟踪数据变得非常困难。此外,在手动文件系统中生成报告可能是一项耗时且困难的任务。

为了克服这些问题,设计了基于计算机的文件方法。这是一种比早期手动系统处理技术更有效的数据处理技术。随着存储设备的进步和容量的增加,现在可以轻松处理大型数据库。

什么是数据库?

数据库是有组织的数据集合,以便于访问和管理。

您可以将数据组织到表、行、列中,并对其进行索引,以便于查找相关信息。

数据库处理器以这样一种方式创建数据库,即只有一套软件程序为所有用户提供数据访问。

数据库的主要目的是通过存储、检索和管理数据来操作大量信息。

如今,万维网上有许多动态网站是通过数据库处理的。例如,一个检查酒店客房可用性的模型。这是一个使用数据库的动态网站的例子。

有许多可用的数据库,如 MySQL、Sybase、Oracle、MongoDB、Informix、PostgreSQL、SQL Server 等。

有许多可用的数据库,如 MySQL、Sybase、OracleMongoDB、Informix、PostgreSQLSQL Server 等。

现代数据库由数据库管理系统 (DBMS) 管理。

SQL 或结构化查询语言用于操作存储在数据库中的数据。SQL 依赖于 关系代数和元组关系演算。

使用圆柱形结构来显示数据库的图像。

database

上图显示了数据库的图形表示

数据库的演变

数据库已经走过了从平面文件系统到关系型和对象关系型系统的 50 多年的演变历程。它经历了几个世代。

基于文件

1968 年是文件型数据库引入的一年。在文件型数据库中,数据保存在平面文件中。虽然文件有很多优点,但也有一些限制。

其中一个主要优点是文件系统具有各种访问方法,例如顺序访问、索引访问和随机访问。

它需要使用 COBOL、BASIC 等第三代语言进行大量的编程。

层次数据模型

1968-1980 年是层次数据库的时代。著名的 层次数据库模型是 IBM 的第一个 DBMS。它被称为 IMS(信息管理系统)。

在此模型中,文件以父/子关系相关联。

下面的图表示层次数据模型。小圆圈代表对象。

database 2

层次模型的优点

  1. 简单性:在此模型中,记录以父子关系链接,操作如插入、删除等在树状结构上非常容易执行。
  2. 数据完整性:记录通过父子关系链接。因此,每个子节点都可以通过其父节点访问,或通过其父节点到达,因此数据完整性是此模型的一个主要优点。
  3. 数据安全性:每个父节点只链接到一个父节点,并且可以通过其父节点访问,因此删除任何节点都需要首先从结构中搜索父节点。因此,它保持了数据安全。
  4. 效率:此模型的效率非常高,因为此模型在父子记录之间维护 1:N 的关系。当数据库中有大量记录时,此模型可以高效地处理记录。

层次模型的缺点

  1. 灵活性:此模型出现的主要问题是它只能表示一种关系,即 1:N。此模型缺乏表示现实世界中所有关系的灵活性。
  2. 缺乏数据独立性:此模型缺乏对数据库中数据结构的修改,因为更改数据库结构需要对访问数据库的整个应用程序进行相应更改。
  3. 缺乏查询能力:访问数据库中数据的唯一可能方法是通过物理链接从根节点到包含所需数据的子节点。这使得查询更加复杂。
  4. 数据操作问题:在执行插入、删除、更新和检索等数据操作时会遇到几个问题。
  5. 缺乏标准:此模型中没有关于数据库设计的精确标准。

与文件系统一样,此模型也有一些限制,例如实现复杂、缺乏结构独立性、难以处理多对多关系等。

网络数据模型

Charles Bachman 在霍尼韦尔开发了第一个 DBMS,称为 Integrated Data Store (IDS)。它开发于 20 世纪 60 年代初,但于 1971 年由 CODASYL 组织(数据系统语言会议)标准化。

在此模型中,文件以所有者和成员的形式相关联,类似于通用的 网络模型

网络数据模型识别了以下组件

  • 网络模式(数据库组织)
  • 子模式(每个用户的数据库视图)
  • 数据管理语言(过程式)

此模型也有一些限制,例如系统复杂性以及设计和维护困难。

网络模型的优点

  1. 简单性:此模型简单易实现。
  2. 易于访问数据:由于数据元素有多个访问路径,在此模型中可以快速轻松地访问数据。
  3. 数据完整性:在此模型中,父组件与其子组件之间始终存在关系,因此它保持了数据完整性。
  4. 关系类型:网络模型可以处理一对一和多对多的关系。
  5. 数据独立性:此模型支持数据独立性。

网络模型的缺点

  1. 复杂:所有记录都必须使用指针进行维护,因此数据库结构变得更加复杂。
  2. 操作复杂性:网络模型需要大量的指针,因此插入、删除和更新更加复杂。
  3. 缺乏结构独立性:由于更改结构时应用程序也必须更改,因此缺乏结构独立性。

关系数据库

1970 年至今:这是 关系数据库和数据库管理的时代。1970 年,E.F. Codd 提出了关系模型。

关系数据库模型有两个主要术语,称为实例和模式。

实例是带有行或列的表

模式指定结构,如关系名称、每列的类型和名称。

此模型使用集合论和谓词逻辑等数学概念。

第一个互联网数据库应用程序于 1995 年创建。

在关系数据库时代,出现了许多模型,如面向对象模型、对象关系模型等。

云数据库

云数据库允许您通过云平台存储、管理和检索其结构化、非结构化数据。这些数据可以通过 Internet 访问。云数据库也称为数据库即服务 (DBaaS),因为它们作为托管服务提供。

一些最佳云选项是

  • AWS (Amazon Web Services)
  • Snowflake Computing
  • Oracle Database Cloud Services
  • Microsoft SQL Server
  • Google Cloud Spanner

云数据库的优点

成本较低

通常,公司提供商不必在数据库上进行投资。它可以维护和支持一个或多个数据中心。

自动化

云数据库拥有各种自动化流程,如恢复、故障转移和自动缩放。

可访问性增强

您可以随时随地访问基于云的数据库。您只需要互联网连接。

NoSQL 数据库

NoSQL 数据库是一种设计此类数据库的方法,它可以容纳各种数据模型。NoSQL 代表“不仅仅是 SQL”。它是传统关系数据库的替代品,在传统关系数据库中,数据被放在表中,并且在构建数据库之前就完美设计了数据模式。

NoSQL 数据库对于大量的分布式数据很有用。

database 2

一些 NoSQL 数据库系统及其类别示例

  • MongoDB、CouchDB、Cloudant(文档式
  • Memcached、Redis、Coherence(键值存储
  • HBase、Big Table、Accumulo(表格式

NoSQL 的优点

高可扩展性

由于可扩展性,NoSQL 可以处理大量数据。如果数据增长,NoSQL 数据库会进行扩展以高效地处理这些数据。

高可用性

NoSQL 支持自动复制。自动复制使其高度可用,因为在任何故障发生时,数据会自我复制到之前的一致状态。

NoSQL 的缺点

开源

NoSQL 是一个开源数据库,因此目前还没有可靠的 NoSQL 标准。

管理挑战

NoSQL 中的数据管理比关系数据库复杂得多。安装非常困难,而且日常管理更加繁琐。

没有图形用户界面 (GUI)

NoSQL 数据库的 GUI 工具在市场上不易获得。

备份

备份是 NoSQL 数据库的一个大弱点。一些数据库,如 MongoDB,没有强大的数据备份方法。

面向对象数据库

面向对象数据库以对象和类的形式存储数据。对象是现实世界的实体,类型是对象的集合。面向对象数据库是关系模型功能的组合与面向对象原理。它是关系模型的另一种实现。

面向对象数据库遵循面向对象编程的规则。面向对象数据库管理系统是一个混合应用程序。

面向对象数据库模型包含以下属性。

面向对象编程属性

  • 对象
  • 继承
  • 多态
  • 封装

关系数据库属性

  • 原子性
  • 一致性
  • 诚信
  • 耐用性
  • 并发性
  • 查询处理

图数据库

图数据库是一种 NoSQL 数据库。它是数据的图形表示。它包含节点和边。节点代表一个实体,每个边代表两个实体之间的关系。图数据库中的每个节点都代表一个唯一的标识符。

图数据库在搜索数据之间的关系方面很有益,因为它们突出了相关数据之间的关系。

database 2

当数据库包含复杂的关系和动态模式时,图数据库非常有用。

它主要用于供应链管理,识别IP 电话的来源。

DBMS(数据库管理系统)

数据库管理系统是一种用于存储和检索数据库的软件。例如,Oracle、MySQL 等;这些是一些流行的 DBMS 工具。

  • DBMS 提供了一个接口来执行各种操作,如创建、删除、修改等。
  • DBMS 允许用户根据自己的需求创建数据库。
  • DBMS 接受来自应用程序的请求,并通过操作系统提供特定的数据。
  • DBMS 包含一组根据用户指令执行的程序。
  • 它为数据库提供安全保护。

DBMS 的优点

控制冗余

它将所有数据存储在单个数据库文件中,因此可以控制数据冗余。

数据共享

授权用户可以在多个用户之间共享数据。

备份

它提供备份和恢复子系统。此恢复系统可从系统故障中自动创建数据,并在需要时恢复数据。

多用户界面

它提供不同类型的用户界面,如 GUI、应用程序接口。

DBMS 的缺点

大小

它占用大量磁盘空间和内存才能高效运行。

费用

DBMS 需要高速数据处理器和更大的内存来运行 DBMS 软件,因此成本较高。

复杂度

DBMS 会带来额外的复杂性和要求。

RDBMS(关系数据库管理系统)

RDBMS 这个词被称为“关系数据库管理系统”。它表示为一个包含行和列的表。

RDBMS 基于关系模型;它由 E. F. Codd 提出。

关系数据库包含以下组件

  • 记录/元组
  • 字段/列名/属性
  • 实例
  • 模式

RDBMS 是一个表格型 DBMS,它维护数据的安全性、完整性、准确性和一致性。

关于数据库的常见问题解答

1. 讨论数据管理的数据库方法?

为了克服文件系统方法的所有局限性,需要一种更有效的新方法。因此,引入了数据库的概念。

数据库是大量数据存储库,可供多个部门和用户同时使用。通过数据库方法,数据项不再是包含冗余数据的断开的文件,而是以最少的重复链接,并且仅保留在一个位置。

2. 数据对组织为什么如此重要?

数据是任何组织顺利管理的一个非常重要的资源。因此,重要的是将数据组织成一种可理解的形式,因为无组织的数据没有意义。

3. 什么是关系数据模型?

关系数据模型以表格的形式包含信息。

4. 列出数据库系统中的不同用户类型?

  • 数据库管理员
  • 数据库设计者
  • 最终用户
  • 应用程序程序员

5. 讨论关系的特征?

  • 关系及其属性必须有一个唯一的名称。
  • 每个行值都必须有一个唯一的值。
  • 一个关系至少必须有一个字段。

下一主题数据库类型