DBMS 的全称是什么2025年3月17日 | 阅读 8 分钟 DBMS:数据库管理系统DBMS 意为数据库管理系统。在计算领域,数据库是电子可访问和存储的结构化数据集合。数据库、数据库管理系统和相关应用程序的组合被称为数据库系统。术语“数据库”经常被含糊地用于描述任何 DBMS、数据库系统或与数据库相关的应用程序。 ![]() 计算机科学家可以根据其支持的数据库模型对数据库管理系统进行分类。在 20 世纪 80 年代,关系数据库崭露头角,而称为 NoSQL 的非关系数据库(因为它们使用多种查询语言)在 21 世纪 2000 年代开始流行。 ![]() 定义和概述从正式意义上讲,“数据库”是指相应数据的集合以及数据的组织方式。DBMS 的众多功能允许输入、存储和检索大量数据,同时也提供了控制信息组织方式的选项。由于它们之间密切的关系,术语“数据库”经常被误用,用来描述数据库和用于管理它的 DBMS。 现有的 DBMS 为数据库及其数据提供各种管理功能,这些功能可分为四种主要功能类别 数据定义:指定数据组织方式的用途的创建、更新和删除。 更新:实际数据的插入、修改和删除。 检索:以我们可立即使用或可由其他程序进一步处理的形式提供信息称为检索。数据可以以与存储在数据库中的形式基本相同的记录形式展现,也可以以通过合并或更改数据库中已有数据创建的新形式展现。 管理:用户注册、用户监控、数据安全执行、性能跟踪、数据完整性维护、并发管理以及数据从污染数据的事件中恢复都是管理方面的考虑。 ![]() 数据库遵循特定数据库模型的基本原则,其 DBMS 也是如此。数据库模型、管理系统和数据库统称为“数据库系统”。数据库服务器通常包含多个处理器、大量内存和 RAID 磁盘阵列,以实现可靠存储。在交易量很大的环境中,也使用连接到一个或多个服务器的高速通道的硬件数据库加速器。 大多数数据库应用程序以 DBMS 为基础。虽然现代 DBMS 通常依赖于传统的操作系统来提供这些任务,但一些 DBMS 可能围绕一个独特的、具有内置网络功能的、多任务的内核构建。由于 DBMS 代表着一个庞大的市场,计算机和存储公司经常在他们的开发计划中考虑 DBMS 的需求。除了用于访问数据库的查询术语(如 SQL 或 XQuery)外,数据库和 DBMS 还可以根据数据库模型和安全性进行分类。 历史数据库及其相应的 DBMS 在规模、功能和性能方面都得到了发展。 早期系统依赖于磁带上的顺序数据存储。然而,随着像磁性磁盘这样的直接访问存储介质的发展,这些介质在 20 世纪 60 年代中期得到广泛普及,数据库的概念成为可能。层次模型和 CODASYL 模型(网络模型)是主要的早期导航数据模型。这些模型通过指针,即频繁的物理磁盘地址,来跟踪记录之间的链接。 ![]() 与这种传统不同,埃德加·F·科德(Edgar F. Codd)于 1970 年提出的关系模型坚持认为,程序应该通过内容而不是链接来查找数据。在关系模型中,使用一组账本式表格,每个表格用于不同类型的实体。 DBMS 的演变直到 20 世纪 80 年代中期,计算机硬件才足够强大,可以广泛使用关系系统(DBMS 及应用程序)。但到 20 世纪 90 年代初,关系系统已在所有大规模数据处理应用中占据主导地位,并且在 2018 年仍然如此。最流行的 DBMS 包括 IBM Db2、Oracle、MySQL 和 Microsoft SQL Server。不同数据模型的数据库语言受到了占主导地位的数据库语言的影响,即关系模型的标准化 SQL。为了解决对象-关系阻抗不匹配的问题,它们在 20 世纪 80 年代开发了对象数据库,这催生了“后关系”和混合对象-关系数据库的术语。 ![]() 随着 2000 年代后期快速的键值存储和文档数据库的出现,下一代后关系数据库成为了 NoSQL 数据库。作为竞争对手的“下一代”NewSQL 数据库试图在努力匹配 NoSQL 相较于商业可用关系 DBMS 的卓越性能的同时,重新实现关系/SQL 模型。在 20 世纪 60 年代,DBMS 用于导航数据库和导航信息,基本的导航框架数据库 CODASYL 模型被使用。 20 世纪 60 年代的 DBMS在 20 世纪 60 年代中期,直接访问存储(磁盘和鼓)得到广泛应用时,我们首次使用了“数据库”一词。通过允许共享交互式使用而不是每日批处理,该术语与过去基于磁带的系统形成对比。根据《牛津英语词典》,术语“数据库”首次在 1962 年加州系统开发公司的一篇论文中以精确的技术含义使用。随着计算机速度和能力的提高,出现了各种通用数据库系统。到 20 世纪 60 年代中期,其中许多系统已进入商业领域。查尔斯·巴赫曼(Charles Bachman),一家名为 Integrated Data Store (IDS) 的产品开发者,看到了对标准的需求增加,并成立了 CODASYL 的数据库任务组,该组织负责 COBOL 的开发和标准化。CODASYL 方法,由数据库任务组于 1971 年提供为标准,迅速促使了多种商业系统的上市。 ![]() 围绕 CODASYL 方法,它们使程序能够遍历链接数据的网络。应用程序可以使用诸如应用主键(称为 CALC 键,通常通过哈希实现)等技术来搜索记录。 将关系(也称为集合)从一个记录移动到另一个记录,同时顺序扫描所有记录。后来系统引入了 B 树以提供其他访问路径。它们还在许多 CODASYL 数据库中实现了声明式查询语言,这些数据库供最终用户使用(不同于导航 API)。 然而,CODASYL 数据库非常复杂,并且创建的应用程序几乎需要大量的培训和工作。1966 年,IBM 推出了其 DBMS(IMS)信息管理系统。IMS 是为阿波罗计划在 System/360 上开发的软件版本。IMS 和 CODASYL 具有广泛相似的概念。但是,IMS 的数据导航模型采用了比 CODASYL 的网络方法更严格的层次结构。由于数据可访问的方式,这两种概念后来都被称为导航数据库。IMS 是 IBM 的分层数据库。IDMS 和 Cincom Systems 的 TOTAL 数据库被归类为网络数据库。2014 年,IMS 仍在使用。 20 世纪 70 年代的 DBMS埃德加·F·科德(Edgar F. Codd)在加州圣何塞的一家 IBM 子公司工作,该公司专门从事复杂磁盘系统的开发。他对 CODASYL 方法的导航架构不满意,特别是缺乏“搜索”功能。他于 1970 年发表了一系列论文,概述了一种构建数据库的新方法,最终导致了具有里程碑意义的“大型共享数据库的数据库关系模型”。他在研究中讨论了一种存储和管理大型数据集的新方法。科德的理念是将记录结构化,而不是像 CODASYL 那样将它们保存在自由格式条目的链接列表中。 ![]() 科德计划将数据分成多个“表”,每个表容纳一种不同类型的实体。每个表将具有一组固定的列,每列包含实体的属性。每个表有一个或多个主键,可用于唯一标识表中的行(模型因此得名)。试图确保他们只记录每个“事实”一次,数据被分成一组规范化的表(或关系)。从而简化更新过程。 视图,本质上是虚拟表,可以以各种方式向用户暴露数据,但他们无法直接修改它们。科德没有使用表、行和列来描述模型,而是使用了关系、元组和域。早期实现产生了当前广泛使用的术语。后来,科德批评了实际实现偏离模型数学基础的倾向。 他们选择主键(用户导向的 ID)而不是磁盘地址来表示跨表关联。从技术角度来看,这使得在不花费数据库重新排列成本的情况下移动和调整表大小成为可能。使用显式标识符使具有清晰数学定义的更新操作的定义更加简单。 它还允许在第一阶谓词逻辑的公认领域中定义查询操作。由于这些操作具有明显的数学属性,因此可以以这种方式重写查询。然而,科德对查询优化所基于的语义差异更感兴趣。与层次模型或网络模型相比,虽然表之间的链接不再突出,但并没有丢失表达能力。 在层次模型和网络模型中,记录可以具有复杂的内部结构。例如,员工的过去薪资可能在其雇佣记录中显示为“重复组”。由于关系模型中的规范化,此类内部结构被维护在多个表中的数据所取代,这些数据仅通过逻辑键相关联。例如,数据库系统通常用于跟踪用户信息,包括姓名、登录详情、地址和电话号码。他们会将所有这些信息包含在海上战略中。 当今的 DBMSSQL 2000、NoSQL 和 NewSQL 是当今的 DBMS。XML 是当今使用的最新数据库。XML 数据库是一种结构化的文档导向数据库,它允许基于 XML 文档的属性进行查询。科学出版物、专利、税务申报和雇佣记录是一些经常使用 XML 数据库的应用程序示例。NoSQL 数据库通常非常快速,不需要预定义的表模式,存储非规范化数据而不是连接数据,并且旨在水平扩展。然而,近年来,大规模分布式数据库和高分区容忍度的需求量很大。 结论自 20 世纪 60 年代以来,数据库技术一直是学术界和商业研发部门热门的研究领域。原型和理论的创建都包含在研究活动中。模型、原子事务思想、相关的并发控制策略、查询语言和查询优化方法、RAID 等一直是重要的研究领域。 ![]() 年度会议和几本专业学术期刊(如 ACM Transactions on Database Systems-TODS 和 Data and Knowledge Engineering-DKE)可供数据库研究。 下一个主题全称 |
我们请求您订阅我们的新闻通讯以获取最新更新。