分布式文件系统2025年4月22日 | 阅读6分钟 在本文中,您将学习到操作系统中的分布式文件系统及其特性、组件、优点和缺点。 什么是分布式文件系统?分布式文件系统 (DFS) 是一种分布在多个文件服务器和位置的文件系统。它允许程序以与本地文件相同的方式访问和存储孤立的数据。它还允许用户从任何系统访问文件。它允许网络用户以受控和授权的方式共享信息和文件。虽然,服务器对数据拥有完全控制权,并向用户提供访问控制。 DFS 的主要目标是使物理分布式系统的用户能够通过通用文件系统 (CFS) 共享资源和信息。它是一个作为操作系统一部分运行的文件系统。它的配置是一组通过局域网连接的工作站和大型机。DFS 中创建命名空间的过程对客户端是透明的。 DFS 在其服务中有两个组件,它们如下:
本地透明性它通过命名空间组件实现。 冗余它通过文件复制组件实现。 在发生故障或负载过重的情况下,这些组件协同工作,通过允许将多个位置的数据逻辑地组合在一个称为“DFS 根”的文件夹下,来提高数据可用性。 不一定需要同时使用两个 DFS 组件;命名空间组件可以在没有文件复制组件的情况下使用,文件复制组件也可以在没有命名空间组件的情况下在服务器之间使用。 特点DFS 有各种特性。其中一些如下: 透明度主要有四种类型的透明性。它们如下: 1. 结构透明性 客户端无需了解文件服务器和存储设备的数量或位置。在结构透明性中,必须为多个文件服务器提供可适应性、可靠性和性能。 2. 命名透明性 文件名中不应有文件位置的提示。当文件从一个节点传输到另一个节点时,文件名不应更改。 3. 访问透明性 本地和远程文件必须以相同的方式访问。文件系统必须自动定位被访问的文件并将其传递给客户端。 4. 复制透明性 当文件复制到多个节点时,复制的文件及其位置必须对一个节点隐藏,而对另一个节点不可见。 可扩展性随着网络中添加的机器越来越多,或者两个网络连接在一起,分布式系统不可避免地会随时间而增长。一个好的 DFS 必须能够随着系统节点和用户数量的增加而快速扩展。 数据完整性通常有许多用户共享一个文件系统。文件系统需要保护传输文件中数据的完整性。并发控制方法必须正确同步多个用户对同一文件的访问请求。文件系统通常为用户提供原子事务,这是用于数据完整性的高级并发管理系统。 高可靠性在有效的 DFS 中,必须尽可能限制数据丢失的风险。由于系统的不可靠性,用户不应被迫备份他们的文件。相反,文件系统应该备份关键文件,以便在原始文件丢失时可以恢复它们。作为一种高可靠性策略,许多文件系统使用稳定存储。 高可用性DFS 应该能够在部分故障的情况下运行,例如节点故障、存储设备崩溃和链路故障。 易用性在多道程序设计中,文件系统的用户界面必须简单,并且文件中的命令必须最少。 性能说服客户端的平均时间用于评估性能。它必须与集中式文件系统的性能相似。 分布式文件系统复制DFS 的早期版本使用Microsoft 的文件复制服务 (FRS),它支持服务器之间的基本文件复制。FRS 检测新文件或已更改的文件,并将整个文件的最新版本分发给所有服务器。 Windows Server 2003 R2 开发了“DFS 复制” (DFSR)。它通过仅复制已更改的文件部分来增强 FRS,并通过数据压缩减少网络流量。它还使用灵活的配置选项使用户能够按可配置的时间表控制网络流量。 分布式文件系统历史 DFS 的服务器组件最初是作为一个附加功能引入的。当它被集成到Windows NT 4.0 Server 时,它被称为“DFS 4.1”。后来,它被声明为所有Windows 2000 Server 版本中的标准组件。Windows NT 4.0 及更高版本的 Windows 具有客户端支持。 Linux 内核 2.6.14 及更高版本包含一个名为“cifs”的 DFS 兼容 SMB 客户端 VFS。DFS 在Mac OS X 10.7 (Lion) 及更高版本中可用。 分布式文件系统的工作原理DFS 有两种实现方式,它们如下:
独立 DFS 命名空间它不使用 Active Directory,并且只允许存在于本地系统上的 DFS 根。独立 DFS 只能在创建它的系统上获得。它提供无故障解放,并且不能与其他 DFS 链接。 基于域的 DFS 命名空间它将 DFS 配置存储在 Active Directory 中,并在domainname>dfsroot> 或 FQDN>dfsroot> 创建命名空间根。 DFS 命名空间传统文件共享使用 SMB 路由,这些共享链接到单个服务器。 \\<SERVER>\<path>\<subpath> 基于域的 DFS 文件共享路径通过在整个表单中使用域名称作为服务器名称来标识。 \\<DOMAIN.NAME>\<dfsroot>\<path> 当用户访问此类共享时,无论是直接访问还是通过映射磁盘,他们的计算机都会根据网络管理员定义的规则连接到与该共享关联的可访问服务器之一。例如,默认行为是用户访问离他们最近的服务器;但是,这可以更改为优先选择某个服务器。 分布式文件系统的应用分布式文件系统有多种应用。其中一些如下: HadoopHadoop 是一系列开源软件服务。它是一个软件框架,使用 MapReduce 编程风格来实现海量数据的分布式存储和管理。Hadoop 由称为Hadoop 分布式文件系统 (HDFS) 的存储组件组成。它是基于 MapReduce 编程模型的运行组件。 NFS (网络文件系统)客户端-服务器架构允许计算机用户远程存储、更新和查看文件。它是网络附加存储的各种 DFS 标准之一。 SMB (服务器消息块)IBM 开发了 SMB 协议用于文件共享。它被开发用于允许系统在局域网上传输文件到远程主机进行读写。SMB 可以访问远程主机的目录,这些目录被称为“共享”。 NetWare它是一个由 Novell, Inc. 开发的被废弃的计算机网络操作系统。主要使用的 IPX 网络协议结合了多任务处理,以便在计算机系统上执行多种服务。 CIFS (通用互联网文件系统)CIFS 是 SMB 的一种变体。CIFS 协议是 Microsoft 设计的 SIMB 协议的实现。 分布式文件系统的优缺点分布式文件系统有各种优点和缺点。它们如下: 优点分布式文件系统有各种优点。其中一些优点如下:
缺点分布式文件系统有各种缺点。其中一些缺点如下:
下一主题洋葱操作系统 |
我们请求您订阅我们的新闻通讯以获取最新更新。