云计算中的容错性2024 年 8 月 28 日 | 3 分钟阅读 云计算中的容错意味着创建一个持续工作的蓝图,即使某些部分出现故障或不可用。 它可以帮助企业评估其基础设施的需求和要求,并在相应的设备因某种原因变得不可用时提供服务。 这并不意味着替代系统可以提供 100% 的完整服务。 尽管如此,这个概念是为了保持系统可用,最重要的是,在合理的水平上保持运行模式。 如果企业以持续模式继续增长并提高其生产力水平,这一点很重要。 云计算系统中容错背后的主要概念- 复制:容错系统通过为每个服务运行多个副本来工作。 因此,如果系统的某个部分出现问题,可以使用其他实例来保持其运行。 例如,采用一个数据库集群,它有 3 台服务器,每台服务器上都有相同的信息。 所有操作(如数据录入、更新和删除)都写入到每台服务器。 冗余服务器将保持空闲状态,直到容错系统需要它们的可用性。
- 冗余:当系统部件发生故障或进入停止状态时,拥有备份类型系统非常重要。 该服务器使用包含许多冗余服务的紧急数据库。 例如,由于某些硬件故障,具有 MS SQL 作为其数据库的网站程序可能会在中间失败。 然后,当原始数据库处于离线模式时,冗余概念必须利用新的数据库。
云计算中的容错技术- 在设计容错系统时,应优先考虑所有服务。 应特别优先考虑数据库,因为它为许多其他实体提供支持。
- 在设置优先级后,企业必须进行模拟测试。 例如,企业有一个论坛网站,允许用户登录并发表评论。 当身份验证服务由于问题而失败时,用户将无法登录。
然后,论坛变为只读,并且没有达到目的。 但是,通过容错系统,将确保修复,并且用户可以以最小的影响搜索信息。 云计算中容错的主要属性- 无单点故障:冗余和复制的概念定义了容错可能会发生,但会产生一些微小的影响。 如果没有单点故障,则该系统不是容错的。
- 接受故障隔离概念:故障发生与其它系统分开处理。 它有助于将企业与现有的系统故障隔离。
云计算中容错的存在- 系统故障:这可能是软件或硬件问题。 软件故障会导致系统崩溃或挂起,这可能是由于堆栈溢出或其他原因造成的。 对物理硬件机器的任何不当维护都将导致硬件系统故障。
- 安全漏洞事件:由于安全故障,可能会出现容错的多种原因。 服务器的黑客攻击会损害服务器并导致数据泄露。 需要以安全漏洞的形式进行容错的其他原因包括勒索软件、网络钓鱼、病毒攻击等。
要点云计算中的容错是一个至关重要的概念,必须提前理解。 当发生数据泄露或系统网络故障,导致完全混乱和缺乏准备时,企业会措手不及。 建议所有企业都积极处理容错问题。 如果一个企业即使在发生某些故障时也处于增长模式,则必须进行容错系统设计。 任何约束都不应影响企业的增长,尤其是在使用云平台时。
|