云计算中的服务级别协议2025年3月17日 | 阅读 7 分钟 服务级别协议 (SLA) 是云服务提供商与客户之间就性能达成的协议。早期,在云计算领域,所有服务级别协议都是在客户和服务使用者之间协商的。随着云计算提供商等大型公用事业的出现,大多数服务级别协议都趋于标准化,直到客户成为云计算服务的大量使用者。服务级别协议也分为不同级别,如下所述。
某些服务级别协议可作为合同强制执行,但大多数协议或合同更类似于操作级别协议 (OLA),并且可能不受法律约束。在与云服务提供商达成任何重大协议之前,请律师审查文件是可以的。服务级别协议通常指定某些参数,如下所述:
如果云服务提供商未能达到规定的最低目标,则提供商将根据协议向云服务使用者支付罚款。因此,服务级别协议就像保险单,如果在发生事故时,公司必须按照协议支付。 微软发布了与 Windows Azure 平台组件相关的服务级别协议,这展示了云服务供应商的行业实践。每个组件都有自己的服务级别合同。以下描述了两个主要的 SLA: Windows Azure SLA -Windows Azure 为计算和存储提供了单独的 SLA。对于计算,保证当客户将两个或更多个角色实例部署到不同的故障和升级域时,客户面向 Internet 的角色的外部连接将至少有 99.95% 的时间可用。此外,所有客户角色实例都受到监控,并保证有 99.9% 的时间能够检测到角色实例进程是否未运行并已正确启动。 SQL Azure SLA -SQL Azure 客户将拥有 SQL Azure 数据库与 Internet 网关之间的连接。SQL Azure 将在每月内保持 99.9% 的“月度可用性”。特定租户数据库的月度可用性比率是数据库可供客户使用的时间与一个月总时间的比率。 时间以 30 天的月度周期以几分钟为间隔进行衡量。如果 SQL Azure 网关拒绝连接到客户数据库的尝试,则部分时间将视为不可用。可用性将始终按整月计算。 服务级别协议基于使用模型。通常,云提供商会以溢价收取其按使用付费资源的费用,并仅为此目的执行标准服务级别合同。客户还可以订阅不同的层级,以保证访问特定数量的已购资源。 订阅相关的服务级别协议 (SLA) 通常提供不同的条款和条件。如果客户需要访问特定级别的资源,则需要订阅服务。使用模型可能无法在高峰负载条件下提供该级别的访问权限。 云基础设施可以跨越地理、网络以及物理和虚拟系统。虽然云 SLA 的确切指标可能因服务提供商而异,但涵盖的区域是相同的。
SLA 文档的目的是建立对服务、优先领域、责任、保证和条款的共同理解。它清楚地概述了云配置中涉及方之间的指标和责任,例如报告或处理系统故障的响应时间具体数量。 云 SLA 的重要性随着越来越多的组织依赖外部提供商来处理关键系统、应用程序和数据,服务级别协议变得至关重要。云 SLA 确保云提供商满足某些企业级要求,并为客户提供一套明确界定的可交付成果。它还描述了财务处罚,例如在提供商未能满足保证条件时提供的服务时间抵扣。 云 SLA 的作用与任何合同的作用基本相同——它是一个指导客户与提供商之间关系的蓝图。这些商定的条款构成了客户承诺使用云提供商服务的可靠基础。它们也反映了提供商在服务质量 (QoS) 和底层基础设施方面的承诺。 云 SLA 中需要注意的事项云 SLA 应概述各方的责任、可接受的性能参数、协议涵盖的应用程序和服务描述、服务级别监控程序以及中断的补救计划。SLA 通常使用技术定义来衡量服务级别,例如平均故障间隔时间 (MTBF) 或平均修复时间 (MTTR),这些定义指定了服务级别性能的目标或最低值。 定义的服务级别必须具体且可衡量,以便进行基准测试,并且在合同规定时,相应地触发奖励或处罚。 ![]() 根据您选择的云模型,您可以控制 IT 资产和服务的管理,或者让云提供商为您管理。 典型的计算和云 SLA 规定了用户在提供商未能提供服务时应享有的确切服务级别以及补救或补偿。另一个重要领域是服务可用性,它规定了读取请求可以采取的最大时间、允许的重试次数以及其他因素。 如果未满足规范,云 SLA 还应为用户定义补偿。云服务提供商通常提供分级服务抵扣计划,根据 SLA 规范与实际服务层级之间的差异,为用户提供抵扣。 选择和监控云 SLA 指标大多数云提供商公开提供用户可以期望的服务级别的详细信息,并且这些级别对所有用户来说很可能相同。但是,选择云服务的企业可能会协商更定制化的交易。例如,云存储服务的云 SLA 可能包含关于保留策略、要维护的副本数量和存储空间的独特规格。 云服务级别协议可以更详细地涵盖治理、安全规范、合规性以及性能和正常运行时间统计数据。它们应涵盖数据安全和数据隐私的安全和加密实践、灾难恢复预期、数据位置以及数据访问和可移植性。 验证云服务级别客户可以通过云提供商的原生工具或门户监控正常运行时间、性能、安全性等服务指标。另一种选择是使用第三方工具来跟踪云服务的性能基线,包括资源如何分配(例如,虚拟机或 VM 中的内存)以及安全性。 云 SLA 必须使用清晰的语言来定义条款。例如,此类语言会控制服务不可用以及谁负责——缓慢或间歇性的加载可能归因于公共互联网的延迟,这超出了云提供商的控制范围。提供商通常会指定并免除因计划维护时段(通常但不总是定期安排和重复发生)而导致的任何停机时间。 协商云 SLA大多数常见的云服务都很简单且通用,略有不同,例如基础设施 (IaaS) 选项。准备好为通过云交付的任何定制服务或应用程序进行协商。在数据保留标准或定价和补偿/罚款等特定自定义领域,可能有更多的协商空间。谈判能力通常随客户规模而变化,但可能有更多有利条款的空间。 在进行任何云 SLA 谈判时,明确正常运行时间对于保护业务至关重要。良好的 SLA 可以保护客户和供应商免受期望落空的影响。例如,99.9% 的正常运行时间(“三九”)是一种常见的标准,意味着每年有九小时的停机时间;99.9999%(“五九”)意味着每年的停机时间约为五分钟。某些任务关键型数据可能需要高可用性级别,例如每年几分之一秒的停机时间。考虑几个区域或领域,以帮助减少重大中断的影响。 请记住,云 SLA 谈判的某些领域存在不必要的保险。某些用例需要最高的正常运行时间保证,需要额外的工程工作和成本,并且可能更适合使用私有的本地基础设施。 请注意给定云提供商的数据存储位置。许多合规法规,如 HIPAA(健康保险流通与责任法案),要求数据存储在特定区域,并附带特定的隐私指南。云客户拥有并负责这些数据,因此请确保将这些要求构建到 SLA 中并通过审计和报告进行验证。 最后,云 SLA 应包括一个退出策略,概述提供商的期望,以确保平稳过渡。 扩展云 SLA大多数 SLA 都是为了满足客户的当前需求而协商的,但许多企业会随着时间的推移而大幅改变规模。稳健的云服务级别协议概述了合同审查和潜在调整的差距,以满足组织不断变化的需求。 一些供应商构建了通知工作流,当云服务级别协议即将被违反时触发,以便根据规模变化启动新的谈判。这种正常运行时间可以涵盖超出可用性级别或正常值的用法,并且可能需要升级到新的服务级别。 下一主题云中的 XaaS |
我们请求您订阅我们的新闻通讯以获取最新更新。