Date: 5月 25, 2022
高可用性、RTO 和 RPO
高可用性 (HA) 是一个信息技术术语,指的是在超过 99.99% 的时间内可运行且可用的计算机软件或组件。 应用程序或系统的最终用户每年的服务中断时间少于 52.5 分钟。 这种可用性级别通常是通过使用高可用性集群来实现的,这种配置通过使用冗余服务器、网络、存储和软件消除单点故障来减少应用程序停机时间。
什么是恢复时间目标( RTO ) 和恢复点目标 ( RPO )?
除了 99.99% 的可用时间,高可用性环境还满足严格的恢复时间和恢复点目标。 恢复时间目标( RTO ) 是从应用程序故障到恢复应用程序操作和可用性所用时间的度量。 这是衡量公司可以承受多长时间关闭该应用程序的指标。 恢复点目标( RPO ) 衡量在停机问题后应用程序可用性恢复时数据的最新程度。 它通常被描述为发生故障时可以容忍的最大数据丢失量。西欧高可用性集群提供了一个RPO零和一个RTO分钟。
什么是高可用性集群?
在高可用性集群中,重要的应用程序运行在一个主服务器节点上,该节点连接到一个或多个辅助节点以实现冗余。 集群软件,如西欧LifeKeeper,监控集群应用程序和依赖资源,以确保它们在活动节点上运行。 系统级监控是通过集群节点之间的间隔心跳来完成的。 如果主服务器出现故障,则在超过心跳超时时间间隔后,从服务器启动恢复。 对于应用程序级故障,集群软件检测到应用程序在活动节点上不可用。 然后,它将应用程序和相关资源在称为故障转移的过程中移动到辅助节点,在该过程中继续运行并满足严格的要求RTO s。
在传统的故障转移集群中,集群中的所有节点都连接到同一个共享存储,通常是一个存储区域网络( SAN )。 故障转移后,辅助节点被授予访问共享存储的权限,使其能够满足严格的RPO s。