白皮书:多云架构解释——用例、风险和最佳实践
在过去十年中,云计算已成为计算部署的主要平台。 AWS 和微软都声称,财富 500 强中的大部分都在使用他们的服务,而谷歌和甲骨文也有引人注目的云产品。 这导致许多组织,无论是有意还是无意,让工作负载在多个云中运行。 了解 Multicloud、其用例、风险和维护的最佳实践高可用性.
经授权转载西欧
SIOS SANless clusters High-availability Machine Learning monitoring
在过去十年中,云计算已成为计算部署的主要平台。 AWS 和微软都声称,财富 500 强中的大部分都在使用他们的服务,而谷歌和甲骨文也有引人注目的云产品。 这导致许多组织,无论是有意还是无意,让工作负载在多个云中运行。 了解 Multicloud、其用例、风险和维护的最佳实践高可用性.
经授权转载西欧
在这篇博客中,我将讨论通用负载平衡器应用程序恢复套件 (ARK)适用于 Linux 的 SIOS Lifekeeper,特别是如何在 Microsoft Azure 上配置它。 我将使用一个两节点 NFS 集群,它们提供的 NFS 导出最终将通过负载平衡器访问。
SIOS 创建了这个 ARK 以促进在 Azure 中运行的 LifeKeeper 集群中的客户端重定向。
由于 Azure 不支持免费 ARP,因此客户端无法直接连接到传统的集群虚拟 IP 地址。 相反,客户端必须连接到负载均衡器,负载均衡器将流量重定向到活动集群节点。 . Azure 实现了在第 4 层(TCP、UDP)上运行的负载均衡器解决方案,负载均衡器可以配置为具有私有或公共前端 IP,可以确定哪个节点处于活动状态的运行状况探测器,一系列后端 IP 地址(对于集群中的每个节点)和传入/传出网络流量规则。
传统上,健康探测将监视应用程序上的活动端口并确定该应用程序在哪个节点上处于活动状态。SIOS 通用负载平衡器 ARK 配置为让活动节点侦听用户定义的端口。 然后在 Azure 负载均衡器中将此端口配置为运行状况探测端口。 这允许活动集群节点响应 TCP 健康检查探测,从而启用自动客户端重定向。
在 Azure 门户中,选择负载平衡创建一个负载均衡器,您将选择要部署它的资源组以及名称,我喜欢使用与我使用负载均衡器的集群类型一致的名称,例如 IMA -NFS-LB 将位于两个 IMA-NFS 节点的前面。
您可以确定这是公共 LB 还是私有 LB。 在这种情况下,我将一个私有负载平衡器配置到我的 NFS 服务器前面,以便仅在此资源组中使用。
一旦您确定了名称、资源组等,您将被要求为负载均衡器分配名称、虚拟网络、子网和 IP。 IP 地址应该与您将在 LifeKeeper 中创建为虚拟 IP 地址的 IP 地址相同。
为负载均衡器输入基本信息后,您需要定义要在后端配置哪些机器来为负载均衡器提供服务,在我的情况下,这个后端池将由我使用的两个节点组成我的 NFS 服务器。
您将需要一个负载平衡规则,这是负载平衡器确定将哪些流量路由到活动节点的方式。 – 当您配置通用应用程序以支持负载平衡器时,此处配置的端口号将在 SPS-L 中使用。 在此示例中,我们使用“HA 端口”,它将所有流量路由到活动节点。 如果您想限制要路由的流量,您可以指定特定的应用程序端口。
前端 IP 应该是负载均衡器 IP,后端池应该是您配置为负载均衡器使用的资源的节点。 确保选中“HA Ports”按钮并启用“Floated IP”。 可以禁用“TCP 重置”。
创建运行状况探测时,请确保记下您在此处配置的端口,因为我们在 SIOS 保护套件中创建通用应用程序时将使用该端口。 您可以使用“间隔”和“不健康阈值”的标准值。 如果您有应用程序特定的要求,这些可以在以后更改。
现在负载平衡规则应该是完整的,带有一个运行状况探测。 选择“添加”一旦我们选择“添加”,Azure 将开始部署负载均衡器,这可能需要几分钟,一旦完成,配置就会转到 SIOS 保护套件。
注意:一旦后端机器在负载均衡器后面配置,它们将失去对互联网网关的访问权限,因此系统更新等操作将无法正常工作。 您可以从后端资源组中删除机器以再次允许 Internet 访问。
在本博客中,我配置了三个 NFS 导出以使用 SPS-L 进行保护,这三个导出配置为使用与 Azure 负载均衡器的前端 IP 相同的 IP。 我正在使用 Datakeeper 复制存储在导出中的数据。
第一步是获取脚本,最简单的方法是使用 wget,但您也可以下载整个包并使用 winscp 或类似工具将 rpm 直接上传到节点。 您需要在 Lifekeeper 集群的所有节点上安装 Hotfix。
完整的恢复套件可在此处获得: http://ftp.us.sios.com/pickup/LifeKeeper_Linux_Core_en_9.5.1/patches/Gen-LB-PL-7172-9.5.1可以使用 wget 在这里找到这些部件: wget http://ftp.us.sios.com/pickup/Gen-LB-PL-7172-9.5.1/steeleye-lkHOTFIX-Gen-LB-PL-7172-9.5.1-7154.x86_64.rpm wget http://ftp.us.sios.com/pickup/Gen-LB-PL-7172-9.5.1/steeleye-lkHOTFIX-Gen-LB-PL-7172-9.5.1-7154.x86_64.rpm.md5sum wget http://ftp.us.sios.com/pickup/Gen-LB-PL-7172-9.5.1/Gen-LB-readme.txt下载后,根据 FTP 站点上记录的值验证 MD5 总和。
按如下方式安装 RPM: rpm -ivh steeleye-lkHOTFIX-Gen-LB-PL-7172-9.5.1-7154.x86_64.rpm 通过运行检查安装是否成功: rpm -qa | grep steeleye-lkHOTFIX-Gen-LB-PL-7172 如果您出于某种原因需要删除 RPM,可以通过运行: rpm -e steeleye-lkHOTFIX-Gen-LB-PL-7172-9.5.1-7154 来完成.x86_64下面是显示我已经配置的三个 NFS 导出的 GUI:我们需要在 SIOS 保护套件中做的是使用 SIOS 提供的修补程序脚本定义负载平衡器。
首先我们创建一个新的资源层次结构,我们从下拉列表中选择 Generic Application定义位于 /opt/Lifekeeper/SIOS_Hotfixes/Gen-LB-PL-7172/ 中的 restore.pl 脚本定义位于 /opt/Lifekeeper/SIOS_Hotfixes/Gen-LB-PL-7172/ 中的 remove.pl 脚本定义位于 /opt/Lifekeeper/SIOS_Hotfixes/Gen-LB-PL-7172/ 中的 quickCheck 脚本没有本地恢复脚本,因此请确保清除此输入当询问应用程序信息时,我们希望输入与在 Health Probe 配置中配置的端口号相同的端口号,例如 54321我们将选择在服务创建后将其投入使用。
资源标签是我们将在 SPS-L GUI 中看到的名称,我喜欢使用易于识别的名称。
如果一切配置正确,您将看到“结束成功还原”,然后我们可以将其扩展到另一个节点,以便资源可以托管在任一节点上。
这显示了扩展至两个节点后完成的负载均衡器配置。
该集群的最后一步是为三个 NFS 导出创建子依赖项,这意味着所有带有 Datakeeper 镜像和 IP 的 NFS 导出都将依赖于负载均衡器。 如果活动节点上出现严重问题,则所有这些资源都将故障转移到其他正常运行的节点。
上图是 Lifekeeper GUI 中完整的层次结构。 下面显示了扩展的 GUI 视图,显示 NFS 导出、IP、文件系统和 DataKeeper 复制卷作为负载均衡器资源的子项。
这只是您如何使用 SIOS LifeKeeper 的一个示例天蓝色保护一个简单的 NFS 集群。 同样的概念适用于您需要保护的任何关键业务应用程序。 您只需利用 SIOS 提供的负载均衡器 ARK 来允许 Azure 负载均衡器(内部或外部)确定当前托管应用程序的节点。
SIOS SAN 和 SANless 集群软件为您的应用程序和数据提供全面的 SAP 认证保护,包括高可用性,数据复制, 和灾难恢复在一个简单、经济高效的解决方案中。
SIOS 软件可让您在物理、虚拟、云(公共、私有和混合)和高性能闪存存储环境的任何配置(或组合)中保护 SAP 和 HANA。 SIOS 软件提供简单灵活的配置、快速复制以及对整个 SAP 应用环境的全面监控和保护。
SAN 和 SANless 集群 您可以使用 SIOS LifeKeeper 软件构建传统的基于 SAN 的集群,或者通过使用 SIOS 实时块级复制将活动 SAP 服务器上的本地存储与备用服务器上的本地存储同步来构建 SIOS SANless 集群。 复制可以在同步或异步模式下运行。
与仅检查服务器是否处于活动状态的传统集群软件不同,SIOS LifeKeeper 软件监控整个 SAP 环境的运行状况并提供应用程序感知的高可用性,以确保最长的正常运行时间。 SIOS 软件验证 SAP 正在运行、文件共享或 NFS 导出是否可用、数据库已安装且可用,以及客户端是否能够连接。 SIOS 软件主动监控:服务器、操作系统、SAP Primary Application Server (PAS) Instance、ABAP SAP Central Service (ASCS) Instance、后端数据库(Oracle、DB2、MaxDB、MySQL 和 PostgreSQL)、SAP Central Services Instance( SCS)、卷或文件系统、文件共享或 NFS 挂载、IP 和虚拟 IP、排队和消息服务器以及逻辑卷 (LVM)。
如果活动服务器发生故障,SIOS 软件会将 SAP 操作转移到备用服务器。 SIOS 软件允许您通过 LAN 或 WAN 配置本地或远程的备用服务器。 实时复制可确保从本地系统故障中立即恢复,并允许您通过一对多复制创建多个实时副本。
SIOS 集群还可以在本地以及同一站点或另一个地理位置的另一台集群服务器上停止和重新启动应用程序。 当 SIOS 软件检测到问题时,它会自动启动三个可配置的恢复操作之一,以最大限度地延长正常运行时间并保护应用程序和数据:它可能会尝试在同一台服务器上重新启动;切换到备用服务器;或提醒系统管理员。 它可以快速轻松地执行本地恢复或完全故障转移。
SIOS 软件允许管理员将 SAP 移动到 DR 站点进行测试,并在测试完成后将其移回主站点,从而简化了 DR 测试。 它还允许您在完成 DR 测试的同时,通过解锁目标数据,让 SAP 在备份系统上投入使用以验证恢复,从而在不影响生产网络的情况下,让 SAP 在主站点中继续运行。
• 通过高可用性集群、连续数据复制和灾难恢复功能保护您的整个 SAP 堆栈 • 使用现有服务器和存储启用单站点和多站点集群 • 支持在 Red Hat Enterprise Linux 上运行的 SAP 服务器的 JAVA 和 ABAP 版本, SUSE Linux Enterprise Server 或 Windows,可容纳范围广泛的存储架构。
• 直观、向导驱动的 GUI 简化了安装、配置和管理 • 支持物理、虚拟或云环境以及各种存储架构
• 降低云环境中的数据传输成本 • 高效的复制引擎将网络流量降至最低——无需硬件加速器或压缩设备。 • 通过使用直观的管理控制台自动执行数据复制任务来节省人工成本 经许可复制西欧
SIOS技术使高可用性集群和复制软件,可确保关键应用程序、数据库和 BMS 系统自动从基础架构、网络和应用程序故障中恢复 – 保持您的数据受到保护、应用程序在线、满足法规要求以及用户高效工作。
SIOS 让您可以灵活地在物理服务器、虚拟化服务器和云中为 Windows 或 Linux 环境构建 SAN 和 SANless 集群。 您可以使用 SIOS 软件来实现高可用性或容灾。 轻松地将 Windows Server 故障转移集群迁移到云中而不会造成中断,或者轻松构建具有内置应用程序特定智能的 Linux 集群环境。 在云中,您可以跨可用区或区域配置集群以获得最大的 HA/DR 保护,或者创建混合云或多云配置来轻松满足可用性 SLA 和 RTO/RPO。
SIOS 数据保持器将 SIOS DataKeeper 添加到 Windows Server Failover Clustering 环境中,以创建传统共享存储集群不可能或不切实际的 SANless 集群,例如云和混合云环境。 快速、高效的基于主机的复制可同步所有集群节点上的本地存储,以实现最大的配置灵活性。 或者,将复制添加到现有的基于 SAN 的 Windows 群集以进行 DR。使用 SIOS DataKeeper Cluster Edition 软件在物理、虚拟或云环境中保护您的业务关键型 Windows 应用程序和 BMS 系统及其运行的数据库,包括 Microsoft SQL Server、Oracle。
|
SIOS 保护套件适用于 Linux 的 SIOS 保护套件可让您在本地或灵活、可扩展的云环境(例如 Amazon Web Services (AWS) 和 Microsoft Azure)中运行业务关键型 EHR 应用程序,而不会牺牲性能或 HA/DR 保护。 SIOS 集群可跨云区域或可用区进行独特的故障转移,以实现真正的 HA 保护。
|
BMS 系统受保护
|
受保护的环境和平台
|
受保护的数据库和 ERPSQL Server、SAP、SAP S/4HANA、甲骨文、SharePoint 学到更多
|
医疗保健案例研究Chris O'Brien Lifehouse 癌症治疗中心、Allyn 医院、Carroll 医院、领先的医疗保健提供商。 学到更多 |
经授权转载西欧
运行 SAP、S/4 HANA、SQL Server、MaxDB 和 Oracle 等业务关键型应用程序的企业面临两难境地。 即使是这些复杂工作负载的短暂停机时间也可能产生灾难性后果。 但传统的 HA 集群可能很复杂且成本高昂。 迁移到云端并不是答案云可用性 SLA仅涵盖硬件。 他们无法在不降低云中性能的情况下为有状态应用程序提供 HA 和 DR。 传统本地集群中使用的共享存储在某些云中不是一种选择,而在另一些云中过于复杂且成本高昂而无法实用。 许多 HA 集群解决方案无法对云区域和可用区进行故障转移——限制了它们可以提供的灾难恢复级别。 开源集群不是答案。 它需要复杂的脚本,并且容易出现人为错误和故障。 确保复杂的 ERP 或数据库故障转移所需的手动步骤可以正确离开。 IT 团队不愿执行定期维护和故障转移测试。
SIOS LifeKeeper 提供高可用性和灾难恢复这可确保系统、数据库和应用程序在需要时运行。
在云中,SIOS 集群跨区域和可用区发生故障,以获得最大的 DR 保护。 对于想要部署多个集群的客户,SIOS LIfeKeeper 的克隆功能允许您使用一致的预定义设置和集成的最佳实践来创建多个相同的集群。 SIOS LIfeKeeper 包含在一个名为 SIOS Protection Suite 的捆绑包中,其中包括特定于应用程序的恢复工具包和用于 SANless 集群和 DR 的高效复制。为在本地、云或混合云环境中运行的关键 Windows 或 Linux 工作负载获得 99.99% 的可用性和灾难保护。安排演示或注册您的免费试用今天。
经授权转载西欧