网络研讨会:无需企业版即可在 AWS 上实现具有灾难恢复能力的 SQL Server
注册点播网络研讨会
您知道有几个因素会影响您的工作负载性能、成本和可用性吗?在云中运行 SQL Server 工作负载时,没有一种放之四海而皆准的方法,您可能不需要升级。加入本次会议,了解在优化 AWS 上的数据库性能的同时扩展您的 IT 预算资金的策略。
经许可转载自信息系统
SIOS SANless clusters High-availability Machine Learning monitoring
注册点播网络研讨会
您知道有几个因素会影响您的工作负载性能、成本和可用性吗?在云中运行 SQL Server 工作负载时,没有一种放之四海而皆准的方法,您可能不需要升级。加入本次会议,了解在优化 AWS 上的数据库性能的同时扩展您的 IT 预算资金的策略。
经许可转载自信息系统
维护是每个公司生命周期的一部分。 每个基础设施都在不断移动和变化,即使是那些正在走向生命终结的基础设施。 您的团队可能在您过去所做的事情上取得了很大的成功,但随着系统变得越来越复杂,您过去认为成功的事情可能需要更新。 以下是改善集群维护、最大化高可用性和最小化停机时间的十个问题。i
与计划外停机不同,这些是多个团队、系统和互连资源根本无法用于计划活动的窗口。 例如,一家公司需要每月进行系统合规性检查和安全检查。 在此期间,业务运营被检查员、审计员等关闭。
作为客户体验副总裁,我们与许多对某些事件和活动有限制日期的团队密切合作。 您的团队可能负责不止一组系统和服务器,并向具有关键应用程序和基础架构的多个团队报告。 了解哪些日子最适合团队可以帮助您避免分心、冲突和由于已知资源限制而浪费的时间。
关键基础设施通常包括许多与公司人员配置没有直接关系的其他供应商和供应商。 这些资源包括操作系统、安全和 HA 供应商和顾问,以及来自基础架构提供商和其他合作伙伴的架构师。 提前了解哪些日子最好或包含在您的支持层中对于正确安排和人员配备至关重要。
随着全球团队的增加,为所有这些资源找到合适的时间是另一个需要回答的重要问题。 EST、IST、EMEA 和其他地区的资源最佳时间是什么时候?
超越对应用程序的简单维护,考虑包括它运行的整个环境。 最近,一位计划升级其应用程序的客户决定同时升级其操作系统。 不幸的是,这种范围上的微小变化带来了比预期更大的后果。 他们的应用程序不支持新升级的操作系统,问题接踵而至。 确保明确定义维护窗口的范围,并详细说明该范围的结果。 仅仅说环境有效是不够的。 尽可能详细说明预期版本、行为和可衡量的结果。 查看有关 IT 弹性的更多信息。
理想情况下,我们都希望有所有时间来执行维护,但客户遍布世界各地意味着对计划停机时间的容忍度很小——即使是关键任务。 当您计划维护时,预计停机时间有多长? 你真的能满足最大允许窗口吗? 如果不是,那么您将需要重新计划维护事件。
虽然我们希望没有任何问题,但我们应该意识到我们正在处理软件、复杂的环境和配置,以及由许多团队处理的许多移动部分。 回滚计划——即将系统恢复到维护前的版本和设置的方法——是必不可少的。 确保如果出现问题,您有回滚计划,例如完整备份或机器映像。 查看有关灾难恢复的更多信息。
作为客户体验副总裁,我们的团队参与了一项维护活动,由于关键团队成员失踪,该活动遇到了无法预料的延误。 在制定计划和架构时,请务必确定团队成员以及所需的 IT 角色和职责。 正如高级支持工程师 Greg Tucker 提醒客户的那样,HA 涉及环境的每一层,包括存储、网络、计算、操作系统、安全、策略等。
成功是美好的,但它也会让你沾沾自喜或自得其乐。 经过多年的成功,您的过程可能不再被详细记录或被积极遵循。 回答这些问题可以确保您的团队继续取得成功。
感谢您继续测试维护步骤。 确保将在测试环境中解决的问题正确添加到生产维护计划中。 SIOS 客户成功团队已经看到客户执行 QA 测试、发现错误假设并进行必要的更正,但未能将这些更正放入他们的生产清单中。
现在您已经查看了计划、时间安排、团队、角色和架构,最后一个问题仍然存在:缺少谁或缺少什么? 作为最后一步,查看您的计划并提出以下问题:“我们的计划中缺少谁?” 另外,考虑问“我们的计划中缺少什么?” 作为客户体验副总裁,我与我们的团队一起审查了无数客户的活动计划。 最令人难忘的维护计划审查之一揭示了回滚计划中的一系列步骤,其中包括从克隆图像和备份数据恢复服务器。 但是,映像克隆和数据备份步骤并未包含在任务列表中。 他们被忽视了,并被认为是在流程的早期完成的。
系统维护是维护计算机系统的关键和必要部分。 维护可以是纠正错误、引入新的软件功能或使系统适应新的用例。 当所讨论的系统是对组织保持业务连续性至关重要的业务关键系统时,制定一个深思熟虑的计划是必不可少的。 考虑这十个问题和您自己的其他问题,以确保您的维护满足业务需求,而不会出现不必要的风险或延误。
立即联系 SIOS 获取高可用性和灾难恢复解决方案。
经 SIOS 许可转载
适用于 Linux 的 SIOS LifeKeeper 的 HANA 应用程序恢复套件 (ARK) 提供 HANA 特定的智能以及手动配置和管理任务的自动化,从而节省时间并消除人为错误的风险。 SIOS LifeKeeper 在配置期间自动验证用户输入,并自动执行监控、故障转移和复制管理,以提供符合 SAP 最佳实践的可靠故障转移。
经许可转载自信息系统
代表创建新的 SIOS 工程团队HANA 多目标SIOS LifeKeeper for Linux v. 中的功能 9.7.0,我们为我们的成就感到自豪和兴奋。 在我们开始实施之前,一个经验丰富的软件开发团队花了几个月的时间进行规划。 我们研究了许多客户用例、技术要求和不可能的相互依赖列表,以创建既独特又强大的功能。
HANA 集群环境本质上是复杂的。 这就是为什么想要使用竞争集群软件将第三个节点添加到他们的 HANA 集群的客户必须使用一些非常复杂的脚本,并在发生故障转移或故障恢复时继续编写对集群的任何更改的脚本。 对于这些产品,发生故障转移后,您必须执行大量手动验证步骤以确保可以执行接管。 与那些产品不同,LifeKeeper 9.7.0 可以访问有关集群中所有 HANA 节点的详细信息,从而使其成为一个更加稳定和可靠的 HA 环境。 例如,它可以确定哪些节点可用并能够进行接管,还可以查看发生故障转移后是否有数据丢失。 这非常重要,尤其是在多个节点发生故障时。
在多节点环境中可靠地管理故障转移和复制的复杂性随着每个节点的增加呈指数级增长。 例如,集群软件将如何选择故障转移到哪个节点? 数据存储在三个几乎相同的位置,哪个存储位置最新且最准确? 您如何防止不同节点上的数据出现分歧的“裂脑”场景? 如果两个节点发生故障,故障转移和复制步骤应该是什么? 三? 我们面临着思考故障场景的各种组合并确保 SIOS 在每个场景中维护数据保护和可靠故障转移的挑战。
救生员比竞争产品更深入地监控环境,并且对管理故障转移有严格的要求。 新的 9.7.0 版本的 LifeKeeper 增强了跟踪 HSR 层次结构的能力,并管理复杂的三节点和四节点 HSR 集群的故障转移,以确保它们快速且高度可靠。
我们着手为 HANA 创建业界最自动化和最可靠的多目标集群环境,我相信我们成功了。
我们相信新的 LifeKeeper HANA Multitarget 会改变游戏规则,为客户提供业内最自动化、最可靠的故障转移集群解决方案。观看演示的新功能以查看其功能。
联系 SIOS今天了解有关 LifeKeeper 的 HANA 多目标功能的更多信息。
经许可转载自信息系统
在当今“永远在线”的世界中,技术在组织的效率和竞争力方面发挥着至关重要的作用。 一些应用程序被归类为“关键任务”,表明它们对组织的核心运营至关重要。 这些应用程序需要高可靠性和可用性,因为任何停机或故障都会产生重大后果。 此外,日常业务运营中使用的日常应用程序对于组织的成功至关重要。 因此,保证高可用性所有关键应用程序的可靠性至关重要。 在这篇博客中,我们将深入探讨为什么始终在线的应用程序在当今快节奏和竞争激烈的商业环境中至关重要。 此外,我们将探索组织可以做些什么来确保他们的应用程序具有高可用性和可靠性。
首先,客户和员工希望应用程序能够从任何设备和任何位置全天候 24/7 可用。 在当今的数字时代,应用程序停机或性能低下会导致收入损失、声誉受损,甚至客户流失。 例如,考虑一个电子商务网站在关键销售期间遇到停机。 客户可能会变得沮丧并放弃他们的购物车,从而导致收入损失并可能损害公司的声誉。 同样,如果员工无法访问基本应用程序,他们可能无法完成工作,从而导致生产力下降并可能影响组织的整体成功。
此外,随着越来越多的组织将其运营转移到云端,确保应用程序的可用性和可靠性变得更加重要。 在云环境中,诸如 ERP 之类的复杂系统可能跨多个服务器、数据中心甚至地理区域运行。 这种复杂性使快速识别和解决问题变得更具挑战性,因此组织必须拥有强大的监控和警报系统,以确保他们能够迅速响应出现的任何问题。
那么,组织可以做些什么来确保他们的应用程序始终在线? 一种方法是实施稳健的灾难恢复包括冗余系统和故障转移机制的计划。 这种方法有助于确保如果一个组件出现故障,另一个组件可以无缝接管,而不会导致停机或中断。 组织还必须投资于必要的基础架构和工具,以持续监控其应用程序并在问题变得严重之前主动解决任何问题。
此外,组织可以利用自动化等技术来提高其应用程序的可用性和可靠性。 例如,自动化日常任务有助于降低人为错误的风险,并在问题变得严重之前快速解决问题。
无论它们是否是关键任务,确保应用程序可用且可靠以保持生产力、效率和客户满意度至关重要。 组织需要投资于必要的基础架构、工具和流程,以确保其应用程序具有高可用性和可靠性。 他们还应该准备好迅速采取行动,以应对可能出现的任何问题。 最终,始终在线的应用程序方法是组织在当今快节奏和竞争激烈的商业环境中取得成功的关键因素。
经许可转载自信息系统