Date: 7월 3, 2023
SIOS HANA 다중 대상 자동화가 생각보다 큰 거래인 이유
Larry(가명)는 과거에 고가용성 및 재해 복구(HA/DR)를 위한 복제 솔루션을 배포한 SIOS 고객이었습니다. Linux용 2노드 복제 솔루션을 테스트하기 위해 PoC를 시작했을 때SIOS 라이프키퍼그리고 DataKeeper 복제, 그의 최우선 순위는 데이터 무결성 보호였습니다. Larry의 PoC 테스트 목록에는 데이터베이스 시작/중지, 데이터베이스를 백업 노드로 마이그레이션, 유지 관리 활동, 서버 장애 복구 등의 표준 항목이 포함되어 있습니다. Larry는 솔루션이 빠른 서버 전환(즉, 정상적인 마이그레이션)과장애 조치(즉, 갑작스럽고 강제적인 마이그레이션), 한 서버에서 다른 서버로 애플리케이션, 데이터베이스, 스토리지 및 서비스. 하지만 그런 행위가 데이터 유실을 일으키지 않도록 하겠다는 그의 의지는 더욱 강력했다.
스플릿 브레인을 방지하여 데이터 무결성 보호
이러한 표준 테스트 외에도 Larry는 특정 테스트를 추가하여 “스플릿 브레인” 시나리오. 스플릿 브레인은 클러스터의 구성원이 서로 통신할 수 없지만 실행 및 작동 가능한 상태에 있고 이후에 공통 리소스의 소유권을 동시에 가져오는 경우 발생하는 조건입니다. 사실상 운전대를 놓고 싸우는 두 명의 버스 운전사가 있습니다. 파괴적인 특성으로 인해 분할 브레인은 데이터 손실 또는 데이터 손상을 유발할 수 있으며 어떤 노드가 활성 상태로 남아 있어야 하고(버스 구동) 어떤 노드가 디스크에 쓰기를 중지해야 하는지 결정하는 메커니즘을 사용하여 피하는 것이 가장 좋습니다.
스플릿 브레인 시나리오는 쿼럼 및 쿼럼과 감시 기능을 사용하는 클러스터에서는 상대적으로 흔하지 않지만 스플릿 브레인 해결의 어려움은 클러스터 구성에 추가된 모든 노드와 함께 기하급수적으로 증가합니다. 3개 이상의 노드가 있는 다중 대상 구성에서 클러스터링 소프트웨어는 올바른 노드에 대한 장애 조치를 오케스트레이션해야 할 뿐만 아니라 새 기본 노드에서 3차 노드로 복제를 자동으로 전환하여 DR 보호를 유지하면서 사이에서 적절하게 중재해야 합니다. 노드. 다른 클러스터링 솔루션에서는 이러한 복잡한 작업을 수동으로 스크립팅하고 장애 조치 시 수동으로 업데이트해야 하며 다시 정상 작동을 복원해야 하며 분할 브레인이 발생할 때만 더 어려워집니다.
SIOS LifeKeeper의 기능 및 개선 사항으로 인해SAP HANA 애플리케이션 복구 키트(ARK), Larry는 스플릿 브레인 시나리오를 도입하는 데 어려움을 겪었습니다. 그러나 마침내 하나를 고안할 수 있게 되었을 때 그는 SIOS 제품이 자신의 데이터를 보호하는 데 사용하는 논리를 이해함으로써 큰 이점을 얻었습니다. Larry는 SIOS 클러스터링 소프트웨어가 제공하는 데이터 보호에 설계된 높은 수준의 정교함을 깨달았습니다. 그는 SIOS LifeKeeper를 선택했습니다.
SIOS HANA 다중 대상 자동화의 차이점
Larry와 같은 시나리오는 SIOS의 HANA 다중 대상 자동화가 생각보다 큰 9가지 이유 중 하나에 불과합니다. 다음은 모두 9가지입니다.
- 향상된 보호
SIOS의 솔루션은 다중 대상 시나리오에서 HANA 데이터베이스 리소스의 보호를 단순화합니다. 마법사 기반 옵션은 현재 구성을 빠르게 감지하고 LifeKeeper 구성에 정보를 정확하게 추가합니다. 오류 감지는 사용자가 문제를 해결하고 시간을 절약할 수 있도록 간결하고 유익합니다. - 간소화된 관리
Natalie(실명이 아님)는 HANA 다중 노드 구성을 담당했습니다. 서버에 장애가 발생하거나 유지 관리가 필요한 경우 Natalie는 다양한 스크립트와 도구를 활용하여 필요한 작업을 수행했습니다. 그러나 이것은 확장할 수 없었습니다. SIOS LifeKeeper로 이동한 후 Natalie와 팀은 HANA 및 HANA 시스템 복제 중지 및 다시 시작과 같은 모든 핵심 작업을 수행하는 간단한 UI를 가졌습니다. 또한 재해가 발생하면 팀은 최신 런북을 검색하거나 올바른 스크립트의 사본을 찾거나 새벽 2시에 Natalie에게 전화하는 대신 단순화된 단일 SIOS UI를 사용할 수 있습니다. . - 간소화된 모니터링
UI의 SIOS의 직관적인 상태 보고서는 팀이 다음을 결정하는 빠른 방법을 제공했습니다.복제상태. 단일 도구를 사용하면 모니터링 보드 모음과 직접 만든 스크립트를 사용하여 관리를 간소화하고 시간을 절약할 수 있습니다. - 자동 복구
일부 HANA HSR 솔루션은 이러한 두 노드 사이에서 HANA 복제의 장애 조치를 수행할 수 있습니다. 그러나 관리자는 시스템 장애 조치 후 복제를 다시 등록해야 하는 경우가 많습니다. 노드가 세 개 이상인 경우 관리자가 세 번째 또는 네 번째 노드에서 등록을 업데이트하는 방법을 이해할 수 있습니까? 동기와 비동기를 적절하게 사용하는 것을 기억할까요? 다중 대상 복제를 위해 3개 또는 4개의 노드를 처리할 수 있는 SIOS 솔루션은 실패 후 대상 노드 등록을 원활하게 자동화합니다. - 유연성과 확장성
2개, 3개 또는 4개의 노드 조합에서 HANA 클러스터를 보호할 수 있는 기능은 고객이 가용성과 재해 복구 수준을 유연하게 높일 수 있음을 의미합니다. 쿼럼이 있는 2노드 고객은 재해에 대한 가용성 보호를 제공하고 핸드셰이크 기능으로 HANA 인계를 활용하여 가동 중지 시간이 거의 없이 유지 관리 활동을 처리할 수 있습니다. 세 개의 노드를 배포하는 고객은 다른 데이터 센터 또는 지역에 비동기 복제가 포함된 세 번째 노드를 배포하여 추가 재해 복구 기능을 전화 접속할 수 있습니다. 추가 혜택을 위해 3노드 고객은 스토리지 쿼럼이 있는 4번째 노드를 배포하여 활성화할 수 있습니다.고가용성그리고재해 복구데이터 센터 전체가 손실된 경우. - 데이터 보호
래리의 문제로 돌아가 봅시다. 그는 노드 B와 C에 대한 다중 대상 복제를 사용하여 기본 노드 A에서 HANA를 실행하고 있었습니다. 수동 작업이 재난으로 끝나면 어떻게 됩니까? 어떤 노드가 기본이었습니까? 노드 A가 충돌했을 때 상황이 동기화되었습니까? 잘못된 노드를 가져오지 않으려면 어떻게 해야 합니까? 다중 대상 HSR 구성에서 3개 이상의 노드에 대한 지원을 추가하는 것 외에도 새로운 HANA ARK에는 재해 또는 불행한 스플릿 브레인 이벤트 발생 시 도움이 되는 추가 관리 도구가 포함되어 있습니다.HANA_DATA_OUT_OF_SYNC_<tag> 플래그는 사용자가 잘못된 시스템에서 데이터베이스를 실수로 복원하는 것을 방지합니다. HANA_LAST_OWNER_<tag> 플래그는 관리자가 대기 노드가 동기화되지 않은 동안 기본 시스템에서 작업이 수행된 시기를 알 수 있도록 도와줍니다. 이 플래그는 관리자에게 이 노드가 마지막 소유자였으며 복제가 재개되는 위치여야 함을 알려줍니다. HANA_DATA_CONSISTENCY_UNKNOWN_<tag>는 SIOS가 대기 사이의 모든 통신이 일시적으로 끊어졌다가 복원될 때 복제를 자동으로 해결하고 복원하는 데 도움이 됩니다. 모범 사례, 쿼럼 배포 및 적절한 조정과 함께 사용할 때 이러한 도구를 사용하면 Larry와 같은 관리자가 분할 브레인을 방지하고 발생할 때 안전하게 복구할 수 있습니다.
- 보고, 성능 및 재해 복구
물론 다중 대상의 진정한 이점은 추가 노드와 이러한 노드가 잠금 해제하는 기능에 있습니다. 동일한 데이터 센터에서 3개의 노드를 사용하면 DR 사이트에서 노드를 계속 유지하면서 logreplay_readaccess 매개변수를 통해 더 많은 보고의 가능성을 열 수 있습니다. 또한 다양한 복제 모드에 대한 SIOS의 지원을 통해 사용자는 데이터 센터(또는 지역) 전체에서 더 나은 성능을 위해 동기화 노드 및 비동기 노드를 사용할 수 있습니다. - 지속적인 테스트
귀하의 팀은 수제 스크립트를 얼마나 자주 테스트합니까? 구성, 관리 및 오전 2시 시나리오와 관련하여 Runbook을 검토하는 빈도입니다. HANA 다중 대상 솔루션은 SIOS 엔지니어, QA 및 고객 경험 전문가에 의해 지속적으로 테스트되었을 뿐만 아니라 솔루션은 각 릴리스 및 업데이트와 함께 HANA 장애 조치 및 복구 프로세스에 대해 계속 테스트되고 검증됩니다. - 광범위한 문서
얼마 전에 우리 팀은 클러스터 관리를 위해 고객과 함께 일했습니다. 그의 전임자는 환경에 대해 매우 잘 알고 있었지만 직원 승진 및 개편으로 인해 많은 IT 직원이 거의 알지 못하는 시스템을 담당하게 되었습니다. Runbook 및 해당 구성 문서에 대해 질문했을 때 고객은 이전 팀 또는 이전 관리자의 세부 정보를 찾을 수 없었습니다. 견고한 자동화, 관리, 모니터링, 복구 및 데이터 보호 외에도 SIOS 다중 대상 솔루션에는 LifeKeeper에서 제어하는 HANA 다중 대상 시스템의 구현, 운영 및 관리에 대한 상세하고 사용하기 쉬운 문서가 포함되어 있습니다.
SIOS의 전체 솔루션을 활용한다는 것은 고객이 일관되고 시기 적절한 모니터링 및 감지, 빠르고 안정적이고 효율적인 복구, 고가용성 및 재해 복구 보호를 보장하는 완전 자동화된 솔루션의 이점을 누릴 수 있음을 의미합니다.문의하기SAP HANA 다중 대상 자동화에 대한 자세한 내용은
-Cassius Rhue, VP 고객 경험
의 허가를 받아 복제됨시오스