자료실

고가용성에서 회피 전략을 사용하는 4가지 이유

11월 28, 2021 by Jason Aw Leave a Comment

클러스터 복원력, 성능 및 결과를 개선하기 위한 4가지 회피 전략

SIOS Protection Suite 클러스터 환경에서 배포를 위한 간단한 단계

무언가를 피하는 것 – 우리는 모두 전에 그것을 해왔습니다.우리가 배우자와 함께 걸을 때 가게에서 보는 오래된 불꽃, 우리가 “살 준비가 되지 않은” 판매원, 그리고 우리가 “휴가”에 있는 동안 상사조차도.내가 개발팀의 매니저였을 때, 나는 그들이 아파서 사무실에 없을 때 매장을 둘러보고 있는 부하직원을 흘끗 보았다.그들은 옷걸이 사이로 몸을 숨기고 서둘러 다음 통로를 따라 달려갔다.우리는 모두 전에 그것을 해왔고 어떤 경우에는 정신 건강, 신체 건강 또는 사적이고 개인적인 이유로 인해 모두 회피 조치가 필요합니다.HA에서도.그렇다면 어떻게 회피를 추가합니까? 고가용성 환경, 왜?

고가용성에서 회피 전략을 사용해야 하는 4가지 이유

더 나은 성능 (서버 과부하 최소화)

HA에서 회피 전략을 사용하는 한 가지 이유는 응용 프로그램 및 서버 성능을 높이는 것입니다.프로덕션 워크로드를 실행하는 세 대의 서버의 경우를 생각해 보겠습니다. 서버 알파, 서버 베타, 서버 감마라고 부르겠습니다.서버 알파 및 베타는 데이터베이스에 의해 지원되는 중요한 애플리케이션을 실행하는 반면 서버 감마는 보고서 및 데이터 변환 작업을 실행합니다.서버 알파에 장애가 발생하면 서버 베타로의 장애 조치가 일반적으로 발생합니다.그러나 베타 서버는 이미 큰 작업 부하를 실행하고 있기 때문에 추가 응용 프로그램 로드로 인해 바람직하지 않은 서버 과부하가 발생하고 두 응용 프로그램의 성능이 저하될 수 있습니다.따라서 서버 감마가 장애 조치 대상으로 선택되었는지 확인하기 위해 회피 전략을 배포하는 것이 현명할 수 있습니다.

성능 최적화

Alpha, Beta 및 Gamma의 세 서버 시나리오를 다시 고려하십시오.서버 알파 및 베타는 최대 워크로드를 처리하도록 확장되는 반면 Server Gamma는 비용 최적화된 서버입니다.서버 알파 및 서버 베타에 장애가 발생하면 비용 최적화 서버인 Gamma로 장애 조치가 발생합니다.그러나 이 서버는 최대 작업 부하나 서버 알파와 서버 베타의 작업 부하를 동시에 처리하도록 확장되지 않습니다.이 경우 회피 전략을 사용하여 다른 호스트를 사용할 수 있게 되는 즉시 Server Gamma에서 워크로드 중 하나 또는 둘 다를 자동으로 이동하여 성능을 최적화할 수 있습니다.

HA 최적화

HA 최적화는 회피 전략을 배포하기 위한 또 다른 시나리오입니다. 성능 최적화 전략과 마찬가지로 HA 최적화는 사용자 환경이 대부분의 실패 시나리오에서 살아남을 수 있도록 하고 애플리케이션이 어느 시점에서든 가능한 최고 수준의 가용성을 제공하도록 최적화되어 있는지 확인하는 데 사용됩니다.HA 최적화는 인큐 프로세스가 복제된 SAP와 같은 애플리케이션에 중요합니다.모든 SAP 환경에서 잠금 손실 및 취소된 작업의 위험 때문에 ASCS(ABAP SAP Central Service) 및 ERS(인큐 복제 서비스) 인스턴스가 동일한 서버에 장기간 상주하는 것을 원하지 않습니다. 이를 방지하기 위해 ERS 및 ASCS 인스턴스가 항상 반대 클러스터 노드에서 실행되도록 하는 회피 전략을 사용할 수 있습니다.프로덕션 워크로드를 실행하는 세 대의 서버의 경우를 생각해 보겠습니다. 서버를 Alpha, Beta, Gamma라고 부르겠습니다.서버 알파는 ASCS 인스턴스를 실행하고 서버 베타는 ERS 인스턴스를 실행합니다.Server Gamma는 ERS(Server Beta)와 ASCS(Server Alpha)의 장애 조치를 위한 세 번째 노드로 작동합니다.베타가 충돌하는 경우 ASCS 인스턴스와 동일한 노드에서 실행되는 ERS 리소스를 원하지 않을 것입니다.이 작업을 보장하기 위해 먼저 자동으로 확인하고 두 애플리케이션이 별도의 서버에 있는지 확인하고 잠금 장애 조치에 대한 SAP ASCS/ERS 모범 사례를 유지 관리하는 회피 전략을 배포할 수 있습니다.

DR 회피

약 70마일 떨어져 있는 City Alpha와 City Beta의 두 데이터 센터가 있고 대부분의 클라이언트가 그 사이에 있다고 가정합니다. 그러나 최근 내부 조직, 합병/폐쇄 및 인수, 거버넌스 요구 사항의 변경으로 인해 IT 팀은 Alpha 및 Beta에서 약 350마일 떨어진 City Gamma에 있는 세 번째 데이터 센터를 추가해야 합니다.이제 알파 및 베타에서 주로 보호되었던 리소스도 감마 위치로 확장됩니다.대부분의 사용자와 팀이 알파 및 베타 위치 근처에 있고 가장 극단적인 사용자도 이웃 도시에 있다는 점을 감안할 때 팀은 감마 위치로의 장애 조치를 피해야 합니다. 다른 전략과 마찬가지로 DR 회피는 한 지역 내에서 하나의 노드만 실패할 경우 DR 노드를 방지하여 성능, 내부/외 지역 데이터 비용, 대기 시간 및 클라이언트 액세스를 최적화하려고 합니다.또한 두 노드가 서로 다른 시간 후에 실패하더라도 DR로 이동하기 전에 항상 클러스터 또는 데이터 센터의 다른 노드로 장애 조치가 발생하도록 합니다.

그렇다면 회피 전략을 어떻게 전개할 것인가?

많은 공급자에는 구성할 수 있는 선호도 규칙이 있지만 다른 공급자는 서버 우선 순위 또는 수동 단계의 조합을 사용합니다.Linux용 SIOS Protection Suite의 경우 다음을 포함한 여러 기본 제공 방법을 사용할 수 있습니다.

리소스 우선 순위 지정

장애가 발생하면 리소스는 남아 있는 우선 순위가 가장 낮은 서버로 장애 조치되고 추가 서버(알파, 베타 및 감마)로 캐스케이드됩니다.Server Alpha는 Resource.HR의 기본 서버이고, Server Beta는 Resource.MFG의 기본 서버이며, Server Gamma는 모든 리소스/서버의 백업 서버입니다.리소스 우선 순위 지정을 사용하면 Resource.HR은 Server Alpha에서 1의 우선 순위를 가지며 Server Gamma에서 2의 우선 순위를 갖습니다.Resource.MFG는 서버 베타에서 우선 순위 1을, 서버 감마에서 우선 순위 2를 가질 수 있습니다.고객이 환경 사용을 최적화하기를 원할 경우 Resource.HR은 Server Beta에서 3의 우선순위를 가질 수 있고 Resource.MFG는 Server Alpha에서 3의 우선순위를 가질 수 있습니다.Server Alpha에 오류가 발생하는 경우 Resource.HR 리소스는 Server Alpha에서 서비스 시작(복원)을 시도하기 전에 먼저 Server Gamma에 실패합니다.

Linux용 SIOS Protection Suite(UI 및 CLI)를 사용하면 사용자가 각 서버 및 리소스 조합에 대한 우선 순위를 지정할 수 있습니다.

정책 또는 선호도 규칙

또한 정책 규칙을 사용하여 지정된 서버에서 리소스 복구가 발생하지 않도록 함으로써 리소스가 더 중요하거나 리소스 집약적인 작업 부하를 실행할 수 있는 지정된 서버를 피할 수 있습니다.일반적인 정책은 다음과 같습니다.

- - - - 기본적으로 특정 서버의 애플리케이션을 차단하는 제약 조건 정책.
        
        리소스가 충분하지 않은 서버에서 애플리케이션을 차단하는 리소스 정책
        
        리소스가 시스템에서 허용되거나 허용되지 않는 기간을 정의하는 임시 정책
        
        클러스터 내에서 선호하는 서버 또는 가능한 애플리케이션 소유권 기능을 정의하는 맞춤형 정책

SIOS Protection for Linux CLI를 사용하면 지정된 서버의 특정 리소스에 대한 장애 조치를 비활성화하고, 오류를 보호하는 임시 정책을 제공하고, 특정 애플리케이션 유형, 제약 조건 정책 및 사용자 지정 정책의 오류를 비활성화할 수 있는 정책 규칙을 지정할 수 있습니다.

특정 회피 리소스

자원 회피 전략을 수립하는 가장 세분화된 방법은 각 계층 내에 특정 회피 스크립트를 배포하는 것입니다.이 방법을 사용하면 사용자가 특정 응용 프로그램(예: app1 및 app2)을 구성하여 가능한 한 서로를 피하면서 다른 응용 프로그램을 제한 없이 실행할 수 있습니다.Alpha, Beta 및 Gamma의 세 서버와 app1, app2 및 app3의 세 가지 리소스의 경우 이 방법이 가장 큰 유연성을 제공합니다.이 예에서 app1 및 app2는 서버가 실패할 때 배열을 피하려고 하지만 app3은 배열 제한 없이 우선 순위에 따라 사용 가능한 다음 노드로 실패합니다.

회피 전략 및 리소스의 추가 예를 보려면 Linux용 SIOS Protection Suite를 고려하십시오. 선적 서류 비치 .고객이 가능하면 다른 노드에서 실행해야 하는 두 개의 애플리케이션(app1 및 app2)이 있는 경우 고객은 Linux gen/app 리소스용 SIOS Protection Suite 및 ‘/opt/LifeKeeper’를 사용하여 두 개의 회피 터미널 리프 노드 리소스를 생성할 수 있습니다. /lkadm/bin/avoid_restore’ 스크립트.

에서 재생산 시오스

클러스터 소개 – 2부

11월 23, 2021 by Jason Aw Leave a Comment

클러스터 소개 – 2부

어떤 유형의 클러스터가 있으며 어떻게 작동합니까?

HA 클러스터 및 로드 밸런싱 클러스터 개요

클러스터링은 예상치 못한 시스템 오류를 보상하기 위해 중복성을 생성하여 소프트웨어 및 하드웨어 시스템의 안정성과 성능을 개선하는 데 도움이 됩니다. 하드웨어나 소프트웨어 장애 또는 자연 재해로 인해 시스템이 중단되면 비즈니스와 수익에 큰 영향을 미치고 백업 및 실행에 중요한 시간과 비용이 낭비될 수 있습니다.

여기는 클러스터링 들어 온다. 클러스터링 솔루션에는 HA 클러스터, 로드 밸런싱 클러스터 및 HPC 클러스터의 세 가지 주요 유형이 있습니다. 귀사의 시스템 가용성과 성능을 가장 잘 높이는 유형은 무엇입니까? 아래에서 세 가지 유형의 클러스터링 솔루션에 대해 자세히 살펴보겠습니다.

HA 클러스터링이란 무엇입니까?

HA 클러스터링이라고도 하는 고가용성 클러스터링은 거의 지속적인 가용성이 필요한 미션 크리티컬 비즈니스 애플리케이션, ERP 시스템 및 데이터베이스(예: SQL Server SAP 및 Oracle)에 효과적입니다.

HA 클러스터링은 "Active-Active" 구성과 Active-Passive 구성의 두 가지 유형으로 나눌 수 있습니다.

이 두 가지 HA 클러스터링 유형의 차이점을 살펴보겠습니다.

HA 클러스터링 유형 1: 활성-활성 구성

활성-활성 구성에서 처리는 클러스터의 모든 노드에서 수행됩니다. 예를 들어 2노드 클러스터링의 경우 두 노드가 모두 활성 상태입니다. 한 노드가 중지되면 처리가 다른 노드를 대신합니다.

그러나 각 노드가 100%에 가깝게 작동하고 한 노드가 중지되면 다른 노드가 추가 처리 부하를 감당하기 어렵습니다. 따라서 HA 클러스터링에는 여유가 있는 용량 계획이 중요합니다.

HA 클러스터링 유형 2: 활성-대기 구성

2노드 예제를 다시 사용하겠습니다. 활성-대기 구성에서 한 노드는 활성 노드로 구성되고 다른 노드는 대기 노드로 구성됩니다. 활성 노드와 대기 노드는 "하트비트"라는 신호를 교환하여 정상 작동 여부를 지속적으로 확인합니다.

대기 노드가 활성 노드의 하트비트를 수신할 수 없는 경우 대기 노드는 활성 노드가 중지된 것으로 판단하고 활성 노드의 처리를 인계받습니다. 이 메커니즘을 "장애 조치"라고 합니다. 반대로, 중지된 운영 노드를 복구하고 처리를 복구된 활성 노드로 다시 전송하는 메커니즘을 "페일백"이라고 합니다. 액티브/스탠바이 구성에서는 장애가 발생했을 때 액티브 노드에서 스탠바이 노드로의 간단한 전환으로 비교적 쉽게 복구할 수 있다. 다만, 운영노드가 정상적으로 동작할 때 대기노드의 자원이 낭비된다는 점을 고려할 필요가 있다.

HA 클러스터링의 두 가지 구성 요소: 애플리케이션 및 스토리지

HA 클러스터가 효과적이려면 애플리케이션 오케스트레이션과 스토리지 보호라는 두 가지 영역을 해결해야 합니다. 클러스터링 소프트웨어는 보호되는 애플리케이션의 상태를 모니터링하고 문제가 감지되면 해당 애플리케이션의 작업을 대기 노드로 이동합니다. 대기 노드는 가장 최신 버전의 데이터에 액세스해야 합니다. 가급적이면 기본 노드가 사고 이전에 액세스했던 데이터와 동일한 것이 좋습니다. 이것은 두 가지 방법으로 달성할 수 있습니다: 공유 저장소, 공유 없음 저장소. 공유 스토리지 모델에서 두 클러스터 노드는 동일한 스토리지(일반적으로 SAN)에 액세스합니다. 비공유(SANless라고도 함) 구성에서 모든 노드의 로컬 스토리지는 복제 소프트웨어를 사용하여 미러링됩니다.

클러스터링 소프트웨어 제품은 애플리케이션 장애를 일으킬 수 있는 문제를 모니터링 및 감지하는 능력과 장애 조치를 안정적으로 조정하는 능력 면에서 매우 다양합니다. 많은 클러스터링 제품은 애플리케이션 서버가 작동하는지 여부만 감지하지만 애플리케이션 오류를 유발할 수 있는 광범위한 소프트웨어, 서비스, 네트워크 및 기타 문제는 감지하지 못합니다.

애플리케이션 인식은 필수

마찬가지로 복잡한 ERP 및 데이터베이스 응용 프로그램에는 올바른 서버 또는 인스턴스에 저장하고 올바른 순서로 시작하고 복잡한 모범 사례에 따라 온라인 상태로 만들어야 하는 여러 구성 요소가 있습니다. 응용 프로그램/데이터베이스별 요구 사항에 대한 모범 사례를 유지하도록 특별히 설계된 응용 프로그램 복구 키트라는 특수 소프트웨어가 포함된 클러스터링 소프트웨어를 선택하십시오.

HA 클러스터를 구성하는 방법에는 여러 가지가 있습니다.

공유 스토리지가 있는 기존의 2노드 클러스터

2노드 SANless 클러스터

클러스터는 로컬 LAN 및 고속 동기 블록 수준 복제를 사용하여 구성할 수 있습니다.

실시간 복제를 사용하여 기본 서버의 스토리지를 동일한 데이터 센터, 재해 복구 사이트 또는 둘 다에 있는 대기 서버의 스토리지와 동기화할 수 있습니다. 이를 통해 고가용성 및 재해 복구 구성을 유연하게 구축할 수 있습니다. 2노드 또는 다중 노드SIOS 블록 수준 복제는 성능에 대해 고도로 최적화되어 있습니다. 물리적 서버에서 PCIe 플래시 유형 스토리지 장치와 같은 초고속 로컬 연결 스토리지를 사용하여 매우 저렴한 고성능, 고가용성 구성을 달성할 수도 있습니다.데이터는 플래시 장치와 응용 프로그램에서도 보호됩니다.

재난 보호를 위한 세 번째 노드

이 구성은 SAN 기반 클러스터를 사용하고 원격 데이터 센터 또는 클라우드에 세 번째 SANless 노드를 추가하고 완전한 재해 복구 보호를 달성합니다.재해가 발생하면 대기 원격 물리적 서버가 데이터 손실 없이 자동으로 서비스를 시작하므로 백업 미디어에서 복원하는 데 필요한 시간이 필요하지 않습니다.

로드 밸런싱 클러스터란 무엇입니까?

로드 밸런싱 클러스터링은 프로세싱을 분산시켜 성능을 향상시키기 위해 로드 밸런서를 사용하여 여러 노드에 프로세싱을 분산하여 단일 시스템으로 사용할 수 있는 메커니즘입니다. 노드 장애가 전체 시스템에 영향을 미치는 것을 방지하기 위해 장애가 발생한 노드를 격리할 수 있지만 로드 밸런서는 장애 위험이 있는 중요한 단일 지점이며 고가용성 옵션이 아님 . 웹 서버 로드 밸런싱과 같은 애플리케이션에만 효과적입니다. 로드 밸런서 자체에 장애가 발생하면 전체 시스템이 중지됩니다.

HPC 클러스터링이란 무엇입니까?

성능을 위해 클러스터링을 사용할 수도 있습니다. 고가용성 대신 . 고성능 컴퓨팅 클러스터 또는 HPC 클러스터는 다중(때로는 수천 개의 노드)의 처리 능력을 결합하여 대규모 시뮬레이션, CAE 분석 및 병렬 처리가 필요한 과학 및 기술 환경과 같은 CPU 집약적 환경에서 필요한 CPU 성능을 얻습니다. .

귀하의 비즈니스에 적합한 HA 클러스터링 솔루션을 찾을 준비가 되셨습니까?

SIOS 고가용성 클러스터링에 대해 자세히 알아보기 여기 .

클러스터 소개 – 1부

11월 18, 2021 by Jason Aw Leave a Comment

클러스터 소개 – 1부

클러스터링이란 무엇입니까?

클러스터링 기술은 여러 서버를 연결하여 단일 기능 단위로 작동하도록 하는 기술입니다.

클러스터링 유형

당신은 할 수 있습니다 무리 여러 목적을 위한 서버. 예를 들어 고성능을 위해 여러 소형 서버의 처리 능력을 결합할 수 있습니다. 효율성을 높이기 위해 로드 밸런서를 사용하여 처리 작업을 여러 노드에 분산할 수도 있습니다.

고가용성(HA) 클러스터링 다운타임 및 데이터 손실로부터 중요한 애플리케이션을 보호하기 위해 서버 노드를 결합하는 프로세스입니다.

클러스터 소개 — 기존 공유 스토리지 장애 조치 클러스터에서 기본 노드와 보조 또는 원격 노드는 동일한 스토리지를 공유합니다.

HA 클러스터링

고가용성(HA) 클러스터링은 SPOF(단일 장애 지점)를 제거하여 가동 중지 시간을 줄이는 메커니즘입니다. HA 클러스터에서 중요한 애플리케이션은 클러스터의 하나 이상의 보조 또는 원격 노드에 연결된 기본 노드에서 실행됩니다. 클러스터링 소프트웨어는 애플리케이션, 서버 및 네트워크의 상태를 모니터링합니다. 기본 노드에 장애가 발생하면 장애 조치(failover)라고 하는 프로세스에서 보조 노드로 애플리케이션 작업을 이동하고 여기서 작업이 계속됩니다.

고가용성

애플리케이션 고가용성은 해당 연도에 애플리케이션을 사용할 수 있고 작동할 수 있는 시간을 측정한 것입니다. 일반적으로, HA 클러스터 주어진 연도 동안 99.99%(99%)의 가용성 또는 52분 이상의 가동 중지 시간을 제공합니다.

기존 HA 클러스터에서는 모든 클러스터 노드가 동일한 공유 스토리지(일반적으로 SAN)에 연결된다는 점에 유의하는 것이 중요합니다. 이러한 방식으로 장애 조치 후 보조 노드는 기본 노드와 동일한 데이터에 액세스하고 작업을 계속할 수 있습니다.

SANless 클러스터

그러나 많은 회사에서 여러 가지 이유로 SANless 클러스터를 사용하는 것을 선호합니다. 첫째, 공유 스토리지는 중요한 단일 실패 지점을 나타냅니다. 둘째, 공유 스토리지는 퍼블릭 클라우드 환경에서 옵션이 아닌 경우가 많습니다. 셋째, SAN은 때때로 SQL Server, Oracle 및 SAP와 같은 데이터베이스 응용 프로그램의 성능을 방해할 수 있습니다.

이러한 회사는 공유 스토리지 대신 효율적인 호스트 기반 블록 수준 복제를 사용하여 모든 클러스터 노드의 로컬 스토리지를 동기화합니다. 장애 조치 시 보조 노드는 기본 스토리지의 동일한 복사본을 사용하여 로컬 스토리지에 연결됩니다. 이는 SAN SPOF 위험을 제거할 뿐만 아니라 비용 효율적인 고성능을 위해 로컬 온프레미스 스토리지에 고속 디스크(SSD)를 추가할 수 있습니다. SANless 클러스터링은 또한 기업이 최소한의 노력이나 지속적인 비즈니스 프로세스 중단으로 온프레미스 HA 환경을 클라우드로 마이그레이션할 수 있도록 합니다.

에서 재생산 시오스

고가용성 및 재해 복구를 위한 클러스터링 소프트웨어

11월 13, 2021 by Jason Aw Leave a Comment

클러스터링 소프트웨어

고가용성 및 재해 복구를 위한 클러스터링 소프트웨어

클러스터링 소프트웨어란 무엇입니까?

클러스터링 소프트웨어 여러 서버가 함께 작동하여 가용성을 제공하고 데이터 손실을 방지할 수 있도록 서버를 그룹화 또는 클러스터로 구성할 수 있습니다. 각 서버는 운영 체제, 응용 프로그램 및 데이터와 같은 동일한 정보를 유지 관리합니다. 한 서버에 장애가 발생하면 다른 서버가 즉시 워크로드를 처리합니다. IT 전문가는 단일 실패 지점을 제거하고 가동 중지 시간의 위험을 최소화하기 위해 클러스터링에 의존합니다. 실제로 모든 조직의 86%가 일종의 클러스터링 또는 고가용성 메커니즘이 제자리에 있습니다.[1]

클러스터 관리 소프트웨어 유형

Windows 및 Linux 배포판에 사용할 수 있는 다양한 클러스터 관리 소프트웨어 솔루션이 있습니다. 예는 다음과 같습니다.

WSFC(Windows 서버 장애 조치 클러스터링),
SUSE Linux Enterprise 고가용성 확장,
레드햇 클러스터 스위트,
Oracle RAC(Real Application Clusters) 및
시오스 소프트웨어.

SIOS를 제외하고 이러한 제품은 단일 운영 체제를 지원하거나 고가의 SAN 하드웨어가 필요하므로 유연성 및 배포 옵션이 제한됩니다. 또한 Linux 오픈 소스 HA 확장에는 고도의 기술이 필요하므로 대부분의 운영자에게 어려운 복잡성과 안정성 문제가 발생합니다.

SIOS 제품은 물리적, 가상, 클라우드 또는 하이브리드 클라우드 환경과 사이트 또는 재해 복구 시나리오의 조합에서 작동하는 모든 Windows 또는 Linux 기반 애플리케이션을 고유하게 보호합니다. Oracle, SQL Server, DB2, SAP HANA 등을 비롯한 SAP 및 데이터베이스와 같은 애플리케이션은 SIOS 소프트웨어의 이점을 활용합니다. SIOS 제품의 "즉시 사용 가능한" 단순성, 구성 유연성, 안정성, 성능 및 비용 효율성은 다른 클러스터링 소프트웨어와 차별화됩니다.

SIOS 클러스터링 소프트웨어가 Windows 및 Linux 클러스터에 고가용성을 제공하는 방법

Windows 또는 Linux 환경에서 중요한 응용 프로그램을 실행하는 경우 SIOS Technology Corporation의 고가용성 소프트웨어 클러스터링 제품을 고려할 수 있습니다.

윈도우 환경에서, SIOS DataKeeper 클러스터 에디션 성능 최적화된 호스트 기반을 제공하여 WSFC(Windows Server Failover Clustering)와 원활하게 통합 및 확장 데이터 복제 기구. WSFC가 소프트웨어 클러스터를 관리하는 동안 SIOS는 복제를 수행하여 재해 보호를 가능하게 하고 클라우드, 가상 및 고성능 스토리지 환경과 같이 공유 스토리지 클러스터가 불가능하거나 비실용적인 경우 데이터 손실을 방지합니다.

리눅스 환경에서는 Linux용 SIOS 보호 제품군 고가용성 장애 조치 클러스터링, 지속적인 애플리케이션 모니터링, 데이터 복제 및 구성 가능한 복구 정책의 긴밀하게 통합된 조합을 제공하여 다운타임 및 재해로부터 비즈니스 크리티컬 애플리케이션을 보호합니다.

Windows 환경이든 Linux 환경이든 SIOS 제품은 IT 팀을 컴퓨팅 인프라의 복잡성과 과제에서 해방시킵니다. 인텔리전스, 자동화, 유연성, 고가용성 , 사용이 간편한 IT 관리자는 다운타임이나 데이터 손실로부터 비즈니스 크리티컬 애플리케이션을 보호해야 합니다. 80,000개 이상의 라이선스가 판매된 SIOS는 많은 세계 최대 기업에서 사용하고 있습니다.

다음은 선도적인 HIS(병원 정보 시스템) 제공업체가 Windows 클러스터 환경에서 고가용성 및 네트워크 대역폭을 개선하기 위해 SIOS DataKeeper Cluster Edition을 배포한 방법을 설명하는 사례 연구입니다.

한 HIS 공급자가 SIOS DataKeeper 클러스터링 소프트웨어를 사용하여 RPO 및 RTO를 개선한 방법

이 선도적인 HIS 제공업체는 환자 관리, 환자 셀프 서비스 및 수익 관리를 포함한 다양한 애플리케이션을 사용하는 10,000개 이상의 미국 기반 의료 기관(HCO)을 보유하고 있습니다. 이러한 고객을 지원하기 위해 조직은 지리적으로 분산된 2개의 데이터 센터에 20개 이상의 SQL Server 클러스터를 배치하고 몇 대의 소규모 서버와 재해 복구 (DR).

조직은 대규모 고객 기반과 방대한 IT 인프라를 보유하고 있으며 DR 사이트에 데이터를 복제할 때 과도한 네트워크 트래픽을 처리하고 네트워크 대역폭 문제를 제거할 수 있는 솔루션이 필요했습니다. 또한 조직은 위험에 처한 데이터의 양을 줄이고 재해 또는 시스템 장애 후 IT 운영을 더 빠르게 백업 및 실행하기 위해 RPO(복구 시점 목표) 및 RTO(복구 시간 목표)를 개선해야 했습니다. RPO는 서버에 장애가 발생하거나 재해가 발생했을 때 허용할 수 있는 최대 데이터 손실량입니다. RTO는 모든 중단의 최대 허용 기간입니다.

이러한 문제를 해결하기 위해 이 조직은 WSFC와의 원활한 통합을 제공하여 SANless 클러스터를 생성할 수 있는 SIOS DataKeeper Cluster Edition을 선택했습니다.

SIOS DataKeeper Cluster Edition이 조직의 엄격한 POC 테스트를 통과한 후 IT 팀은 회사의 프로덕션 환경에 솔루션을 배포했습니다. 팀은 조직의 기본 온프레미스 데이터 센터에 있는 2개의 SAN 기반 노드와 원격 DR 사이트에 있는 1개의 SANless 노드로 구성된 3노드 클러스터에 SIOS를 배포했습니다.

SIOS 솔루션은 클러스터의 3개 노드에서 복제를 동기화하고 DR 사이트에서 대역폭 문제를 제거하여 RPO와 RTO를 모두 개선하고 대역폭 비용을 줄입니다. 오늘날 조직은 SIOS DataKeeper Cluster Edition을 사용하여 18개 이상의 클러스터 노드에서 SQL Server 환경을 보호합니다.

자세한 내용은 전체 사례 연구를 참조하십시오. .

SIOS 클러스터링 소프트웨어 작동 방식

SIOS 소프트웨어는 클러스터 솔루션의 필수적인 부분으로, 성능이나 가용성을 희생하지 않으면서 물리적, 가상 및 클라우드(퍼블릭, 프라이빗 및 하이브리드) 환경의 모든 구성(또는 조합)에서 Windows 또는 Linux 환경을 보호합니다.

저대역폭 로컬 또는 광역 네트워크를 통해 데이터를 전송하기 위해 빠르고 효율적인 복제가 필요한 경우 SIOS DataKeeper는 Microsoft SQL Server, Oracle, SharePoint, Lync, Dynamics 및 Hyper-V를 포함한 비즈니스 크리티컬 Windows 환경을 가동 중지 및 물리적, 가상 또는 클라우드 환경에서의 데이터 손실.

Linux용 SIOS Protection Suite는 Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS 및 Oracle Linux를 포함한 모든 주요 Linux 배포판을 지원하며 광범위한 스토리지 아키텍처를 수용합니다.

SIOS 클러스터링 소프트웨어가 Windows 및 Linux 환경을 보호하기 위해 어떻게 작동하는지 보려면, 데모 요청 또는 얻을 무료 시험판 .

다음에 대해 자세히 알아보십시오. SAP 클러스터링 SQL 서버 클러스터링 오라클 클러스터링 리눅스 클러스터링 클러스터링 제품에 대한 최근 블로그 게시물을 확인하십시오.

참고문헌

[1]ActualTech Research와 협력하여 SIOS, (2018) 응용 프로그램 고가용성 설문 조사 보고서 재생성 시오스

재해 복구 기초

11월 8, 2021 by Jason Aw Leave a Comment

재해 복구 기초

재해 복구 개요

재해 복구는 시스템을 신속하게 복원/수리하고 사이트 전체 또는 지역적 장애 발생 시 피해를 최소화하는 능력을 의미합니다. 재해 복구는 비즈니스 연속성 관리의 중요한 부분이며 강력한 재해 복구 프로토콜을 마련하면 시스템 다운타임과 관련된 불필요한 데이터 손실 및 비용을 방지하는 데 도움이 됩니다.

재해 복구의 ‘재해’ 부분을 구성하는 것은 무엇입니까? 지진, 홍수 등의 자연재해뿐만 아니라 ‘화재’, ‘테러’, ‘무단침입’, ‘대규모 해킹’, ‘장기적 대규모 -규모 정전.” 실패할 경우 IT 시스템에 치명적인 손상을 줄 가능성이 있는 모든 것.

시스템 장애의 실제 영향

시스템 오류와 관련된 잠재적인 물리적 손상 및 데이터 손실 외에도 재해 복구 계획이 없으면 비즈니스에 복구할 수 없는 수익 손실이 발생할 수 있습니다. 1분의 시스템 다운타임으로 인해 판매 및 기회 상실, 잠재적인 부정적인 고객 경험, 비즈니스 평판 훼손 및 긴급 IT 수리에 대한 높은 비용이 발생합니다.

재해 복구의 중요성

미션 크리티컬 서비스를 제공하는 회사의 경우 예기치 않은 시스템 다운타임을 처리할 수 있는 비즈니스 연속성 시스템을 구축하는 것이 필수적입니다. 처음부터 장애를 예방하고 로컬 장애 또는 사이트 전체 또는 지역 재해가 발생하는 경우 신속하게 복구할 수 있는 능력을 갖추면 데이터를 보호하고 고객과의 관계를 유지하며 시간을 절약하고 막대한 재정적 손실을 입을 수 있습니다.

치명적인 시스템 오류는 일어날 수 있는 일이 아니라 일어날 수 있는 일임을 인식하는 것이 중요합니다. 따라서 적절한 재해 복구 계획을 수립하면 비즈니스를 보호할 수 있습니다.

재해 복구 과제

재해 복구 프로토콜은 필수적이지만 설정하고 구현하는 데 어려움이 없는 것은 아닙니다. 적절한 재해 복구 구현에 대한 몇 가지 일반적인 장벽은 다음과 같습니다. 과제 1: 지리적 분리.
재해 보호의 핵심은 기본 데이터 센터 또는 클라우드 인스턴스와 지리적으로 분리된 위치에 시스템 및 데이터를 유지하여 재해 또는 클라우드 중단이 발생하는 경우 보조 시스템을 온라인으로 전환하고 운영을 계속할 수 있도록 하는 것입니다.

과제 2: 네트워크 대역폭 요구 사항 재해 복구를 위해 오프사이트 위치에 데이터를 복제하면 네트워크 대역폭 요구 사항이 추가되고 대기 시간 문제가 발생할 수 있습니다.

과제 3: 데이터 볼륨의 계속 증가 재해 복구 사이트의 스토리지 용량 요구 사항은 시간이 지남에 따라 증가합니다. 적절한 재해 복구 계획은 어떤 데이터를 보호해야 하는지 명확히 하고 사용 가능한 스토리지 리소스를 최적화하기 위해 “보호 우선 순위”를 설정해야 합니다.

과제 4: 복구 시 복구 절차 재해로 인해 시스템이 다운되면 서비스 복구가 필요합니다. 종종 기업은 데이터가 여러 위치에 흩어져 있고 표준화된 절차 및 복구가 없기 때문에 막대한 시간과 비용 손실을 초래한다는 사실을 알게 됩니다. 명확하고 표준화된 복원 절차를 개발하면 이러한 골칫거리를 없애고 가장 중요할 때 신속한 조치를 취할 수 있습니다.

데이터 백업과 가용성 보호

전통적으로 데이터 백업(기본적으로 데이터 및 애플리케이션의 복사본을 만들어 오프사이트 위치로 이동하는 프로세스)은 IT 장비 장애/고장 시 데이터를 보호하고 규정에 따라 기록 보관/보관할 목적으로 수행되었습니다. HIPAA(Healthcare Information Portability Accountability Act)와 같은 요구 사항. 작동을 복구하려면 사건의 영향을 받는 모든 서버, 스토리지 및 기타 하드웨어와 네트워킹을 교체하거나 수리해야 합니다. 서버를 구성하고 애플리케이션을 복원하고 다시 온라인으로 전환하고 복구된 데이터에 연결해야 합니다. 이 단계는 몇 개월이 걸릴 수 있습니다.

가용성 보호 프로세스가 없으면 백업만으로 복구 작업을 수행하는 것은 시간과 비용이 많이 드는 프로세스가 될 수 있습니다. 가용성 프로세스는 재해 발생 시 완전한 운영 시스템을 인계받을 준비가 된 상태로 유지하여 몇 분 안에 서비스를 재개할 수 있습니다.

효과적인 재해 복구 계획이 중요한 몇 가지 다른 일반적인 이유는 다음과 같습니다.

재해 복구 지표

재해 복구의 주요 지표는 “RPO” 및 “RTO”입니다.

RPO(복구 시점 목표) RPO는 재해 발생 시점부터 데이터 복구가 보장된 과거 시점까지를 나타냅니다.

“RPO = < 5분”인 경우 “RPO = 0(데이터 손실 없음)”을 목표로 하는 경우 장애 조치 클러스터링과 같은 가용성 보호 메커니즘이 필요합니다.

RTO(복구 시간 목표) RTO는 비즈니스가 초기 다운타임에서 운영 복구까지 얼마나 많은 시간을 허용할 수 있는지 보여주는 지수입니다. “RTO = 1개월 이상”인 경우 원격 백업 및 대체 장치 확보만으로 데이터 복구를 처리할 수 있습니다. 그러나 “RTO = 몇 분 이내”인 경우 장애 조치 클러스터링이 필요합니다.

재해 복구 방법 선택

비즈니스에 적합한 재해 복구 방법을 결정할 때 다음과 같은 중요한 요소를 고려하십시오.

비즈니스 프로세스의 중요성 및 영향에 대한 내성
보호하려는 데이터 유형 및 용량
복구 요구 사항 – RPO 및 RTO
예산

비즈니스 영향에 중점

IT 부서가 IT 시스템에 대한 재해 복구 조치를 개발하는 데 기술적인 역할을 하는 동안 비즈니스 소유자는 비즈니스에 미치는 영향을 최소화하기 위해 각 시스템 중지가 비즈니스에 미치는 영향에 대한 시스템 중단의 영향과 범위를 고려해야 합니다.

보호되는 데이터 유형(데이터 무결성)

보호되는 데이터의 유형과 중요도를 분류하는 것은 중요합니다. 매우 정확한 일관성이 필요하지 않은 데이터(예: 파일 서버)의 경우 간단한 기본 저장소 백업으로 충분할 수 있습니다.

반면에 SQL Server, Oracle 및 SAP와 같은 ERP 시스템 및 데이터베이스에는 특정 서버에 배치되어야 하고 특정 주문에 따라 시작되어야 하고 다양한 애플리케이션별 모범 사례에 따라 관리되어야 하는 여러 서비스와 부품이 있습니다. . 일반적으로 장애 조치를 오케스트레이션하려면 고가용성 보호와 애플리케이션 인식 클러스터링 솔루션이 필요합니다.

———————————————————————————————————————

주요 재해 복구 용어

원격 백업 – 기본적으로 지리적으로 분리된 원격 위치에 애플리케이션 및 데이터 사본을 보관합니다.

동기 스토리지 미러링 DR 보호를 위해 동기화된 스토리지의 로컬 및 원격 사본을 유지합니다. 이 방법에서 데이터는 로컬 저장소에 기록되고 즉시 원격 저장소에 복제됩니다. 로컬 저장소는 원격 위치에 데이터를 쓰는 프로세스가 완료될 때까지 “커밋”되지 않습니다. 이 프로세스는 두 위치를 동일하게 유지하여 이벤트 시점에 전송 중인 데이터가 원격 위치에 쓰지 못할 경우 발생할 수 있는 불일치를 제거합니다. 기본 사이트와 백업 사이트 간에 데이터 무결성이 보장됩니다.

비동기식 스토리지 미러링.
이 방법은 데이터를 로컬 저장소에 쓴 다음 원격 위치에 복제합니다. 지리적 분리로 인해 대기 시간이 발생할 때 네트워크 활용 효율성을 높이고 대역폭 경합을 줄일 수 있습니다.

“콜드 스탠바이” 및 “핫 스탠바이”

콜드 스탠바이 재해 발생 시 데이터 또는 보조 시스템의 복사본을 오프라인으로 유지하는 프로세스입니다. 기본 시스템이 다운되면 시스템과 소프트웨어를 수동으로 시작해야 하고(경우에 따라 구성) 데이터를 복원해야 작동을 계속할 수 있습니다.

상시 대기 이는 보조 시스템을 계속 작동 상태로 유지하고 기본 시스템에 다운타임이 발생한 경우 보조 시스템으로 전환하는 프로세스입니다.

재해 복구 방법 비용 비교

RPO 및 RTO가 작을수록 가동 중지 시간이 짧아지지만 그에 따라 비용이 증가합니다.

각 데이터 유형의 비용과 자산 가치를 고려하여 필요한 보호 수준에 대한 최적의 방법을 찾는 것이 필요합니다. 내부 구현과 서비스 아웃소싱 간의 균형은 비용에 영향을 미칩니다.

고가용성 및 재해 복구 솔루션에 대해 자세히 알아보려면 시오스, 클릭 여기 .

클러스터 복원력, 성능 및 결과를 개선하기 위한 4가지 회피 전략

SIOS Protection Suite 클러스터 환경에서 배포를 위한 간단한 단계

고가용성에서 회피 전략을 사용해야 하는 4가지 이유

더 나은 성능 (서버 과부하 최소화)

성능 최적화

HA 최적화

DR 회피

그렇다면 회피 전략을 어떻게 전개할 것인가?

리소스 우선 순위 지정

정책 또는 선호도 규칙

특정 회피 리소스

클러스터 소개 – 2부

어떤 유형의 클러스터가 있으며 어떻게 작동합니까?

HA 클러스터 및 로드 밸런싱 클러스터 개요

HA 클러스터링이란 무엇입니까?

HA 클러스터링 유형 1: 활성-활성 구성

HA 클러스터링 유형 2: 활성-대기 구성

HA 클러스터링의 두 가지 구성 요소: 애플리케이션 및 스토리지

애플리케이션 인식은 필수

HA 클러스터를 구성하는 방법에는 여러 가지가 있습니다.

공유 스토리지가 있는 기존의 2노드 클러스터

2노드 SANless 클러스터

재난 보호를 위한 세 번째 노드

로드 밸런싱 클러스터란 무엇입니까?

HPC 클러스터링이란 무엇입니까?

클러스터 소개 – 1부

클러스터링이란 무엇입니까?

클러스터링 유형

HA 클러스터링

고가용성

SANless 클러스터

클러스터링 소프트웨어

고가용성 및 재해 복구를 위한 클러스터링 소프트웨어

클러스터링 소프트웨어란 무엇입니까?

클러스터 관리 소프트웨어 유형

SIOS 클러스터링 소프트웨어가 Windows 및 Linux 클러스터에 고가용성을 제공하는 방법

한 HIS 공급자가 SIOS DataKeeper 클러스터링 소프트웨어를 사용하여 RPO 및 RTO를 개선한 방법

SIOS 클러스터링 소프트웨어 작동 방식

재해 복구 기초

재해 복구 개요

시스템 장애의 실제 영향

재해 복구의 중요성

재해 복구 과제

데이터 백업과 가용성 보호

재해 복구 지표

재해 복구 방법 선택

비즈니스 영향에 중점

보호되는 데이터 유형(데이터 무결성)

주요 재해 복구 용어

원격 백업 – 기본적으로 지리적으로 분리된 원격 위치에 애플리케이션 및 데이터 사본을 보관합니다.

“콜드 스탠바이” 및 “핫 스탠바이”

재해 복구 방법 비용 비교