%

Date: 11월 8, 2021

재해 복구 기초

재해 복구 개요

재해 복구는 시스템을 신속하게 복원/수리하고 사이트 전체 또는 지역적 장애 발생 시 피해를 최소화하는 능력을 의미합니다. 재해 복구는 비즈니스 연속성 관리의 중요한 부분이며 강력한 재해 복구 프로토콜을 마련하면 시스템 다운타임과 관련된 불필요한 데이터 손실 및 비용을 방지하는 데 도움이 됩니다.

재해 복구의 ‘재해’ 부분을 구성하는 것은 무엇입니까? 지진, 홍수 등의 자연재해뿐만 아니라 ‘화재’, ‘테러’, ‘무단침입’, ‘대규모 해킹’, ‘장기적 대규모 -규모 정전.” 실패할 경우 IT 시스템에 치명적인 손상을 줄 가능성이 있는 모든 것.

시스템 장애의 실제 영향

시스템 오류와 관련된 잠재적인 물리적 손상 및 데이터 손실 외에도 재해 복구 계획이 없으면 비즈니스에 복구할 수 없는 수익 손실이 발생할 수 있습니다. 1분의 시스템 다운타임으로 인해 판매 및 기회 상실, 잠재적인 부정적인 고객 경험, 비즈니스 평판 훼손 및 긴급 IT 수리에 대한 높은 비용이 발생합니다.

재해 복구의 중요성

미션 크리티컬 서비스를 제공하는 회사의 경우 예기치 않은 시스템 다운타임을 처리할 수 있는 비즈니스 연속성 시스템을 구축하는 것이 필수적입니다. 처음부터 장애를 예방하고 로컬 장애 또는 사이트 전체 또는 지역 재해가 발생하는 경우 신속하게 복구할 수 있는 능력을 갖추면 데이터를 보호하고 고객과의 관계를 유지하며 시간을 절약하고 막대한 재정적 손실을 입을 수 있습니다.

치명적인 시스템 오류는 일어날 수 있는 일이 아니라 일어날 수 있는 일임을 인식하는 것이 중요합니다. 따라서 적절한 재해 복구 계획을 수립하면 비즈니스를 보호할 수 있습니다.

재해 복구 과제

재해 복구 프로토콜은 필수적이지만 설정하고 구현하는 데 어려움이 없는 것은 아닙니다. 적절한 재해 복구 구현에 대한 몇 가지 일반적인 장벽은 다음과 같습니다. 과제 1: 지리적 분리.
재해 보호의 핵심은 기본 데이터 센터 또는 클라우드 인스턴스와 지리적으로 분리된 위치에 시스템 및 데이터를 유지하여 재해 또는 클라우드 중단이 발생하는 경우 보조 시스템을 온라인으로 전환하고 운영을 계속할 수 있도록 하는 것입니다.

과제 2: 네트워크 대역폭 요구 사항 재해 복구를 위해 오프사이트 위치에 데이터를 복제하면 네트워크 대역폭 요구 사항이 추가되고 대기 시간 문제가 발생할 수 있습니다.

과제 3: 데이터 볼륨의 계속 증가 재해 복구 사이트의 스토리지 용량 요구 사항은 시간이 지남에 따라 증가합니다. 적절한 재해 복구 계획은 어떤 데이터를 보호해야 하는지 명확히 하고 사용 가능한 스토리지 리소스를 최적화하기 위해 “보호 우선 순위”를 설정해야 합니다.

과제 4: 복구 시 복구 절차 재해로 인해 시스템이 다운되면 서비스 복구가 필요합니다. 종종 기업은 데이터가 여러 위치에 흩어져 있고 표준화된 절차 및 복구가 없기 때문에 막대한 시간과 비용 손실을 초래한다는 사실을 알게 됩니다. 명확하고 표준화된 복원 절차를 개발하면 이러한 골칫거리를 없애고 가장 중요할 때 신속한 조치를 취할 수 있습니다.

데이터 백업과 가용성 보호

전통적으로 데이터 백업(기본적으로 데이터 및 애플리케이션의 복사본을 만들어 오프사이트 위치로 이동하는 프로세스)은 IT 장비 장애/고장 시 데이터를 보호하고 규정에 따라 기록 보관/보관할 목적으로 수행되었습니다. HIPAA(Healthcare Information Portability Accountability Act)와 같은 요구 사항. 작동을 복구하려면 사건의 영향을 받는 모든 서버, 스토리지 및 기타 하드웨어와 네트워킹을 교체하거나 수리해야 합니다. 서버를 구성하고 애플리케이션을 복원하고 다시 온라인으로 전환하고 복구된 데이터에 연결해야 합니다. 이 단계는 몇 개월이 걸릴 수 있습니다.

가용성 보호 프로세스가 없으면 백업만으로 복구 작업을 수행하는 것은 시간과 비용이 많이 드는 프로세스가 될 수 있습니다. 가용성 프로세스는 재해 발생 시 완전한 운영 시스템을 인계받을 준비가 된 상태로 유지하여 몇 분 안에 서비스를 재개할 수 있습니다.

효과적인 재해 복구 계획이 중요한 몇 가지 다른 일반적인 이유는 다음과 같습니다.

재해 복구 지표

재해 복구의 주요 지표는 “RPO” 및 “RTO”입니다.

RPO(복구 시점 목표) RPO는 재해 발생 시점부터 데이터 복구가 보장된 과거 시점까지를 나타냅니다.

“RPO = < 5분”인 경우 “RPO = 0(데이터 손실 없음)”을 목표로 하는 경우 장애 조치 클러스터링과 같은 가용성 보호 메커니즘이 필요합니다.

RTO(복구 시간 목표) RTO는 비즈니스가 초기 다운타임에서 운영 복구까지 얼마나 많은 시간을 허용할 수 있는지 보여주는 지수입니다. “RTO = 1개월 이상”인 경우 원격 백업 및 대체 장치 확보만으로 데이터 복구를 처리할 수 있습니다. 그러나 “RTO = 몇 분 이내”인 경우 장애 조치 클러스터링이 필요합니다.

재해 복구 방법 선택

비즈니스에 적합한 재해 복구 방법을 결정할 때 다음과 같은 중요한 요소를 고려하십시오.

비즈니스 프로세스의 중요성 및 영향에 대한 내성
보호하려는 데이터 유형 및 용량
복구 요구 사항 – RPO 및 RTO
예산

비즈니스 영향에 중점

IT 부서가 IT 시스템에 대한 재해 복구 조치를 개발하는 데 기술적인 역할을 하는 동안 비즈니스 소유자는 비즈니스에 미치는 영향을 최소화하기 위해 각 시스템 중지가 비즈니스에 미치는 영향에 대한 시스템 중단의 영향과 범위를 고려해야 합니다.

보호되는 데이터 유형(데이터 무결성)

보호되는 데이터의 유형과 중요도를 분류하는 것은 중요합니다. 매우 정확한 일관성이 필요하지 않은 데이터(예: 파일 서버)의 경우 간단한 기본 저장소 백업으로 충분할 수 있습니다.

반면에 SQL Server, Oracle 및 SAP와 같은 ERP 시스템 및 데이터베이스에는 특정 서버에 배치되어야 하고 특정 주문에 따라 시작되어야 하고 다양한 애플리케이션별 모범 사례에 따라 관리되어야 하는 여러 서비스와 부품이 있습니다. . 일반적으로 장애 조치를 오케스트레이션하려면 고가용성 보호와 애플리케이션 인식 클러스터링 솔루션이 필요합니다.

———————————————————————————————————————

주요 재해 복구 용어

원격 백업 – 기본적으로 지리적으로 분리된 원격 위치에 애플리케이션 및 데이터 사본을 보관합니다.

동기 스토리지 미러링 DR 보호를 위해 동기화된 스토리지의 로컬 및 원격 사본을 유지합니다. 이 방법에서 데이터는 로컬 저장소에 기록되고 즉시 원격 저장소에 복제됩니다. 로컬 저장소는 원격 위치에 데이터를 쓰는 프로세스가 완료될 때까지 “커밋”되지 않습니다. 이 프로세스는 두 위치를 동일하게 유지하여 이벤트 시점에 전송 중인 데이터가 원격 위치에 쓰지 못할 경우 발생할 수 있는 불일치를 제거합니다. 기본 사이트와 백업 사이트 간에 데이터 무결성이 보장됩니다.

비동기식 스토리지 미러링.
이 방법은 데이터를 로컬 저장소에 쓴 다음 원격 위치에 복제합니다. 지리적 분리로 인해 대기 시간이 발생할 때 네트워크 활용 효율성을 높이고 대역폭 경합을 줄일 수 있습니다.

“콜드 스탠바이” 및 “핫 스탠바이”

콜드 스탠바이 재해 발생 시 데이터 또는 보조 시스템의 복사본을 오프라인으로 유지하는 프로세스입니다. 기본 시스템이 다운되면 시스템과 소프트웨어를 수동으로 시작해야 하고(경우에 따라 구성) 데이터를 복원해야 작동을 계속할 수 있습니다.

상시 대기 이는 보조 시스템을 계속 작동 상태로 유지하고 기본 시스템에 다운타임이 발생한 경우 보조 시스템으로 전환하는 프로세스입니다.

재해 복구 방법 비용 비교

RPO 및 RTO가 작을수록 가동 중지 시간이 짧아지지만 그에 따라 비용이 증가합니다.

각 데이터 유형의 비용과 자산 가치를 고려하여 필요한 보호 수준에 대한 최적의 방법을 찾는 것이 필요합니다. 내부 구현과 서비스 아웃소싱 간의 균형은 비용에 영향을 미칩니다.

고가용성 및 재해 복구 솔루션에 대해 자세히 알아보려면 시오스, 클릭 여기 .