Date: 5월 14, 2022
가용성 SLA: FT, 고가용성 및 재해 복구 – 시작 위치
우리 삶의 많은 부분이 기술 중심인 현대 시대에 우리는 매우 순간적인 세계에 살고 있다고 말할 수 있습니다.예를 들어, 버튼을 클릭하면 주간 식료품 주문이 문앞에 도착합니다.이벤트나 여행을 위한 티켓을 즉시 구매할 수 있습니다.아니면 요즘에도 전시장 근처에 가지 않고 깐깐한 영업사원을 만나지 않고도 새 차를 주문할 수 있습니다. 우리는 이 편리한 세상에서 버릇이 없습니다.
그러나 이러한 수준의 서비스를 뒷받침해야 하는 모든 공급업체와 서비스 제공업체에 대해서는 잠시 생각해 보겠습니다.그들은 기본 인프라(특히 IT 인프라)가 이러한 "상시 가동" 기대치를 지원할 수 있는 방식으로 구축 및 운영되도록 보장하기 위해 높은 수준의 투자를 유지해야 합니다.애플리케이션과 데이터베이스는 항상 실행되어 고객 요구를 충족하고 회사 생산성과 수익을 극대화해야 합니다.IT 비즈니스 연속성의 중요성은 그 어느 때보다도 중요합니다.
많은 IT 가용성 개념이 다음과 같이 떠돌고 있습니다. 내결함성(FT) , 고가용성 (하아) 그리고 재해 복구 (DR) .그러나 이것은 추가 질문을 제기할 수 있습니다.이러한 가용성 개념의 차이점은 무엇입니까?내 인프라에 적합한 것은 무엇입니까?결합하거나 교환할 수 있습니까? 가용성 이니셔티브의 첫 번째이자 가장 중요한 단계는 명확한 애플리케이션/데이터베이스 가용성 서비스 수준 계약(SLA)을 설정하는 것입니다.그런 다음 가장 적합한 가용성 접근 방식을 정의합니다.
SLA란 무엇입니까?
어느 정도까지는 SLA가 무엇인지 모두 알고 있지만 이 논의를 위해 우리 모두가 동일한 파장에 있는지 확인합시다. 가용성 SLA는 애플리케이션/데이터베이스 가동 시간 및 액세스 가능성의 예상 수준을 정의하는 서비스 공급자와 최종 사용자 간의 계약으로, 합의된 서비스 수준이 그렇지 않은 경우 공급업체가 관련 처벌(일반적으로 재정적)을 보장하고 개략적으로 설명합니다. 만났다.IT 세계에서 SLA는 RTO(복구 시간 목표) 및 RPO(복구 시점 목표)라는 두 가지 비즈니스 중요도 측정에서 위조됩니다.아주 간단하게, RTO는 장애 발생 시 애플리케이션 작업을 얼마나 빨리 복원해야 하는지 정의합니다. RPO는 복구 시나리오의 경우 데이터가 얼마나 최신 상태여야 하는지 정의합니다. 애플리케이션 및 데이터베이스에 대한 이러한 메트릭을 식별할 수 있으면 SLA가 정의됩니다.SLA는 백분율로 측정되므로 예를 들어 99.9% 또는 99.99%와 같은 용어를 사용할 수 있습니다.이는 IT 부서가 해당 연도에 애플리케이션에 대해 몇 분의 가동 시간 및 가용성을 보장하는지 측정한 것입니다. 일반적으로 더 많은 보호는 더 많은 비용을 의미합니다. 따라서 응용 프로그램 또는 데이터베이스의 가동 중지 시간 비용을 추정하고 이 SLA를 비즈니스에 적합한 솔루션을 선택하는 도구로 사용하는 것이 중요합니다.
SLA가 확보되면 FT, HA, DR 또는 이들의 조합 중 어떤 유형의 솔루션이 가용성 요구 사항에 가장 적합한 접근 방식인지에 대한 비즈니스 결정을 내릴 수 있습니다.
내결함성(FT)이란 무엇입니까?
FT는 99.999%로 매우 인상적인 가용성 SLA를 제공합니다.실제 환경에서 FT 솔루션은 1년에 5.25분 이하의 다운타임을 보장합니다.기본적으로 두 개의 동일한 서버가 서로 병렬로 실행되어 "록스텝" 프로세스라고 하는 활성-활성 구성에서 두 서버의 트랜잭션을 동시에 처리합니다. 1차 서버가 실패하면 2차 서버는 애플리케이션 중단이나 데이터 손실 없이 처리를 계속합니다.최종 사용자는 서버 오류가 발생했음을 다행스럽게도 인식하지 못할 것입니다.
이것은 환상적인 소리입니다!이것은 훌륭하게 들립니다!왜 다른 것이 필요할까요?그러나 잠시만요… FT가 종이에 들리는 것처럼 굉장하지만 고려해야 할 몇 가지 주의 사항이 있습니다.
"록스텝" 프로세스는 이상한 짐승입니다.특히 프로세서 측면에서 실행할 수 있는 서버 하드웨어 유형에 대해 매우 까다롭습니다.이 제한된 하드웨어 호환성 목록으로 인해 FT 솔루션은 관련 지원 및 서비스가 포함된 둘 이상의 FT 클러스터를 고려할 때 수십만 달러가 될 수 있는 가장 높은 비용 브래킷에 위치하게 됩니다.
소프트웨어 오류 취약성
FT 솔루션은 또한 하드웨어 내결함성을 염두에 두고 설계되었으며 잠재적인 애플리케이션 오류에 많은 관심을 기울이지 않습니다.FT 솔루션은 동일한 트랜잭션과 프로세스를 동시에 실행하므로 기본 서버에 애플리케이션 오류가 있는 경우 보조 서버에도 복제됩니다.
고가용성(HA)이란 무엇입니까?
대부분의 SLA에서 FT는 평균 사용 사례를 구매하고 관리하기에는 너무 비쌉니다.대부분의 경우 HA 솔루션이 더 나은 옵션입니다. 적은 비용으로 거의 동일한 수준의 보호 기능을 제공합니다.HA 솔루션은 Active-Standby 방식으로 배포하여 1년에 약 52분의 다운타임에 해당하는 99.99% SLA를 제공합니다.작업이 재개되기 전에 활성 서버가 대기 서버로 전환되어야 하는 짧은 기간의 가동 중지 시간이 있기 때문에 감소된 SLA가 도입되었습니다.좋습니다. 이것은 FT 솔루션만큼 인상적이지는 않지만 대부분의 IT 요구 사항에 대해 HA는 CRM 및 ERP 시스템과 같은 매우 중요한 응용 프로그램의 경우에도 SLA를 충족합니다.
마찬가지로 중요한 고가용성 솔루션은 애플리케이션에 구애받지 않으며 애플리케이션 장애 및 하드웨어 또는 OS 장애 발생 시 서버 장애 조치를 관리할 수도 있습니다. 또한 훨씬 더 많은 구성 유연성을 허용합니다.대부분의 경우 기본 OS가 지원되는 모든 플랫폼에서 실행되기 때문에 처리할 FT와 같은 하드웨어 호환성 목록이 없습니다.
재해 복구(DR)가 그림에 어떻게 들어맞습니까?
FT 및 HA와 마찬가지로 DR도 중요한 비즈니스 기능을 지원하는 데 사용할 수 있습니다. 그러나 DR은 FT 및 HA와 함께 사용할 수 있습니다.내결함성 및 고가용성은 데이터 센터(또는 클라우드 가용성 영역) 내와 같은 로컬 수준에서 가동 시간을 유지하는 데 중점을 둡니다.DR은 재해가 기본 데이터 센터에 충돌하는 경우 장애 조치할 중복 사이트 또는 데이터 센터를 제공합니다.
이 모든 것은 무엇을 의미합니까?
하루가 끝나면 취해야 할 잘못된 접근 방식이나 올바른 가용성 접근 방식이 없습니다.이는 보호하려는 비즈니스 프로세스의 중요성과 솔루션의 기본 경제성으로 귀결됩니다.일부 시나리오에서는 간단합니다.예를 들어, 원자력 발전소를 운영하고 있다면 중요한 작업이 FT 시스템으로 보호된다는 것이 더 편안할 것입니다. 그것을 직시하자, 당신은 아마 거기에서 서비스가 중단되는 것을 원하지 않을 것입니다.그러나 대부분의 IT 환경에서 중요한 가동 시간은 훨씬 더 소화 가능한 가격대로 HA와 함께 제공될 수도 있습니다.
선택 방법: FT, HA 및 DR?
- 무엇보다도 비즈니스 운영을 자세히 이해하고 다운타임 비용을 파악하십시오.
- SLA가 설정되면 잠재적인 다운타임 비용과 선택한 가용성 솔루션의 비용을 비교해 보십시오.
- 가용성 솔루션을 선택할 때는 배포 용이성과 사용 용이성을 고려하십시오. 이는 가용성 솔루션의 전체 TCO에도 영향을 미치기 때문입니다.
IT 시스템은 강력하지만 가장 불편한 시간에 잘못될 수 있습니다. FT, HA 및 DR은 이 즉각적이고 편리하게 주도되는 세상에서 고객에게 SLA를 제공할 때 귀하를 보호하는 보험 정책입니다.
의 허가를 받아 재생산 시오스