가용성 공식
가용성 방정식에 익숙합니까? 간단히 말해서,이 방정식은 애플리케이션을 가용성으로 복원하는 데 필요한 총 시간이 애플리케이션에 문제가 발생했음을 감지하는 데 필요한 시간과 복구 조치를 수행하는 데 필요한 시간을 합한 것과 같습니다.
TRESTORE = TDETECT + TRECOVER
고 가용성 솔루션의 주요 개념
이 수식에서는 고 가용성 (HA)의 핵심 개념 인 클러스터링, 문제 감지 및 후속 복구를 소개합니다. HA 솔루션은 비즈니스 응용 프로그램 구성 요소의 상태를 모니터링합니다. 문제가 발견되면 이러한 솔루션은 서비스를 복원합니다. 고 가용성 솔루션을 배포하는 목적은 다운 타임을 최소화하는 것입니다. 탐지 및 복구 시간을 줄이는 것은 배포하도록 선택한 모든 HA 솔루션의 두 가지 중요한 작업입니다. 오늘날의 응용 프로그램은 서버, 저장소, 네트워크 인프라 등 기술 조합입니다. HA 옵션을 검토 할 때 각 솔루션이 모든 중단 유형을 감지하고 복구하는 데 사용하는 기술을 이해해야합니다. 각 기술은 서비스 복원 시간에 직접적인 영향을 미칩니다.
로컬 검색 및 복구
고 가용성 솔루션은 간단합니다. 가능한 가장 빠른 복원 시간을 제공하는 데 중요한 기술 중 하나가 로컬 탐지 및 복구 (서비스 수준 문제 감지 및 복구라고도 함)입니다. 기본 클러스터링 솔루션에서는 서버가 연결됩니다. 서버 실패시 하나 이상의 서버가 다른 서버의 작업을 인계받을 수 있도록 구성됩니다. 클러스터의 서버 노드는 하트 비트 신호라고도하는 작은 데이터 패킷을 계속해서 보내고 이들이 "활성"상태임을 나타냅니다. 간단한 클러스터 환경에서 한 서버가 하트 비트 생성을 중지하면 다른 클러스터 구성원은이 서버가 다운 된 것으로 간주합니다. 그런 다음 해당 서버의 작동 도메인에 대한 책임을 인수하는 프로세스를 시작합니다. 이 접근 방식은 서버 수준에서 실패를 감지하는 데 적합합니다. 그러나 문제로 인해 하트 비트 신호가 중단되거나 중단되지 않으면 서버 수준의 탐지가 적절하지 않습니다. 그보다는 실제로 정전의 정도와 영향을 확대 할 수 있습니다. 예를 들어, Apache 프로세스가 중단되면 서버가 여전히 하트 비트를 보낼 수 있습니다. 웹 서버 서브 시스템이 주요 기능 수행을 중단하더라도. 동일한 서버 나 다른 서버에서 Apache 하위 시스템을 다시 시작하는 대신 기본 서버 수준 클러스터링 솔루션은 백업 서버에서 오류가 발생한 서버의 전체 소프트웨어 스택을 다시 시작하므로 사용자가 중단되고 복구 시간이 연장됩니다.
어떻게 작동 하는가?
로컬 검색 및 복구를 사용하는 고급 클러스터링 솔루션은 개별 클러스터 서버 내에 상태 모니터링 에이전트를 배포하여 파일 시스템, 데이터베이스, 사용자 수준 응용 프로그램, IP 주소 등과 같은 개별 시스템 구성 요소를 모니터링합니다. 이러한 에이전트는 모니터링되는 구성 요소에 특정한 휴리스틱을 사용합니다. 따라서 에이전트는 운영 문제를 예측하고 감지 한 다음 가장 적절한 복구 작업을 수행 할 수 있습니다. 대부분의 경우 가장 효율적인 복구 방법은 동일한 서버에서 문제가되는 하위 시스템을 중지했다가 다시 시작하는 것입니다. 동일한 물리적 서버 내에서 복구를 사용 가능하게함으로써 응용 프로그램을 사용자 가용성으로 복원하는 시간을 크게 줄일 수 있습니다. 또한 단순히 서버 수준의 하트 비트를 관찰하는 것보다 세분화 된 수준에서 오류를 감지합니다. Linux 용 SteelEye Protection Suite (예 : SIOS)와 같은 솔루션은 사용자 환경에 대해 이러한 수준의 탐지 및 복구를 제공합니다. 배포하는 HA 솔루션이 로컬 탐지 및 복구를 지원할 수 있는지 확인하십시오. 귀사의 프로젝트에 고 가용성 솔루션을 즐기시겠습니까? 우리와 함께 확인하십시오. 더 많은 참고 문헌이 필요합니다. 여기에는 성공 사례가 있습니다. Linux 클러스터링의 허락을 받아 재현