Date: 4월 3, 2025
저장소가 없거나 노드가 없는 쿼럼이 클러스터 가용성에 위험한 이유는 무엇입니까?
일반적으로 정족수란 의사 결정을 위해 참석한 사람들의 단체나 집단을 말합니다.
LifeKeeper에서 Quorum은 클러스터 내의 노드 장애를 처리하는 다음 단계를 수행하기 위해 클러스터의 노드 상태를 사용하는 합의를 시행합니다. LifeKeeper쿼럼은 3가지 모드로 작동 가능합니다.; 저장소, 다수 및 TCP 원격(TCP 원격은 Linux용 LifeKeeper에서만 사용 가능).
- 저장소 Quorum은 공유 저장 장치를 사용하여 클러스터 내의 다른 시스템에서 제공한 업데이트를 추적합니다. 시스템에서 업데이트를 제공하지 않으면 Quorum은 해당 클러스터를 실패로 표시합니다.
- 다수결 쿼럼은 홀수의 클러스터 구조에 의존합니다., 한 노드가 클러스터의 한 노드 또는 모든 노드가 통신할 수 없는지 확인하기 위한 증인 역할을 하는 경우
- 지정된 포트의 TCP/IP 서비스를 통한 TCP 원격 연결을 통해 클러스터의 노드가 서로 통신할 수 있는지 확인합니다.
클러스터에서 쿼럼의 중요성 이해
Quorum의 목적은 계획되지 않은 상황을 탐색하기 위한 시정 조치를 취하여 애플리케이션의 가용성을 유지하는 것입니다. 이는 스플릿 브레인 상황의 위험을 줄이고 클러스터의 모든 노드 간 통신을 유지하여 다운타임을 줄임으로써 이를 달성합니다.
클러스터에서 쿼럼 없이 작동할 경우의 위험
Quorum 없이 구성된 클러스터를 사용할 경우 위험이 따릅니다. 다음 시나리오에서는 쿼럼이 없는 효과와 이를 구현하는 것의 중요성을 다룹니다.
시나리오 1: 다운타임 감소
예를 들어, 네트워크 통신의 충돌이나 일시적인 장애와 같은 피할 수 없는 상황으로 인해 하나 이상의 시스템을 사용할 수 없게 되면 의도치 않은 가동 중지가 발생할 수 있습니다.
저장소와 같은 쿼럼을 사용하여또는 TCP 원격 구성, 스토리지 장치 및/또는 포트에 대한 액세스를 사용하여 클러스터의 통신 상태를 추적할 수 있습니다. 이 추가 조치는 상당한 다운타임을 일으킬 수 있는 불필요한 장애 조치를 방지할 수 있습니다. 다른 경우 Quorum은 서버를 종료하거나 재부팅하여 정상 상태로 복원하고 더 긴 다운타임을 방지하는 조치를 취합니다.
시나리오 2: 분할된 뇌
에이분할 뇌클러스터의 여러 시스템이 자신이 기본 서버라고 믿는 경우입니다. 이는 기본 서버가 보조 서버와 통신이 끊어지고 보조 서버가 기본 시스템이 다운되었다고 믿을 때 발생할 수 있습니다. 이로 인해 클러스터에 두 개의 활성 기본 시스템이 생깁니다.
다수결 정족수가 구성된 경우, 다른 시스템이 투표 역할을 하는 증인으로 프로비저닝되어 어느 시스템이 기본 시스템으로 작동해야 하는지 결정하므로 분할 브레인이 발생하는 것을 방지할 수 있습니다.
적절한 쿼럼 구성이 중요한 이유
클러스터 작동저장소 또는 과반수 쿼럼이 없으면 스플릿 브레인 및/또는 네트워크 중단으로 인해 데이터 손실 또는 장기 다운타임이 발생할 위험이 높아지므로 위험합니다. Quroum을 사용하면 클러스터가 항상 정상 상태이고 정상이 아닌 시스템이 적절하게 처리되도록 하여 대응책을 제공할 수 있습니다.
오늘 SIOS에 연락하세요고가용성 솔루션이 쿼럼을 올바르게 구성하고 클러스터를 보호하는 데 어떻게 도움이 될 수 있는지 알아보세요.
저자: SIOS Technology Corp.의 고객 경험 소프트웨어 엔지니어, Alexus Gore
허가를 받아 재생산되었습니다.시오스