Date: 2월 14, 2021
태그: SQL Server 장애 조치 (Failover) 클러스터 인스턴스
SQL Server 장애 조치 클러스터 인스턴스에 Amazon FSX 사용-알아야 할 사항!
AWS EC2에 자체 Microsoft SQL Server 인스턴스를 배포하려는 경우 솔루션의 복원력과 관련하여 몇 가지 결정을 내릴 수 있습니다. 물론, 서로 다른 가용 영역에 두 개 이상의 인스턴스를 배포하는 경우 AWS는 컴퓨팅 리소스에 대해 99.99 % SLA를 제공합니다. 그러나 속지 마십시오. 진정한 애플리케이션 가용성을 계산할 때 고려해야 할 다른 많은 요소가 있습니다. 최근에 클라우드에서 애플리케이션 가용성을 계산하는 방법에 대해 블로그에 올렸습니다. 계속 진행하기 전에 해당 기사를 빨리 읽어야 할 것입니다.
Microsoft SQL Server 인스턴스의 고 가용성을 보장하는 데 있어서는 Always On 가용성 그룹 (AG) 또는 SQL Server 장애 조치 클러스터 인스턴스 (FCI)의 두 가지 기본 선택이 있습니다. 이 기사를 읽고 있다면이 두 가지 옵션을 모두 잘 알고 있으며 SQL Server Always On AG 대신 SQL Server 장애 조치 클러스터 인스턴스를 사용하는 것을 진지하게 고려하고 있다고 가정하고 있습니다.
Microsoft SQL Server 장애 조치 클러스터 인스턴스의 이점
다음 목록은 AWS가 SQL Server FCI의 이점이라고 말하는 내용을 요약 한 것입니다.
FCI는 일반적으로 다음이 사용 사례의 우선 순위 문제인 경우 SQL Server 고 가용성 배포의 경우 AG보다 선호됩니다.
라이선스 비용 효율성 : AG를 실행하려면 SQL Server의 Enterprise Edition 라이선스가 필요하지만 FCI를 실행하려면 Standard Edition 라이선스 만 필요합니다. 이는 일반적으로 Enterprise Edition보다 50-60 % 저렴합니다. SQL Server 2016부터 Standard Edition에서 AG의 기본 버전을 실행할 수 있지만 AG 당 하나의 데이터베이스 만 지원하는 제한이 있습니다. 이는 SharePoint와 같은 여러 데이터베이스가 필요한 응용 프로그램을 처리 할 때 문제가 될 수 있습니다.
인스턴스 수준 보호 대 데이터베이스 수준 보호 : FCI를 사용하면 전체 인스턴스가 보호됩니다. 기본 노드를 사용할 수 없게되면 전체 인스턴스가 대기 노드로 이동됩니다. 이는 공유 저장소에 물리적으로 저장되는 시스템 데이터베이스에 저장된 SQL Server 로그인, SQL Server 에이전트 작업, 인증서 등을 처리합니다. 반면 AG에서는 그룹의 데이터베이스 만 보호되고 시스템 데이터베이스는 AG에 추가 될 수 없으며 사용자 데이터베이스 만 허용됩니다. 모든 AG 복제본의 시스템 개체에 대한 변경 사항을 복제하는 것은 데이터베이스 관리자의 책임입니다. 이로 인해 인적 오류가 발생하여 데이터베이스가 애플리케이션에 액세스 할 수 없게됩니다.
DTC 기능 지원 : SQL Server 2012 또는 2014를 사용하고 애플리케이션에서 DTC (Distributed Transaction Coordinator)를 사용하는 경우 AG가 지원되지 않으므로 사용할 수 없습니다. 이 상황에서 FCI를 사용하십시오.
클라우드에서 FCI의 과제
물론이야. 가용성 영역에 걸쳐있는 FCI를 구축하는 데있어 문제는 일반적으로 필요한 공유 저장 장치가 없다는 것입니다. 클러스터의 노드가 여러 데이터 센터에 분산되어 있기 때문에 기존 SAN은 공유 스토리지를위한 실행 가능한 옵션이 아닙니다. 따라서 클러스터 스토리지에는 SIOS DataKeeper와 같은 타사 스토리지 클래스 리소스 또는 새로운 Amazon FSx라는 두 가지 선택이 있습니다.
선택하기 전에 알아야 할 사항을 살펴 보겠습니다.
서비스 수준 계약
애플리케이션 가용성 계산 방법에서 작성한 것처럼 전체 애플리케이션 SLA는 가장 취약한 링크만큼만 좋습니다. 이 경우 99.9 %의 FSx SLA입니다.
일반적으로 99.99 % 가용성은 "고 가용성"으로 간주되는 시작점을 나타냅니다. 두 개 이상의 가용 영역에 배포 될 때 AWS가 컴퓨팅 리소스에 대해 약속하는 것입니다.
3 개의 9와 4 개의 9의 차이를 몰랐다면…
- 99.9 % 가용성으로 매월 43.83 분의 다운 타임 가능
- 99.99 %의 가용성으로 매월 4.38 분의 다운 타임 만 허용
99.99 %의 컴퓨팅 가용성에도 불구하고 FSx에서 클러스터 스토리지를 호스팅하면 전체 애플리케이션 가용성이 99.9 %가됩니다. 반대로 DataKeeper 배포와 같이 가용성 영역에 걸쳐있는 EBS 볼륨은 스토리지 및 컴퓨팅 계층 모두에서 99.99 % SLA를 충족합니다. 이는 전체 애플리케이션 가용성이 99.99 %임을 의미합니다.
저장 위치
고 가용성을 위해 FSx를 구성 할 때 다중 AZ 지원을 사용하는 것이 좋습니다. 다중 AZ를 활성화하면 효과적으로 "선호"AZ와 "대기"AZ를 갖게됩니다. SQL Server FCI 노드를 배포 할 때 해당 노드를 동일한 AZ에 배포하려고합니다.
이제 정상적인 상황에서 활성 클러스터 노드가 기본 FSx 스토리지 노드와 동일한 AZ에 있는지 확인해야합니다. 이는 스토리지의 거리와 대기 시간을 최소화하기위한 것입니다. 또한 AZ 간의 데이터 전송과 관련된 비용을 최소화합니다. FSx 가격 가이드에 명시된대로 '파일 시스템에 대한 AZ 간 또는 리전 간 액세스에는 표준 데이터 전송 요금이 적용됩니다.'
SQL Server FCI 오류가 있지만 FSx 오류가 아닌 불행한 상황에서는 저장소와 컴퓨팅을 함께 연결할 메커니즘이 없습니다. FSx가 장애 조치되는 경우 자동으로 기본 가용성 영역으로 장애 조치됩니다. 그러나 모범 사례에 따르면 근본 원인 분석이 수행되고 일반적으로 유지 관리 기간 동안 장애 복구가 발생하도록 예약 될 때까지 보조 노드에서 SQL FCI가 계속 실행됩니다. 이로 인해 스토리지가 다른 AZ에 상주하여 추가 비용이 발생하는 상황이 발생합니다. 현재 수신 및 송신 모두 AZ에서 데이터를 전송하는 비용은 GB 당 $ 0.01입니다.
FSx 및 SQL Server FCI의 상태를 면밀히 주시하지 않으면 월말에 데이터 전송 요금이 표시 될 때까지 다른 지역에서 실행되고 있다는 사실을 알지 못할 수도 있습니다.
반대로 SIOS DataKeeper를 사용하는 구성에서 저장소 장애 조치는 SQL Server FCI 복구의 일부이므로 저장소가 항상 SQL Server 인스턴스로 장애 조치를 수행하도록합니다. 이렇게하면 SQL Server가 항상 활성 노드에 직접 연결된 EBS 볼륨을 읽고 쓸 수 있습니다. DataKeeper는 AZ 또는 리전간에 복제되는 쓰기 작업과 관련된 데이터 전송 비용을 발생시킵니다. 이 데이터 전송 비용은 DataKeeper에서 사용 가능한 압축을 사용하여 최소화 할 수 있습니다.
장애 조치 제어
FSx 다중 서브넷 구성에는 선호 가용성 영역과 대기 가용성이 있습니다. 선호 가용성 영역의 FSx 파일 서버에 오류가 발생하면 대기 AZ의 파일 서버가 복구됩니다. AWS는이 복구 시간이 표준 공유의 경우 약 30 초가 걸린다고보고합니다. 지속적으로 사용 가능한 파일 공유를 사용하여 Microsoft는이 장애 조치 시간이 15 초에 가까울 수 있다고보고합니다. 이 페일 오버 시간 동안 읽기 및 쓰기가 일시 중지 된 브라운 아웃이 발생하지만 복구가 완료되면 계속됩니다.
FSx 다중 사이트에는 자동 장애 복구가 활성화되어 있습니다. 즉, FSx의 계획되지 않은 모든 장애 조치에 대해 계획되지 않은 장애 복구도 발생합니다. 대조적으로, 일반적으로 SQL Server FCI에 계획되지 않은 장애 조치가 발생하면 보조 서버에서 실행 상태로 두거나 몇 시간 후 또는 다음 유지 관리 기간 동안 장애 복구를 예약합니다.
FSX에서 지원되지 않는 SQL SERVER ANALYSIS SERVICES CLUSTER
SSAS를 클러스터링하려면 SIOS DataKeeper와 같은 클러스터 된 디스크 리소스가 필요합니다. SQL Server Analysis Server를 클러스터링하는 방법 백서에는 SMB를 사용할 수 없으며 드라이브 문자가있는 클러스터 드라이브를 사용해야한다고 명시되어 있습니다. 반대로 DataKeeper Volume 리소스는 자체적으로 클러스터 된 디스크로 표시되며 SSAS와 함께 사용할 수 있습니다.
요약
FSx는 Windows 사용자 파일 및 99.9 % 가용성 SLA로 충분한 기타 중요하지 않은 서비스와 같은 일반적인 SMB 사용에 확실히 적합 할 수 있지만, 애플리케이션에 고 가용성 (99.99 %) 또는 확장되는 HA / DR 솔루션이 필요한 경우 FSx는 탁월한 옵션입니다. SIOS DataKeeper가 적합합니다.