Date: 5월 12, 2020
사례 연구: 크리스 오브라이언 라이프하우스 병원, SIOS 데이터키퍼를 통해 AWS 클라우드의 고가용성 보장
SIOS는 고가용성과 고성능을 모두 제공할 수 있는 능력으로 선정되었습니다.
크리스 오브라이언 라이프하우스(www.mylifehouse.org.au)는 희귀하고 복잡한 암 을 앓고 있는 환자를 위한 최첨단 치료 및 연구를 전문으로 하는 통합되고 집중적인 우수성센터입니다. Lifehouse는 고급 종양학 수술, 화학 요법, 방사선 요법, 임상 시험, 연구, 교육, 보완 요법 및 심리 사회적 지원을 포함하여 암 환자가 한 곳에서 필요로 할 수있는 모든 것을 제공합니다. 로얄 프린스 알프레드 병원과 캠퍼 다운에있는 시드니 대학과 함께 위치한 비영리 병원은 검진, 진단 및 치료를 위해 매년 40,000 명 이상의 환자를 봅니다. 호주 에서 가장 큰 임상 시험 센터 중 하나인 Lifehouse는 또한 환자에게 세계 최신 암 치료 혁신에 대한 액세스를 제공합니다.
환경
Lifehouse는 모든 환자에 대한 전자 건강 기록을 데이터베이스에 저장하는 MEDITECH 의료 전자 의료 기록 및 환자 관리 시스템을 사용합니다.
"건강 정보 시스템 및 데이터베이스는 우리가 제공하는 배려에 생명이고, 어느 쪽이든 내려가면, 참을성 있는 기록은 접근할 수 없을 것이고, 병원의 운영을 마비시킬 것입니다," 피터 싱어, Lifehouse에 있는 이사 정보 기술 설명합니다.
병원의 데이터 센터에서는 SAN(스토리지 영역 네트워크)에서 실행되는 WSFC(Windows 서버 장애 조치 클러스터링)에서 미션 크리티컬 한 가동 시간을 제공했습니다. 그러나 많은 조직과 마찬가지로 Lifehouse는 우수한 민첩성과 경제성을 활용하기 위해 클라우드로 마이그레이션하기를 원했습니다.
도전과제
Lifehouse는 Amazon Web Services를 클라우드 서비스 제공업체로 선택했으며, AWS 클라우드로 직접 환경을 "리프트 및 전환"하기를 희망했습니다. 온-프레미스 구성을 시뮬레이션하기 위해 Peter는 AWS 마켓플레이스에서 사용할 수 있는 "클라우드 볼륨" 서비스를 선택했습니다. 장애 조치 클러스터는 소프트웨어 정의 스토리지 볼륨을 사용하여 활성 인스턴스와 대기 인스턴스 간에 데이터를 공유하도록 구성되었으며, 테스트 결과 병원의 까다로운 복구 지점 및 복구 시간 목표를 충족하는 데 필요한 자동 장애 조치(failover)를 제공할 수 있음을 테스트했습니다.
그러나 소프트웨어 정의 클라우드 볼륨의 사용은 처리량 성능에 상당한 부정적인 영향을 미쳤습니다. 요소가 많고 계층이 관련되어 있으므로 클라우드에 배포된 소프트웨어 정의 구성에서 성능 문제를 해결하기가 매우 어렵습니다. "보호 없음" 옵션을 지정하면 클라우드 볼륨이 잘 수행되었습니다. 그러나 SIOS 데이터 키퍼를 통해 AWS 클라우드에서 고가용성을 보장하는 크리스 오브라이언 라이프하우스의 "보호 없음"은 실제로 선택사항이 아니었습니다.
"우리는 며칠 만에 테스트에서 생산으로 나아갈 수 있었습니다. 지속적인 유지 관리는 매우 간단하며, 고가용성 및 재해 복구와 관련된 운영 비용을 최소화할 것으로 기대합니다." 미션 크리티컬 MEDITECH 응용 프로그램 및 데이터베이스를 담당하는 Peter는 말했습니다. Peter는 "근본 원인을 찾고 해결하기 위해 모든 합당한 노력을 기울였으며, 결국 소프트웨어 정의 스토리지가 필요한 처리량 성능을 제공할 수 없다는 결론을 내렸습니다." 그래서 Lifehouse팀은 다른 해결책을 찾기 시작했습니다.
평가
Lifehouse는 고가용성과 고성능을 모두 제공할 수 있는 다른 솔루션을 찾기 위해 다음과 같은 세 가지 기준을 수립했습니다.
- AWS 클라우드에서 사용하기 위한 유효성 검사
- 여러 가용성 영역에서 작업할 수 있는 기능
- 온-프레미스에서 달성한 성능보다 좋거나 더 나은 성능
- 모션 및 미사용 암호화를 지원하는 보안/ 개인 정보 보호
유효성 검사는 클라우드에서 타사 솔루션을 사용하는 것과 관련된 위험을 최소화하는 데 중요했습니다. 여러 가용성 영역에서 작업할 수 있는 기능은 전체 AWS 데이터 센터가 지역화된 재해의 영향을 받는 경우 비즈니스 연속성을 보장합니다. 가용성 영역 간에 AWS가 제공하는 밀리초 이하의 대기 시간은 병원의 까다로운 복구 시간 및 복구 지점 목표를 충족하기 위해 데이터를 "핫" 대기 인스턴스에 동기로 복제할 수 있어야 합니다.
철저한 검색을 수행한 후 Peter는 사용 가능한 최상의 솔루션이 SIOS 기술의 SIOS 데이터키퍼 클러스터 에디션이라고 결론을 내렸습니다. SIOS DataKeeper는 AWS 마켓플레이스에서 사용할 수 있었으며, AWS 클라우드에서 안정적으로 작동하는 것이 입증되었습니다. 또한 소프트웨어 정의 스토리지를 사용하지 않았기 때문에 Peter는 SIOS DataKeeper가 Lifehouse에 필요한 성능을 제공할 수 있을 것이라고 확신했습니다.
솔루션
SIOS DataKeeper는 Lifehouse에 필요한 고성능 동기 데이터 복제를 제공합니다. 이 솔루션은 모든 활성 인스턴스와 대기 인스턴스에 연결된 로컬 저장소 간에 실시간 블록 레벨 데이터 미러링을 사용하여 소프트웨어 정의 스토리지를 괴롭히는 성능 저하를 포함하여 클라우드에서 SAN이 부족하여 발생하는 문제를 극복합니다. 결과 SANless 클러스터는 Windows 서버 장애 조치 클러스터링과 호환되며 응용 프로그램 및 데이터베이스 수준에서 오류를 검색하기 위한 지속적인 모니터링을 제공하며 장애 조치 및 장애 복구에 대한 구성 가능한 정책을 제공합니다.
Lifehouse는 현재 광범위한 재해로부터 보호하기 위해 다양한 AWS 가용성 영역에서 MEDITECH 애플리케이션 및 데이터베이스를 지원하기 위해 SANless 장애 조치 클러스터에 8개의 인스턴스를 보유하고 있습니다. 일반적으로 관련된 장거리에 내재된 대기 시간은 데이터베이스의 활성 인스턴스에 대한 커밋이 지연되지 않도록 비동기 데이터 복제를 사용해야 합니다. 그러나 SIOS DataKeeper에 사용되는 실시간 블록 레벨 데이터 미러링 기술은 여전히 Peter Singer가 거의 제로에 가까운 복구 지점을 달성할 수 있게 합니다.
결과
소프트웨어 정의 공유 스토리지와 달리 SIOS DataKeeper는 고성능 고가용성을 위해 특별히 제작되었으므로 클라우드 기반 구성이 필요에 따라 작동한다는 사실은 Peter Singer에게 놀라운 일이 아닙니다. 다소 놀라운 점은 솔루션이 구현하고 운영하는 것이 얼마나 쉬운지였습니다: "우리는 며칠 만에 테스트에서 생산으로 나아갈 수 있었습니다. 지속적인 유지 보수도 매우 간단하므로 고가용성 및 재해 복구와 관련된 운영 비용을 최소화할 수 있을 것으로 기대합니다."
SIOS DataKeeper는 Lifehouse가 가동 시간이나 성능을 희생하지 않고도 클라우드에서 제공하는 규모의 경제를 최대한 활용할 수 있도록 했습니다. 피터 싱어는 "SIOS가 아니었다면 환경을 클라우드로 마이그레이션하지 못했을 것입니다.