Date: 11월 20, 2022
단순한 HA 및 DR 시대는 지났습니다.
TV 채널을 넘기다가 Drew Barrymore와 함께한 영화 "He's Just Not That Into You"의 한 장면을 우연히 발견했습니다. 하나의 전화번호와 하나의 자동응답기가 있었고 그 자동응답기 하나에는 카세트테이프 하나가 있었고 그 카세트테이프 하나에는 남자가 보낸 메시지가 있거나 없었습니다. 이제 7가지 다른 기술에 의해 거부당하기 위해 이 모든 다른 포털을 확인하기만 하면 됩니다. 지쳤어.” 때로는 클라우드가 하나만 있거나 클라우드 플랫폼이 없기를 바라지 마십시오. 하나의 OS에서 실행되는 하나의 DB; 걱정할 프런트 엔드 애플리케이션만 있으면 됩니다. 그러나 세상은 변했고 더 빠르게 움직이고 있으며 더 복잡해지고 있습니다.기술의 발전, 인수합병의 결과, 수십억 명의 소비자가 최신 거래와 최고의 경험을 찾는 연중무휴 24시간 사회의 증가하는 욕구와 속도는 단순한 날이 사라 졌다는 것을 의미합니다.
가용성에 대한 4가지 어려운 진실
- 귀하의 솔루션은 생각만큼 간단하지 않습니다
물론 기업 환경은 단순하지 않습니다.펀치 카드 이후로 거의 존재해 온 레거시 시스템과 애플리케이션이 있습니다.차세대 애플리케이션 및 데이터베이스용으로 만들어진 새로운 시스템이 있습니다.또한 한 플랫폼에서 다른 플랫폼으로 마이그레이션하는 사이의 간격을 메우거나 시간을 맞추기 위해 10년 전에 만든 솔루션이 있지만 최선의 노력에도 불구하고 이러한 시스템은 남아 있습니다. 이러한 문제에 U 회사의 인수 합병으로 인해 증가하는 시스템 및 IT 리소스 세트가 추가되었습니다. 새로운 시대에 HA를 제공하는 것은 생각만큼 간단하지 않습니다.
- 잘못된 아키텍처는 생각보다 더 큰 문제입니다.
고객 경험 부사장으로서 잘못된 아키텍처로 인한 피해를 목격했습니다.HA 소프트웨어를 배포하면 응용 프로그램과 데이터베이스의 가용성을 개선하는 데 확실히 도움이 될 수 있지만 HA 소프트웨어는 불완전한 요구 사항, 빈약한 네트워킹, 중복 하드웨어 부족 또는 기타 누락된 아키텍처 구성 요소를 완전히 극복할 수 없습니다.우리 팀은 피크 운영 시간 동안 시스템을 불안정하게 만드는 작은 규모의 환경을 수정하기 위해 고객과 협력한 적이 있습니다.네트워킹 및 하드웨어 불안정성을 포함하는 잘못된 아키텍처로 인해 팀은 종종 피할 수 있는 다운타임 문제를 복구하기 위해 허둥지둥하는 자신을 발견했습니다.완전하고 건전하며 가용성이 높고 탄력적인 솔루션을 갖추려면 건전한 아키텍처의 일부로 훌륭한 소프트웨어를 배포해야 합니다.
- 관리자는 인정하는 것보다 더 많은 도움이 필요합니다.
성장 가능성이 있는 견고한 아키텍처를 기반으로 구축된 엔터프라이즈급 고가용성 탄력적 HA 솔루션을 개발하는 것은 간단한 프로세스가 아닙니다.복원력, 애플리케이션 및 데이터 가용성을 위한 설계 및 설계는 선반에서 케이크 믹스 상자를 집는 것만큼 쉽지 않습니다.다양한 도구, 여러 팀의 프로세스, SLA 혼합, 다양한 OS, 애플리케이션, 데이터베이스 및 플랫폼을 투입하면 도움이 필요한 레시피를 갖게 됩니다. 최근에 저는 엔터프라이즈 지원 환경에서 일하는 20년 베테랑을 인터뷰했습니다.그는 얼마나 많은 동료들, 심지어는 자신도 중요한 엔터프라이즈 가용성 유지의 무게를 감당할 수 없었는지 설명했습니다.관리자는 치명적인 다중 시스템, 다중 애플리케이션, 거의 완전한 데이터 센터 붕괴를 처리하기 위해 새벽 2시 이후로 깨어 있을 때 도움이 필요할 뿐만 아니라, 기술적으로 복잡한 시대.
- 귀하의 솔루션은 귀하가 생각하는 것만큼 가용성이 높지 않을 수 있습니다.
"퍼블릭 클라우드 공급자는 일반적으로 서비스 수준 계약에서 일정 수준의 가용성을 보장하지만 이러한 SLA는 클라우드 하드웨어에만 적용됩니다." 다음을 포함하여 클라우드 공급자 SLA가 적용되지 않는 애플리케이션 가동 중지에 대한 다른 많은 이유가 있습니다.
- 소프트웨어 문제 및 버그
- 인적 오류
- 소프트웨어 오류
- 시스템 또는 애플리케이션 중단
고객 경험 부사장으로서 재귀 루틴의 종료 실패로 인한 서비스 거부 공격, 시스템 고갈, 건전하고 중요한 애플리케이션의 보안 소프트웨어 격리, 커널 패닉, 임의로 재부팅합니다.HA 전략이 하이퍼바이저의 SLA에만 의존하는 경우 솔루션의 가용성이 생각만큼 높지 않을 수 있습니다. 중요한 애플리케이션을 다음과 같이 보호해야 합니다. 클러스터링 소프트웨어 문제를 모니터링 및 감지하고 문제에 안정적으로 대응하며 필요한 경우 작업을 대기 서버로 이동하여 제품과 서비스가 필요할 때 언제 어디서나 안정적이고 사용할 수 있도록 합니다.
우리의 단일 데이터 센터는 수십 개의 데이터 센터에 걸쳐 있는 일련의 클라우드 플랫폼이 되었습니다.우리의 스컹크 작업 애플리케이션은 Windows, Linux 및 몇 가지 다른 *Nix 변종에서 관리해야 하는 중요한 프런트 엔드, 미들웨어 및 백엔드 솔루션의 일부가 되었습니다.기술의 행진은 우리의 고가용성 더 복잡해지고 더 나은 아키텍처가 필요합니다.이는 또한 우리 팀이 모든 것을 관리하는 데 더 많은 도움이 필요하다는 것을 의미하며, 주의하지 않으면 우리가 취약하고 노출된 상태로 남아 있음을 의미할 수 있습니다.네 가지 진실 중 팀이 가장 직면하고 있는 것은 무엇입니까?
Cassius Rhue, VP 고객 경험 시오스