Date: 3월 8, 2022
고가용성 또는 고취약성? 고가용성을 위한 체크리스트
모든 규모의 기업에서 IT 시스템에 대한 수요가 계속 증가하고 있다는 것은 비밀이 아닙니다. 그러나 IT 시스템은 운영, 탄력성 및 고가용성인 경우에만 이러한 비즈니스와 고객에게 효과적입니다. 기업이 기업 가용성을 구축하려고 할 때 취약성을 평가하고 평가하기 위한 기준선을 갖추는 것이 인프라, 소프트웨어, 서비스 및 지원을 성공적으로 통합하여 성공을 증가시키는 차이가 될 수 있습니다.
때로는 가장 기본적인 체크리스트가 솔루션의 가용성 또는 취약성 여부를 분류하는 데 도움이 될 수 있습니까?
조직에 지원하기에 적절한 인프라가 있습니까? 고가용성 ?
- 데이터 센터에 건물 시스템을 측정하기 위한 환경 센서가 있습니까?
- 데이터 센터에 24x7x365 작업이 있습니까?
- 데이터 센터에 다양한 소스의 중복 전원 및 네트워크 연결이 포함되어 있습니까?
- 데이터 센터에 여러 계층의 호스트 및 스토리지 서비스가 포함되어 있습니까?
- 고객 경험 부사장으로서 저는 고객이 인프라 내에서 근본적인 근본적인 문제를 해결하지 않고 고가용성 솔루션을 만들려고 시도하는 것을 보았습니다.
그들은 소프트웨어를 배포하지만 네트워크 인프라, 서버 및 데이터 센터 자체 내에서 불안정합니다. 클라우드는 많은 인프라 문제를 해결하지만 모든 클라우드 플랫폼이 동일하게 설계되는 것은 아닙니다. 데이터 센터, 온프레미스 또는 클라우드를 이해해야 합니다.
조직에 디자인, 아키텍처 및 프로세스를 다루는 런북(또는 플레이북)이 있습니까?
- 런북이 잘 문서화되고 공개되며 쉽게 액세스할 수 있습니까?
- Runbook의 일상적인 부분이 충분히 자동화되어 있습니까?
- 누가 엔터프라이즈 Runbook에 액세스할 수 있습니까?
- 현재 유지되고 있습니까?
- Runbook 및 그 안에 포함된 자동화 도구에 대한 버전 제어가 있습니까?
런북 또는 플레이북이 무엇인지 대답했다면 첫 번째 단계는 런북 또는 플레이북을 찾거나 만드는 것입니다. Runbook(또는 플레이북)은 조직이 고가용성 시스템 아키텍처와 관련하여 시스템 및 프로세스를 유지 관리하는 데 도움이 됩니다. 일부 회사는 자동화된 도구를 사용하여 서버를 배포 및 구성하는 스크립트를 생성하고, 다른 회사는 버전 제어 문서를 사용하여 복원력과 성공을 제공하기 위해 모든 것이 함께 작동하는 방법을 설명합니다. 당신의 팀은 새로운 사람들과 기존 팀원들이 사용되는 환경, 프로세스 및 도구를 이해하기 위해 갈 수 있는 장소가 필요합니다.
조직에 고가용성 모범 사례를 유지하기 위한 전담 리소스가 있습니까?
- 귀하의 조직은 이러한 직원과 계약자에게 지원과 교육을 제공합니까?
- 조직에서 이러한 팀에 더 나은 모범 사례를 적용하고 생성할 수 있는 자율성을 부여합니까?
IT 관리자는 "이 시스템을 설정한 것이 아닙니다"라고 말했습니다. 애도는 정직하고 조직에서 자주 관찰되는 현상이었습니다. 인수합병, 비용 절감, 아웃소싱 또는 일반 직원 이직의 결과이든, 고가용성 기업의 핵심 구성 요소는 충분한 인력입니다. 매우 취약한 기업의 핵심은 인력 부족, 교육 부족 또는 지원 부족입니다.
조직에 적절한 변경 관리 제어 기능이 있습니까?
- 정기적인 업데이트 정책과 일정이 있습니까?
- 패치 유지 관리에 대해 정의된 프로세스가 있습니까?
- 패치(취약점, 위협 등)에 대한 검토 프로세스가 있습니까?
변경 관리가 중요합니다. 변경 관리 제어 및 정책은 위험을 줄이고 시스템을 사용할 수 있도록 하는 데 절대적으로 필요합니다. 적절한 제한이 없는 사용자는 안정성을 파괴하는 패키지 또는 업데이트를 추가하거나 몇 시간 동안 조직을 방해하는 변경을 수행할 수 있습니다. 또한 정의된 정책이 없으면 종종 예상(문서화)과 실제(적소에 있는) 사이에 드리프트가 발생합니다. 변경 관리는 또한 대기 클러스터가 기본/소스 시스템과 동일한 패치 및 소프트웨어 수준에 있고 QA(또는 사전 프로덕션)가 프로덕션에서 크게 벗어나지 않도록 하는 데 중요합니다.
조직에 적절한 액세스 제어가 있습니까?
- 서버 관리를 위한 계정 관리 계층이 있습니까?
- 우발적인 다운타임을 방지하기 위한 제어 장치가 있습니까?
우리 서비스 팀은 고객 통화에 참여하여 소프트웨어를 구성 및 업데이트하기 위해 세션에 참여하기 위해 일련의 상승된 명령을 실행할 수 있는 권한이 있는 관리자를 기다리고 기다리고 기다렸습니다. 몇 주 후, 우리 팀은 다른 고객 통화에 합류했고 모두 관리 권한이 있는 여러 사용자가 동일한 클러스터에서 수많은 명령을 실행하는 것을 공포에 떨었습니다. 두 호출의 차이점은 액세스 제어가 중요하다는 것을 놀랍도록 명확하게 지적했습니다. 고가용성 기업은 구성을 손상시키거나 작업을 감소시킬 수 있는 상승된 명령을 사용자가 실행하지 못하도록 적절한 액세스 제어가 마련되어 있는지 확인해야 합니다. 사용자가 자신의 역할, 요구 사항 및 경험에 따라 수행할 수 있는 작업에 제한이 있는지 확인합니다.
회사에 정기적인 테스트 프로세스가 있습니까?
- 귀사는 프로덕션 전에 사전 프로덕션 또는 QA 환경에서 테스트합니까?
- 조직에서 정기적인 백업 및 백업 테스트를 수행합니까?
- 조직에서 지속적인 개선을 위해 재해 복구 시나리오와 혼돈 테스트를 실행하고 있습니까?
테스트에는 시간이 걸리지만 고객의 클라우드 마이그레이션 및 고가용성 배포 , 시간은 항상 잘 보냈습니다. 종종 고가용성과 취약성의 차이는 고객이나 파트너의 테스트 프로세스로 귀결될 수 있습니다. 솔루션이 더욱 복잡해짐에 따라 위험과 취약성을 줄이기 위해 테스트와 검증이 점점 더 중요해지고 있습니다. 모든 것이 설계에서 생산에 이르는 경우 매우 취약한 시스템을 실행하고 있는 것입니다. 그러나 테스트와 체크포인트가 있는 경우 프로덕션에 적용하기 전에 변경 사항을 확인하는 프로세스가 크게 줄어듭니다. 고객 경험 담당 부사장으로서 우리 서비스 팀은 실제 마이그레이션을 완료하기 전에 QA에서 1년 내내 시스템을 배포한 배너 고객과 협력했습니다. 그 해 동안 그들은 정전, 재해, 고객 부하, 가동 중지 시간, 유지 관리, 패치 전략, 백업, 백업에서 복구 및 기타 여러 테스트 제품군을 시뮬레이션했습니다. 결과적으로 성능, 프로세스 준수, 고가용성 및 기업 성공에서 놀라운 결과를 얻었습니다.
고가용성의 모든 잠재적인 취약점을 다룰 수 있는 체크리스트는 없지만 이러한 질문에 답하면 기업이 고가용성인지 아니면 매우 취약한지 이해하기 위한 강력한 토대가 됩니다.
의 허가를 받아 재생산 시오스