Date: 4월 24, 2023
더 나은 고가용성 클러스터 유지 관리를 위해 고려해야 할 10가지 질문
유지 보수는 모든 회사의 수명 주기의 일부입니다. 모든 인프라는 지속적으로 이동하고 변화하며 수명이 다해가는 인프라도 마찬가지입니다. 귀하의 팀은 귀하가 과거에 수행한 작업을 수행하여 많은 성공을 거두었을 가능성이 높지만 시스템이 점점 더 복잡해짐에 따라 과거에 성공했다고 생각했던 작업을 새로 고칠 필요가 있을 수 있습니다. 다음은 개선해야 할 10가지 질문입니다.클러스터 유지 관리, 최대화고가용성, 가동 중지 시간을 최소화합니다.
시스템 유지 관리 중 고가용성을 보장하는 방법
- 비즈니스 이해 관계자에게 가장 좋은 날은 언제입니까?
계획되지 않은 다운타임과는 달리 여러 팀, 시스템 및 상호 연결된 리소스를 계획된 활동에 사용할 수 없는 기간입니다. 예를 들어, 한 회사는 매월 시스템 규정 준수 검사 및 안전 검사를 수행해야 합니다. 이 시간 동안 사업 운영은 검사관, 감사관 등에 의해 폐쇄됩니다.
- 팀에서 유지 관리 일정을 잡기에 가장 좋은 날짜는 언제입니까?
고객 경험 담당 부사장으로서 우리는 특정 이벤트 및 활동에 대한 제한 날짜가 있는 여러 팀과 긴밀히 협력했습니다. 귀하의 팀은 둘 이상의 시스템 및 서버 집합을 담당하고 중요한 응용 프로그램 및 인프라를 사용하여 여러 팀에 보고할 수 있습니다. 팀에 가장 적합한 날짜를 이해하면 알려진 리소스 제약으로 인한 주의 산만, 충돌 및 시간 손실을 방지하는 데 도움이 됩니다.
- 파트너, 컨설턴트 및 비회사 계약자와 가장 잘 맞는 날짜와 시간은 무엇입니까?
중요 인프라에는 일반적으로 회사의 인력과 직접적인 관련이 없는 다른 많은 공급자 및 공급업체가 포함됩니다. 이러한 리소스에는 OS, 보안 및 HA 공급업체와 컨설턴트는 물론 인프라 제공업체 및 기타 파트너의 설계자가 포함됩니다. 지원 계층에 가장 적합한 날짜 또는 포함되는 날짜를 미리 이해하는 것은 적절한 일정 및 인력 배치에 중요합니다.
이러한 모든 리소스에 대한 적절한 시간을 찾는 글로벌 팀이 증가함에 따라 대답해야 할 또 다른 중요한 질문이 있습니다. EST, IST, EMEA 및 기타 지역의 리소스에 가장 적합한 시간은 언제입니까?
- 유지 보수의 의도된 범위는 무엇입니까? 유지보수 활동에서 원하는 결과는 무엇입니까? 종합적으로 생각하십시오.
실행 중인 전체 환경을 포함하도록 응용 프로그램의 단순한 유지 관리를 넘어 생각하십시오. 최근에 애플리케이션 업그레이드를 계획 중이던 한 고객이 동시에 OS 업그레이드를 결정했습니다. 불행하게도, 이러한 범위의 약간의 변화는 예상보다 더 큰 결과를 가져왔습니다. 그들의 응용 프로그램은 새로 업그레이드된 OS를 지원하지 않아 문제가 발생했습니다. 유지 관리 기간의 범위가 잘 정의되어 있고 해당 범위에 대한 결과가 자세히 설명되어 있는지 확인하십시오. 환경이 작동한다고 말하는 것만으로는 충분하지 않습니다. 가능하면 예상되는 버전, 동작 및 측정 가능한 결과를 자세히 설명합니다. 자세히 보기IT 탄력성.
- 유지 관리 기간(예상, 허용)의 기간은 어떻게 됩니까?
이상적으로 우리 모두는 유지 관리를 수행할 시간이 항상 있기를 원하지만 고객이 전 세계에 있다는 것은 중요한 작업의 경우에도 계획된 가동 중지 시간에 대한 허용 오차가 거의 없음을 의미합니다. 유지 관리를 계획할 때 예상되는 중단 시간은 어느 정도입니까? 허용되는 최대 창을 현실적으로 충족할 수 있습니까? 그렇지 않은 경우 유지 관리 이벤트를 다시 계획해야 합니다.
- 롤백 계획은 무엇입니까?
우리는 아무 일도 일어나지 않기를 바라지만 우리는 소프트웨어, 복잡한 환경 및 구성, 수많은 팀에서 처리하는 많은 움직이는 부분을 다루고 있다는 점을 인식해야 합니다. 롤백 계획, 즉 시스템을 유지 관리 이전 버전 및 설정으로 되돌리는 수단이 필수적입니다. 문제가 발생하면 전체 백업 또는 머신 이미지와 같은 롤백 계획이 있는지 확인하십시오. 자세히 보기재해 복구.
- 관련된 개별 팀원은 누구이며 그들의 역할과 책임은 무엇입니까? 필요한 모든 역할과 책임이 명확하게 정의되어 있습니까?
고객 경험 담당 부사장으로서 우리 팀은 중요한 팀원이 없어 예상치 못한 지연이 발생한 유지 관리 활동에 참여했습니다. 계획과 아키텍처를 계획할 때 팀 구성원과 필요한 IT 역할 및 책임을 식별해야 합니다. 수석 지원 엔지니어인 Greg Tucker가 고객에게 상기시켜 주듯이 HA는 스토리지, 네트워크, 컴퓨팅, OS, 보안, 정책 등 환경의 모든 계층에 영향을 미칩니다.
- 유지보수 계획은 어디에 문서화되어 있습니까? 계획을 마지막으로 검토, 업데이트 및 테스트한 시간은 언제입니까?
성공은 훌륭하지만 만족하거나 편안하게 만들 수도 있습니다. 수년간의 성공 후에는 프로세스가 더 이상 제대로 문서화되지 않거나 적극적으로 따르지 않을 수 있습니다. 이러한 질문에 답하면 팀이 계속해서 성공할 수 있습니다.
- 생산 계획 이전에 테스트/QA에서 해결된 문제는 무엇입니까?
유지 관리 단계를 계속 테스트해 주셔서 감사합니다. 테스트 환경에서 해결된 문제가 프로덕션 유지 관리 계획에 적절하게 추가되었는지 확인하십시오. SIOS 고객 성공 팀은 고객이 QA 테스트를 수행하고 잘못된 가정을 발견하고 필요한 수정을 했지만 해당 수정 사항을 생산 체크리스트에 넣지 못하는 것을 보았습니다.
- 당신의 계획에서 빠진 사람 또는 무엇이 있습니까?
계획, 시기, 팀, 역할 및 아키텍처를 살펴보았으므로 이제 마지막 질문이 남아 있습니다. 누가 또는 무엇이 누락되었습니까? 마지막 단계로 계획을 살펴보고 다음과 같은 질문을 하십시오. “우리 계획에서 누락된 사람은 누구입니까?” 또한 “우리 계획에서 빠진 것은 무엇입니까?”라고 물어보십시오. 고객 경험 담당 부사장으로서 저는 우리 팀과 협력하여 수많은 고객을 위한 활동 계획을 검토했습니다. 가장 기억에 남는 유지 관리 계획 검토 중 하나는 복제된 이미지에서 서버를 복원하고 백업에서 데이터를 복원하는 것을 포함하는 롤백 계획 내 일련의 단계를 발견했습니다. 그러나 이미지 복제 및 데이터 백업 단계는 작업 목록에 포함되지 않았습니다. 그들은 간과되었고 프로세스 초기에 수행되었다고 가정했습니다.
시스템 유지 관리는 고가용성 유지에 중요한 요소입니다.
시스템 유지 관리는 컴퓨터 시스템 유지 관리에 있어 중요하고 필요한 부분입니다. 유지 관리는 오류를 수정하거나 새로운 소프트웨어 기능을 도입하거나 시스템을 새로운 사용 사례에 맞게 조정하는 것일 수 있습니다. 문제의 시스템이 조직이 비즈니스 연속성을 유지하는 데 필수적인 비즈니스 크리티컬 시스템인 경우 신중한 계획을 갖는 것이 필수적입니다. 불필요한 위험이나 지연 없이 유지 관리가 비즈니스 요구 사항을 충족하는지 확인하려면 다음 10가지 질문과 기타 자신의 질문을 고려하십시오.
SIOS에 문의오늘은 고가용성 및 재해 복구 솔루션에 대해 알아보겠습니다.
의 허가를 받아 복제됨시오스