Date: April 24, 2023
Sepuluh Pertanyaan untuk Dipertimbangkan untuk Pemeliharaan Klaster Ketersediaan Tinggi yang Lebih Baik
Pemeliharaan adalah bagian dari siklus hidup setiap perusahaan. Setiap infrastruktur terus bergerak dan berubah, bahkan yang bergerak menuju akhir kehidupan. Tim Anda kemungkinan besar telah berhasil melakukan apa yang telah Anda lakukan di masa lalu, tetapi karena sistem menjadi lebih rumit dan kompleks, apa yang Anda anggap sukses di masa lalu mungkin perlu disegarkan. Berikut adalah sepuluh pertanyaan untuk diperbaikipemeliharaan klaster, maksimalkanketersediaan tinggi, dan meminimalkan downtime.
Cara Memastikan Ketersediaan Tinggi Selama Pemeliharaan Sistem
- Apa hari terbaik bagi pemangku kepentingan bisnis?
Berbeda dari downtime yang tidak direncanakan, ini adalah jendela di mana banyak tim, sistem, dan sumber daya yang saling terhubung tidak tersedia untuk aktivitas yang direncanakan. Misalnya, satu perusahaan diharuskan melakukan pemeriksaan kepatuhan sistem bulanan dan inspeksi keselamatan. Selama ini, operasi bisnis ditutup oleh inspektur, auditor, dan sejenisnya.
- Apa tanggal terbaik bagi tim untuk menjadwalkan pemeliharaan?
Sebagai VP Pengalaman Pelanggan, kami telah bekerja sama dengan sejumlah tim yang memiliki tanggal pengecualian untuk acara dan aktivitas tertentu. Tim Anda mungkin bertanggung jawab atas lebih dari satu set sistem dan server, dan melapor ke beberapa tim dengan aplikasi dan infrastruktur penting. Memahami hari mana yang terbaik untuk tim membantu Anda menghindari gangguan, konflik, dan waktu yang hilang karena kendala sumber daya yang diketahui.
- Tanggal dan waktu apa yang paling cocok dengan mitra, konsultan, dan kontraktor non-perusahaan?
Infrastruktur kritis biasanya mencakup banyak penyedia dan vendor lain yang tidak terkait langsung dengan staf perusahaan. Sumber daya ini mencakup vendor dan konsultan OS, keamanan dan HA, serta arsitek dari penyedia infrastruktur dan mitra lainnya. Memahami sebelumnya hari apa yang terbaik atau termasuk dalam tingkatan dukungan Anda sangat penting untuk penjadwalan dan penempatan staf yang tepat.
Dengan bertambahnya tim global, menemukan waktu yang tepat untuk semua sumber daya ini adalah pertanyaan lain yang penting untuk dijawab. Kapan waktu terbaik untuk sumber daya di EST, IST, EMEA, dan wilayah lainnya?
- Apa ruang lingkup pemeliharaan yang dimaksud? Apa hasil yang diinginkan dari kegiatan pemeliharaan? Berpikir secara holistik.
Pikirkan di luar pemeliharaan sederhana aplikasi untuk menyertakan seluruh lingkungan tempatnya berjalan. Baru-baru ini, seorang pelanggan yang berencana untuk memutakhirkan aplikasi mereka memutuskan untuk memutakhirkan OS mereka pada saat yang bersamaan. Sayangnya, perubahan kecil dalam ruang lingkup ini membawa konsekuensi yang lebih besar dari yang diharapkan. Aplikasi mereka tidak mendukung OS yang baru ditingkatkan dan masalah pun terjadi. Pastikan bahwa cakupan periode pemeliharaan ditentukan dengan baik dan hasil untuk cakupan tersebut dirinci. Tidaklah cukup untuk mengatakan, lingkungan bekerja. Detailkan versi yang diharapkan, perilaku, dan hasil terukur jika memungkinkan. Lihat lebih lanjut tentangKetahanan TI.
- Berapa lama waktu untuk jendela pemeliharaan (diantisipasi, diizinkan)?
Idealnya kita semua ingin memiliki semua waktu untuk melakukan pemeliharaan, tetapi memiliki pelanggan yang berlokasi di seluruh dunia berarti hanya ada sedikit toleransi untuk jendela waktu henti yang direncanakan – bahkan untuk tugas-tugas penting. Saat Anda merencanakan pemeliharaan, berapa lama waktu henti yang diantisipasi? Bisakah Anda secara realistis memenuhi jendela maksimum yang diizinkan? Jika tidak, maka Anda perlu merencanakan ulang acara pemeliharaan.
- Apa rencana pengembaliannya?
Meskipun kami berharap tidak ada yang salah, kami harus menyadari bahwa kami berurusan dengan perangkat lunak, lingkungan dan konfigurasi yang rumit, dan banyak bagian bergerak yang ditangani oleh banyak tim. Rencana rollback – yaitu, cara mengembalikan sistem ke versi dan pengaturan pra-pemeliharaan – sangat penting. Pastikan jika terjadi kesalahan, Anda memiliki rencana pengembalian, misalnya pencadangan penuh atau citra mesin. Lihat lebih lanjut tentangpemulihan bencana.
- Siapa anggota tim individu yang terlibat, apa peran dan tanggung jawab mereka? Apakah semua peran dan tanggung jawab yang diperlukan didefinisikan dengan jelas?
Sebagai VP Pengalaman Pelanggan, tim kami terlibat dalam aktivitas pemeliharaan yang mengalami penundaan tak terduga karena anggota tim utama tidak hadir. Saat Anda menyusun rencana dan arsitektur, pastikan untuk mengidentifikasi anggota tim serta peran dan tanggung jawab TI yang diperlukan. Seperti yang diingatkan oleh Sr. Support Engineer Greg Tucker kepada pelanggan, HA menyentuh setiap lapisan lingkungan Anda termasuk penyimpanan, jaringan, komputasi, OS, keamanan, kebijakan, dll.
- Di mana rencana pemeliharaan didokumentasikan? Kapan terakhir kali rencana ditinjau, diperbarui, dan diuji?
Sukses itu luar biasa, tetapi juga bisa membuat Anda terlena atau nyaman. Setelah bertahun-tahun sukses, proses Anda mungkin tidak lagi didokumentasikan dengan baik atau diikuti secara aktif. Menjawab pertanyaan-pertanyaan ini dapat memastikan tim Anda terus sukses.
- Masalah apa yang diselesaikan dalam pengujian/QA sebelum rencana produksi?
Kudos untuk terus menguji langkah-langkah pemeliharaan. Pastikan bahwa masalah yang diselesaikan di lingkungan pengujian ditambahkan dengan benar ke rencana pemeliharaan produksi. Tim Kesuksesan Pelanggan SIOS telah melihat pelanggan melakukan pengujian QA, mengungkap asumsi yang salah, dan melakukan koreksi yang diperlukan, tetapi gagal menempatkan koreksi tersebut dalam daftar periksa produksi mereka.
- Siapa atau apa yang hilang dari rencana Anda?
Sekarang setelah Anda melihat rencana, waktu, tim, peran, dan arsitektur, satu pertanyaan terakhir tersisa: siapa atau apa yang hilang? Sebagai langkah terakhir, periksa rencana Anda dan ajukan pertanyaan: “Siapa yang hilang dari rencana kita?” Juga, pertimbangkan untuk menanyakan “Apa yang kurang dari rencana kita?” Sebagai Wakil Presiden Pengalaman Pelanggan, saya telah bekerja dengan tim kami untuk meninjau rencana aktivitas untuk banyak pelanggan. Salah satu tinjauan rencana pemeliharaan yang paling berkesan mengungkap serangkaian langkah dalam rencana rollback yang mencakup pemulihan server dari gambar yang dikloning dan data dari cadangan. Namun, langkah kloning gambar dan pencadangan data tidak disertakan dalam daftar tugas. Mereka telah diabaikan dan dianggap telah dilakukan lebih awal dalam proses.
Pemeliharaan Sistem adalah Elemen Penting untuk Mempertahankan Ketersediaan Tinggi
Pemeliharaan sistem adalah bagian penting dan perlu dari pemeliharaan sistem komputer. Pemeliharaan dapat dilakukan untuk memperbaiki kesalahan, memperkenalkan fungsionalitas perangkat lunak baru, atau mengadaptasi sistem ke kasus penggunaan baru. Ketika sistem yang dimaksud adalah sistem kritis bisnis yang penting bagi organisasi untuk mempertahankan kelangsungan bisnis, memiliki rencana yang dipikirkan matang-matang sangatlah penting. Pertimbangkan sepuluh pertanyaan ini dan pertanyaan Anda sendiri untuk memastikan bahwa pemeliharaan Anda memenuhi kebutuhan bisnis tanpa risiko atau penundaan yang tidak perlu.
Hubungi SIOShari ini untuk Solusi Ketersediaan Tinggi dan Pemulihan Bencana.
Direproduksi dengan izin dariSIOS