Date: Maret 8, 2022
Sangat Tersedia atau Sangat Rentan? Daftar Periksa untuk Ketersediaan Tinggi
Bukan rahasia lagi bahwa bisnis dari semua ukuran memiliki kebutuhan yang terus meningkat untuk sistem TI. Tetapi sistem TI hanya efektif untuk bisnis ini dan klien mereka jika mereka operasional, tangguh, dan sangat tersedia. Saat perusahaan berupaya membangun ketersediaan perusahaan mereka, memiliki dasar untuk menimbang dan menilai kerentanan Anda dapat menjadi perbedaan yang menghasilkan penggabungan infrastruktur, perangkat lunak, layanan, dan dukungan yang sukses yang meningkatkan kesuksesan Anda.
Terkadang, daftar periksa paling dasar dapat membantu Anda memilah apakah solusi Anda sangat tersedia atau sangat rentan?
Apakah organisasi Anda memiliki infrastruktur yang tepat untuk mendukung? ketersediaan tinggi ?
- Apakah pusat data Anda memiliki sensor lingkungan untuk mengukur sistem bangunan?
- Apakah pusat data Anda memiliki operasi 24x7x365?
- Apakah pusat data Anda menyertakan daya yang berlebihan dan konektivitas jaringan dari berbagai sumber?
- Apakah pusat data Anda mencakup beberapa lapisan layanan host dan penyimpanan?
- Sebagai VP of Customer Experience, saya telah melihat pelanggan berusaha menciptakan solusi yang sangat tersedia tanpa mengatasi masalah mendasar mendasar dalam infrastruktur mereka.
Mereka menyebarkan perangkat lunak tetapi memiliki ketidakstabilan dalam infrastruktur jaringan, server, dan pusat data itu sendiri. Cloud menangani banyak masalah infrastruktur, tetapi tidak semua platform cloud dirancang dengan cara yang sama. Pastikan untuk memahami pusat data, lokal, atau cloud Anda.
Apakah organisasi Anda memiliki runbook (atau playbook) yang mencakup desain, arsitektur, dan proses?
- Apakah runbook Anda didokumentasikan dengan baik, dipublikasikan, dan mudah diakses?
- Apakah bagian rutin dari runbook Anda cukup otomatis?
- Siapa yang memiliki akses ke runbook perusahaan Anda?
- Apakah saat ini dan saat ini dipertahankan?
- Apakah ada kontrol versi untuk runbook Anda dan alat otomatisasi apa pun di dalamnya?
Jika Anda menjawab, apa itu runbook atau playbook, maka langkah pertama Anda adalah menemukan atau membuatnya. Runbook (atau buku pedoman) membantu organisasi Anda memelihara sistem dan proses sehubungan dengan arsitektur sistem yang sangat tersedia. Beberapa perusahaan menggunakan alat otomatis untuk membuat skrip yang menyebarkan dan mengonfigurasi server, yang lain menggunakan dokumen yang dikontrol versi untuk menguraikan bagaimana semua hal bekerja bersama untuk memberikan ketahanan dan kesuksesan. Tim Anda perlu memiliki tempat yang dapat dikunjungi oleh pendatang baru dan anggota tim yang sudah ada untuk memahami lingkungan, proses, dan alat yang digunakan.
Apakah organisasi Anda memiliki sumber daya yang didedikasikan untuk mempertahankan praktik terbaik ketersediaan tinggi?
- Apakah organisasi Anda memberikan dukungan dan pelatihan kepada karyawan dan kontraktor ini?
- Apakah organisasi Anda memberikan otonomi kepada tim ini untuk beradaptasi dan menciptakan praktik terbaik yang lebih baik?
“Saya tidak mengatur sistem ini,” Admin TI menyatakan, “Saya hanya mewarisi sistem ini dengan beberapa server lain.” Ratapan adalah fenomena yang jujur dan sering diamati dalam organisasi. Apakah itu hasil merger dan akuisisi, pengurangan biaya, outsourcing, atau pergantian staf umum, komponen kunci dari perusahaan yang sangat tersedia adalah staf yang memadai. Kunci untuk perusahaan yang sangat rentan adalah kurangnya staf, staf yang kurang terlatih atau kurang didukung.
Apakah organisasi Anda memiliki kontrol manajemen perubahan yang tepat?
- Apakah Anda memiliki kebijakan dan jadwal pembaruan rutin?
- Apakah Anda memiliki proses yang ditentukan pada pemeliharaan patch?
- Apakah Anda memiliki proses peninjauan untuk patch (kerentanan, ancaman, dll)?
Manajemen perubahan itu penting. Kontrol dan kebijakan manajemen perubahan merupakan keharusan mutlak dalam mengurangi risiko dan memastikan bahwa sistem Anda tersedia. Pengguna tanpa batasan yang tepat dapat menambahkan paket atau pembaruan yang merusak stabilitas, atau membuat perubahan yang mengganggu organisasi selama berjam-jam. Selain itu, tidak adanya kebijakan yang ditetapkan seringkali menimbulkan penyimpangan antara apa yang diharapkan (didokumentasikan) dan aktual (apa yang ada). Manajemen perubahan juga penting untuk memastikan bahwa cluster siaga Anda berada pada tingkat patch dan perangkat lunak yang sama dengan sistem utama/sumber, dan bahwa QA (atau Pra-Produksi) tidak terlalu menyimpang dari Produksi.
Apakah organisasi Anda memiliki kontrol akses yang tepat?
- Apakah Anda memiliki tingkatan manajemen akun untuk administrasi server?
- Apakah Anda memiliki kontrol untuk mencegah downtime yang tidak disengaja?
Tim Layanan kami bergabung dengan panggilan pelanggan dan menunggu, dan menunggu, dan menunggu administrator dengan izin untuk menjalankan serangkaian perintah yang ditinggikan untuk bergabung dengan sesi untuk mengonfigurasi dan memperbarui perangkat lunak mereka. Beberapa minggu kemudian, tim kami bergabung dengan panggilan pelanggan yang berbeda dan menyaksikan dengan ngeri ketika banyak pengguna, semua dengan hak administratif, menjalankan sekumpulan perintah di cluster yang sama. Perbedaan dalam dua panggilan menunjukkan dengan sangat jelas bahwa kontrol akses itu penting. Perusahaan yang sangat tersedia perlu memastikan bahwa kontrol akses yang tepat ada di tempat yang mencegah pengguna menjalankan perintah yang ditinggikan yang dapat merusak konfigurasi atau mengurangi operasinya. Pastikan bahwa pengguna memiliki batasan pada apa yang dapat mereka lakukan berdasarkan peran, kebutuhan, dan bahkan pengalaman mereka.
Apakah perusahaan Anda memiliki proses pengujian reguler?
- Apakah organisasi Anda melakukan pengujian di lingkungan pra-produksi atau QA sebelum produksi?
- Apakah organisasi Anda melakukan pencadangan dan pengujian pencadangan secara rutin?
- Apakah organisasi Anda mempraktikkan skenario pemulihan bencana dan pengujian kekacauan untuk perbaikan berkelanjutan?
Pengujian membutuhkan waktu, tetapi dalam peran saya membantu pelanggan dengan migrasi cloud dan penerapan ketersediaan tinggi , waktu selalu dihabiskan dengan baik. Seringkali, perbedaan antara yang sangat tersedia dan yang sangat rentan dapat dilihat dari proses pengujian pelanggan atau mitra. Ketika solusi menjadi lebih kompleks, pengujian dan validasi menjadi semakin penting untuk mengurangi risiko dan kerentanan. Jika semuanya berjalan dari desain hingga produksi, Anda menjalankan sistem yang sangat rentan. Namun, jika Anda memiliki tes dan pos pemeriksaan, proses untuk memverifikasi perubahan sebelum membuatnya menjadi produksi, risiko Anda berkurang secara signifikan. Sebagai VP of Customer Experience, tim layanan kami bekerja dengan pelanggan banner yang menerapkan sistem mereka selama satu tahun penuh di QA sebelum menyelesaikan migrasi go-live mereka. Selama tahun itu, mereka mensimulasikan pemadaman, bencana, beban pelanggan, waktu henti, pemeliharaan, strategi patching, pencadangan, pemulihan dari pencadangan, dan sekumpulan rangkaian pengujian lainnya. Akibatnya, mereka mendapatkan hasil yang luar biasa dalam kinerja, kepatuhan proses, ketersediaan tinggi, dan kesuksesan perusahaan.
Meskipun tidak ada daftar periksa yang dapat mencakup setiap potensi kerentanan dalam ketersediaan tinggi, menjawab pertanyaan-pertanyaan ini akan memberi Anda dasar yang kuat untuk memahami jika perusahaan Anda sangat tersedia atau sangat rentan.
Direproduksi dengan izin dari SIOS