Date: November 8, 2021
Dasar-dasar Pemulihan Bencana
Ikhtisar pemulihan bencana
Pemulihan bencana mengacu pada kemampuan untuk memulihkan/memperbaiki sistem dengan cepat dan meminimalkan kerusakan jika terjadi kegagalan di seluruh lokasi atau bahkan regional. Pemulihan bencana adalah bagian penting dari manajemen kelangsungan bisnis dan memiliki protokol pemulihan bencana yang kuat akan membantu mencegah kehilangan data yang tidak perlu dan biaya yang terkait dengan waktu henti sistem.
Apa yang merupakan bagian ‘bencana’ dari pemulihan bencana? Ini bisa merujuk pada bencana alam seperti gempa bumi, banjir, dll, tetapi juga berbagai peristiwa seperti “kebakaran”, “terorisme”, “intrusi tidak sah”, “peretasan skala besar”, dan “peretasan skala besar” jangka panjang. -skala pemadaman listrik.” Apa pun yang berpotensi menyebabkan kerusakan besar pada sistem TI jika gagal.
Dampak Nyata dari Kegagalan Sistem
Selain potensi kerusakan fisik dan kehilangan data yang terkait dengan kegagalan sistem, kurangnya rencana pemulihan bencana dapat menyebabkan hilangnya pendapatan yang tidak dapat dipulihkan untuk bisnis. Untuk setiap menit waktu henti sistem, ini berarti kehilangan penjualan dan peluang, potensi pengalaman pelanggan yang negatif, reputasi bisnis yang ternoda, dan biaya tinggi untuk perbaikan TI darurat.
Pentingnya Pemulihan Bencana
Untuk perusahaan yang menyediakan layanan mission-critical, membangun sistem kesinambungan bisnis yang dapat menangani downtime sistem yang tidak terduga sangat penting. Memiliki kemampuan untuk mencegah kegagalan sejak awal, dan dengan cepat pulih jika terjadi kegagalan lokal atau bahkan bencana di seluruh lokasi atau regional terjadi akan membantu melindungi data, menjaga hubungan baik dengan pelanggan, dan menghemat waktu dan berpotensi kerugian finansial yang menghancurkan.
Sangat penting untuk menyadari bahwa kegagalan sistem bencana adalah sesuatu yang akan terjadi, bukan sesuatu yang mungkin terjadi, sehingga menempatkan rencana pemulihan bencana yang tepat akan melindungi bisnis Anda.
Tantangan Pemulihan Bencana
Meskipun protokol pemulihan bencana sangat penting, bukan tanpa tantangan untuk menyiapkan dan mengimplementasikannya. Berikut adalah beberapa hambatan umum untuk implementasi pemulihan bencana yang tepat: Tantangan 1: Pemisahan geografis.
Inti dari perlindungan bencana adalah menjaga sistem dan data di lokasi yang secara geografis terpisah dari pusat data primer atau instance cloud sehingga, jika terjadi bencana atau pemadaman cloud, sistem sekunder dapat dibawa online dan operasi dapat dilanjutkan.
Tantangan 2: Persyaratan bandwidth jaringan Mereplikasi data ke lokasi di luar lokasi untuk pemulihan bencana dapat berarti menambahkan persyaratan bandwidth jaringan dan masalah latensi.
Tantangan 3: Volume data terus meningkat Persyaratan kapasitas penyimpanan di situs pemulihan bencana akan meningkat seiring waktu. Rencana pemulihan bencana yang tepat perlu menetapkan “prioritas perlindungan” untuk memperjelas data mana yang harus dilindungi dan mengoptimalkan sumber daya penyimpanan yang tersedia.
Tantangan 4: Prosedur pemulihan pada saat pemulihan Jika sistem mati karena bencana, pemulihan layanan diperlukan. Seringkali, perusahaan menemukan data mereka tersebar di beberapa lokasi dan tidak ada prosedur standar untuk dan pemulihan, yang mengakibatkan hilangnya waktu dan biaya yang sangat besar. Mengembangkan prosedur restorasi yang jelas dan terstandarisasi akan menghilangkan sakit kepala ini dan memungkinkan tindakan cepat saat paling penting.
Pencadangan data vs Perlindungan Ketersediaan
Secara tradisional, pencadangan data – pada dasarnya proses membuat salinan data dan aplikasi dan memindahkannya ke lokasi di luar kantor – telah dilakukan untuk tujuan melindungi data jika terjadi kegagalan/kegagalan peralatan TI dan untuk pencatatan/pengarsipan sesuai dengan peraturan. persyaratan seperti HIPAA (Healthcare Information Portability Accountability Act). Untuk memulihkan operasi, semua server, penyimpanan, dan perangkat keras lainnya, serta jaringan yang terpengaruh oleh insiden tersebut perlu diganti atau diperbaiki. Server harus dikonfigurasi dan aplikasi harus dipulihkan, dibawa kembali online, dan terhubung ke data yang dipulihkan. Langkah ini bisa berbulan-bulan.
Tanpa adanya proses perlindungan ketersediaan, operasi pemulihan dengan pencadangan saja dapat menjadi proses yang memakan waktu dan mahal. Proses ketersediaan membuat sistem yang beroperasi penuh siap untuk mengambil alih jika terjadi bencana, memungkinkan dimulainya kembali layanan dalam hitungan menit.
Berikut adalah beberapa alasan umum lainnya tentang pentingnya rencana pemulihan bencana yang efektif:
Indikator pemulihan bencana
Metrik utama untuk pemulihan bencana adalah “RPO” dan “RTO”.
RPO (Tujuan Titik Pemulihan) RPO menunjukkan titik dari waktu terjadinya bencana hingga jam berapa di masa lalu pemulihan data dijamin.
Jika “RPO = < 5 menit Saat bertujuan untuk “RPO = 0 (zero data loss)”, mekanisme proteksi ketersediaan seperti failover clustering diperlukan.
RTO (Tujuan Waktu Pemulihan) RTO adalah indeks yang menunjukkan berapa banyak waktu yang dapat diberikan bisnis Anda dari waktu henti awal hingga pemulihan operasi. “RTO = 1 bulan atau lebih”, Anda mungkin dapat menangani pemulihan data hanya dengan melakukan pencadangan jarak jauh dan mengamankan perangkat pengganti. Tetapi jika “RTO = dalam satu menit”, pengelompokan failover diperlukan.
Memilih Metode Pemulihan Bencana
Saat menentukan metode pemulihan bencana yang tepat untuk bisnis Anda, pertimbangkan faktor-faktor penting berikut:
- Kekritisan proses bisnis dan toleransi terhadap dampak
- Jenis dan kapasitas data yang ingin Anda lindungi
- Persyaratan pemulihan – RPO dan RTO Anda
- Anggaran
Fokus pada Dampak Bisnis
Sementara departemen TI memimpin teknis dalam mengembangkan langkah-langkah pemulihan bencana untuk sistem TI, pemilik bisnis harus mempertimbangkan dampak dan tingkat pemadaman sistem terhadap dampak bisnis dari setiap penghentian sistem” untuk memastikan dampak yang paling tidak berbahaya bagi bisnis.
Tipe data yang dilindungi (integritas data)
Penting untuk mengklasifikasikan jenis dan pentingnya data yang dilindungi. Untuk data yang tidak memerlukan konsistensi yang sangat tepat (seperti server file), cadangan penyimpanan utama yang sederhana mungkin sudah cukup.
Di sisi lain, sistem ERP dan database seperti SQL Server, Oracle, dan SAP memiliki beberapa layanan dan bagian yang perlu ditempatkan di server tertentu, dimulai dalam pesanan tertentu, dan dikelola sesuai dengan berbagai praktik terbaik khusus aplikasi. . Mereka biasanya memerlukan perlindungan ketersediaan tinggi dan solusi pengelompokan yang sadar aplikasi untuk mengatur failover.
———————————————————————————————————————————————————
Persyaratan Pemulihan Bencana Utama
Pencadangan jarak jauh – pada dasarnya menyimpan salinan aplikasi dan data di lokasi terpencil yang terpisah secara geografis.
Pencerminan Penyimpanan Sinkron Menyimpan salinan penyimpanan lokal dan jarak jauh yang disinkronkan untuk perlindungan DR. Dalam metode ini, data ditulis ke penyimpanan lokal dan segera direplikasi ke penyimpanan jarak jauh. Penyimpanan lokal tidak “berkomitmen” sampai proses penulisan data ke lokasi jarak jauh telah selesai. Proses ini membuat kedua lokasi tetap identik, menghilangkan perbedaan yang mungkin terjadi jika data-dalam-transit pada saat suatu peristiwa gagal ditulis di lokasi jauh. Integritas data dijamin antara situs utama dan cadangan.
Pencerminan Penyimpanan Asinkron.
Metode ini menulis data ke penyimpanan lokal kemudian mereplikasinya ke lokasi yang jauh. Ini memungkinkan efisiensi pemanfaatan jaringan yang lebih besar dan mengurangi pertentangan bandwidth ketika pemisahan geografis menyebabkan latensi.
“Siaga dingin” dan “Siaga panas”
Siaga dingin Proses menyimpan salinan data atau sistem sekunder secara offline jika terjadi bencana. Jika sistem utama mati, sistem dan perangkat lunak harus dimulai secara manual – dalam beberapa kasus dikonfigurasi – dan data harus dipulihkan sebelum operasi dapat dilanjutkan.
Siaga panas Ini adalah proses menjaga sistem sekunder tetap beroperasi dan beralih ke sistem tersebut jika terjadi waktu henti pada sistem utama.
Perbandingan Biaya Metode Pemulihan Bencana
Semakin kecil RPO dan RTO, semakin pendek waktu henti, tetapi biayanya akan meningkat.
Mempertimbangkan biaya dan nilai aset dari setiap jenis data, perlu untuk menemukan metode optimal untuk tingkat perlindungan apa yang diperlukan. Keseimbangan antara implementasi in-house dan outsourcing layanan akan berdampak pada biaya.
Untuk mempelajari lebih lanjut tentang ketersediaan tinggi dan solusi pemulihan bencana di SIOS, klik di sini .