Cara Mencapai Ketersediaan Tinggi dengan Cluster

Date: Desember 3, 2021

Cara Mencapai Ketersediaan Tinggi dengan Cluster

Apa itu Ketersediaan Tinggi?

Ketersediaan tinggi (HA) adalah komponen dari sistem teknologi yang menghilangkan satu titik kegagalan untuk memastikan operasi berkelanjutan atau waktu aktif untuk waktu yang lama. Ketersediaan tinggi cluster adalah kelompok server yang mendukung aplikasi penting bisnis yang membutuhkan waktu henti minimal dan ketersediaan berkelanjutan.

Semua organisasi menggunakan berbagai database dan aplikasi penting bisnis, seperti gudang data, aplikasi e-niaga, sistem manajemen hubungan pelanggan (CRM), sistem keuangan, manajemen rantai pasokan, dan sistem intelijen bisnis. Ketika sistem, database, atau aplikasi gagal, organisasi ini memerlukan perlindungan ketersediaan tinggi untuk menjaga sistem tetap berjalan dan meminimalkan risiko kehilangan pendapatan, karyawan yang tidak produktif, dan pelanggan yang tidak puas.

Cluster yang sangat tersedia menggabungkan lima prinsip desain:

Mereka secara otomatis melakukan failover ke sistem redundan untuk mengambil operasi ketika komponen aktif gagal. Ini menghilangkan satu titik kegagalan.
Mereka dapat secara otomatis mendeteksi kegagalan tingkat aplikasi saat terjadi, apa pun penyebabnya.
Mereka memastikan tidak ada kehilangan data selama kegagalan sistem.
Mereka secara otomatis dan cepat melakukan failover ke komponen yang berlebihan untuk meminimalkan waktu henti.
Mereka memberikan kemampuan untuk melakukan failover dan failback secara manual untuk meminimalkan waktu henti selama pemeliharaan yang direncanakan.

TechTarget mendefinisikan HA sebagai “sistem atau komponen yang terus beroperasi untuk jangka waktu yang lama dan diinginkan. Ketersediaan dapat diukur relatif terhadap '100% operasional' atau 'tidak pernah gagal'. Standar ketersediaan yang dipegang secara luas tetapi sulit dicapai untuk sistem atau produk dikenal sebagai ketersediaan 'lima 9' (99,999%). Tapi mari kita definisikan Ketersediaan Tinggi secara sederhana:

Ketersediaan Tinggi memastikan sistem, database, dan aplikasi Anda beroperasi kapan dan sesuai kebutuhan.

"Kapan" mempertimbangkan persentase waktu aplikasi harus aktif dan berjalan. "Sesuai kebutuhan" mempertimbangkan pengoperasian sistem, database, dan/atau aplikasi yang tepat tanpa kehilangan data.

Tergantung pada sistem dan/atau aplikasi, ketersediaan tinggi akan berbeda. Misalnya, dengan aplikasi mission-critical, seperti sistem eCommerce Anda, ketersediaan empat 9 (99,99%) dianggap sebagai standar industri. Dengan ketersediaan 99,99%, Anda dapat mengharapkan tidak lebih dari 52,60 menit waktu henti per tahun atau 8,64 detik waktu henti per hari. Namun, untuk aplikasi dan sistem yang tidak kritis, seperti kegagalan desktop tunggal, ketersediaan tinggi dapat berupa dua detik (99%), yang setara dengan waktu henti 8,77 jam per tahun atau waktu henti 1,44 menit per hari. Saat mengukur waktu henti yang dapat diterima, penting bagi Anda untuk mempertimbangkan:

Waktu henti yang tidak direncanakan (misalnya, kegagalan perangkat keras atau perangkat lunak)
Waktu henti yang direncanakan diperlukan untuk pemeliharaan perangkat keras dan perangkat lunak rutin
Uptime di tingkat database dan aplikasi

Pilihan Anda untuk ketersediaan tinggi bergantung pada banyak faktor, termasuk seberapa penting aplikasi bagi bisnis, apakah pelanggan terpengaruh, seberapa sering aplikasi dijalankan, berapa banyak pengguna yang terpengaruh, seberapa cepat database atau aplikasi harus dialihkan ke sistem yang berlebihan , dan seberapa besar kehilangan data yang dapat ditoleransi.

Metrik Ketersediaan Tinggi: RTO dan RPO

Dua metrik yang biasanya digunakan untuk menilai HA (dan juga Disaster Recovery (DR)) adalah Recovery Time Objective (RTO) dan Recovery Point Objective (RPO).

RTO adalah durasi maksimum yang dapat ditoleransi dari setiap pemadaman. Aplikasi pemrosesan transaksi online umumnya memiliki RTO terendah, dan aplikasi yang bersifat mission-critical sering memiliki RTO hanya beberapa detik.
RPO adalah jumlah maksimum kehilangan data yang dapat ditoleransi ketika terjadi kegagalan. Untuk HA, RPO seringkali nol untuk menentukan harus ada kehilangan data nol di bawah semua skenario kegagalan.

Namun, ada perbedaan antara RTO dan RPO yang dapat Anda capai untuk mendukung ketersediaan tinggi versus pemulihan bencana . Dengan HA, replikasi data dapat sinkron karena komponen redundan Anda berada di lingkungan LAN Anda. Basis data aktif dan siaga dapat diperbarui secara bersamaan, memungkinkan pemulihan penuh, otomatis, waktu nyata yang dapat memenuhi RTO dan RPO yang paling menuntut. Akibatnya, instans siaga Anda "panas" dan sinkron dengan instans aktif Anda, sehingga siap untuk segera mengambil alih jika terjadi kegagalan.

Namun, untuk memulihkan sistem, perangkat lunak, dan data jika terjadi bencana memerlukan komponen yang berlebihan untuk berada di jaringan area luas (WAN). Ini penting karena Anda harus menjauhkan komponen yang berlebihan di lokasi geografis dari instans aktif. Tetapi dengan WAN, replikasi data tidak sinkron untuk menghindari dampak negatif terhadap kinerja throughput. Ini berarti bahwa pembaruan pada instans siaga akan memperlambat pembaruan yang dibuat pada instans aktif, yang mengakibatkan penundaan selama proses pemulihan. Karena bencana jarang terjadi, beberapa penundaan mungkin dapat ditoleransi dan bergantung pada (a) seberapa penting bagi bisnis Anda untuk mencapai RTO dan RPO serendah mungkin dan (b) berapa banyak anggaran yang dapat Anda alokasikan untuk mencapai RTO dan RPO terbaik.

Bagaimana SIOS Membantu Anda Mencapai Ketersediaan Tinggi

SIOS menawarkan solusi tunggal untuk memenuhi ketersediaan tinggi dan kebutuhan pemulihan bencana di berbagai sistem operasi, lingkungan infrastruktur, dan aplikasi, termasuk SAP, SQL Server, Oracle, dan lingkungan lain yang berjalan dalam konfigurasi penyimpanan bersama berbasis SAN atau tanpa SAN , konfigurasi penyimpanan data lokal.

Lingkungan Windows : Ketika ditambahkan ke lingkungan Windows Server Failover Cluster (WSFC), SIOS DataKeeper memungkinkan Anda membuat cluster tanpa SAN, di mana cluster penyimpanan bersama tidak mungkin atau tidak praktis, atau menambahkan replikasi untuk perlindungan bencana di cluster Windows berbasis SAN Anda. Replikasi berbasis host yang cepat dan efisien menyinkronkan penyimpanan lokal pada node kluster lokal dan jarak jauh, menciptakan kluster SANLess dalam kombinasi lingkungan fisik, virtual, atau cloud apa pun.
Lingkungan Linux : Suite Perlindungan SIOS untuk Linux adalah paket perangkat lunak pengelompokan solusi yang menggunakan SIOS LifeKeeper dan SIOS DataKeeper untuk memberikan kombinasi yang terintegrasi erat dari pengelompokan failover ketersediaan tinggi, pemantauan aplikasi berkelanjutan, replikasi data, dan kebijakan pemulihan yang dapat dikonfigurasi untuk melindungi aplikasi dan data penting bisnis Anda dari waktu henti dan bencana. SIOS Protection Suite memungkinkan Anda membangun klaster SAN atau SANLess menggunakan berbagai perangkat penyimpanan, termasuk penyimpanan yang terpasang langsung, iSCSI, dan Fibre Channel. SIOS Protection Suite untuk Linux mendukung semua distribusi Linux utama, termasuk Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS, dan Oracle Linux.

Dengan solusi SIOS, RPO selalu nol dan RTO bergantung pada aplikasi tetapi biasanya 30 detik hingga beberapa menit untuk beberapa aplikasi. Mari kita bahas studi kasus “SIOS in action” satu pelanggan menggunakan klaster HA di perusahaan ritel terbesar di Swiss.

Migros Mencapai Kontinuitas Bisnis Penting dari sistem POS-nya dengan Solusi Ketersediaan Tinggi SIOS

Migros adalah perusahaan ritel terbesar di Swiss, jaringan supermarket terbesarnya, dan pemberi kerja terbesar dengan lebih dari 100.000 karyawan. Ini juga salah satu dari empat puluh pengecer terbesar di dunia. Bermitra dengan Realstuff Informatik AG, penyedia layanan TI yang berbasis di Swiss dan reseller solusi SIOS, Migros ingin mengganti sistem Point of Sale (POS) dengan platform baru yang lebih efisien untuk dioperasikan dan dapat meminimalkan ancaman waktu henti.

Sistem POS yang baru menyediakan informasi harga dan pilihan produk di 650 toko Migros dan pengecer membutuhkan solusi ketersediaan tinggi untuk mendukung penjualan sehari-hari. Tanpa sistem HA, karyawan tidak dapat menentukan harga produk atau menimbang barang jika terjadi kegagalan sistem, sehingga menghentikan operasi. Setelah mengevaluasi opsi, Migros memutuskan menginginkan lingkungan server sumber terbuka yang menawarkan ketersediaan tinggi dan perlindungan data berkelanjutan, independen dari lingkungan virtual, dan dapat dioperasikan secara internal oleh staf TI perusahaan. Untuk mengatasi persyaratan ini, tim memilih SIOS Protection Suite untuk Linux untuk replikasi guna melindungi data POS.

Untuk desain sistem, pelatihan pelanggan, dan dukungan bahasa asli, Realstuff bermitra dengan Pusat Kompetensi dan Dukungan SIOS untuk Eropa Tengah dan Timur, yang berbasis di Dresden, Jerman dan dioperasikan oleh Computer Concept. Penting bagi Migros untuk mendapatkan dukungan 24x7x365 selama waktu kantor regional dari Pusat Kompetensi dan Dukungan.

Realstuff menerapkan solusi ketersediaan tinggi SIOS Protection Suite untuk terus memantau server POS dan mereplikasi data. Di setiap lokasi penyimpanan, dua server digunakan untuk memastikan perlindungan data yang berkelanjutan. Jika satu server gagal, instance kedua mengambil alih pekerjaan secara instan. Selain itu, kedua server mencerminkan aset data pada sistem pemantauan.Baca studi kasus Migros selengkapnya di sini.

Pikiran Akhir

Pusat Kompetensi dan Dukungan regional berkonsultasi dengan Realstuff untuk memberikan wawasan dan arahan tentang implementasi dan peluncuran dan mengadakan lokakarya pelatihan tiga hari untuk melatih tim Migros. Richard Huber, manajer dan anggota dewan eksekutif di Realstuff, berkomentar pasca penerapan bahwa manfaat dari solusi ketersediaan tinggi SIOS adalah fleksibilitas, keandalan, kemudahan penggunaan, dan jaminan bahwa data tetap sinkron setiap saat.

Saat ini, Migros telah memenuhi persyaratannya untuk HA dengan solusi SIOS yang mudah digunakan, yang menyediakan pemantauan terus menerus terhadap server, penyimpanan, aplikasi, database, dan koneksi jaringan untuk mendeteksi titik kegagalan, mengurangi waktu henti, memelihara konektivitas klien, dan menyediakan layanan tanpa gangguan. akses data.

Untuk informasi lebih lanjut tentang solusi SIOS dan bagaimana SIOS dapat membantu Anda mencapai HA di lingkungan SQL Server, Anda dapat membaca "Mengapa Pengelompokan untuk Ketersediaan Tinggi SQL Server" di sini.

Direproduksi dari SIOS