Desember 18, 2021 |
Gugus KegagalanGugus KegagalanSolusi Perangkat Lunak Failover Cluster: Yang Perlu Anda Ketahui |
Desember 13, 2021 |
Replikasi Data |
Desember 8, 2021 |
Mencapai Ketahanan TI dengan Ketersediaan TinggiMencapai Ketahanan TI dengan Ketersediaan TinggiApa itu Ketahanan TI?Ketahanan TI adalah kemampuan organisasi untuk mempertahankan tingkat layanan yang dapat diterima ketika ada gangguan pada operasi bisnis, proses kritis, atau ekosistem TI Anda. Di era digital ini, ketersediaan tinggi sangat penting untuk kesuksesan organisasi Anda. Pelanggan Anda tidak akan mentolerir situs web yang rusak. Dan Anda juga tidak dapat membeli ERP, CRM, atau sistem penting bisnis lainnya yang rusak. Di sinilah ketersediaan tinggi masuk. Organisasi Anda harus “memeriksa kotak” pada banyak teknologi dan solusi yang berbeda untuk memastikan ketahanan TI – paling tidak di antaranya adalah memastikan, setidaknya, bahwa Anda memiliki cadangan, pemulihan bencana, ketahanan siber, dan solusi ketersediaan tinggi. Untuk tujuan artikel ini, kita akan berbicara tentang ketersediaan tinggi (HA) sebagai salah satu elemen kunci yang diperlukan untuk memastikan ketahanan TI. Apa itu Ketersediaan Tinggi?Sistem ketersediaan tinggi memastikan bahwa operasi bisnis berlanjut – dengan transparansi total kepada pelanggan dan pengguna – ketika sistem, aplikasi, dan jaringan Anda mati. HA adalah komponen dari sistem teknologi yang menghilangkan satu titik kegagalan untuk memastikan operasi berkelanjutan atau waktu aktif untuk waktu yang lama. Sistem yang sangat tersedia menggabungkan lima prinsip desain: failover otomatis, deteksi otomatis kegagalan tingkat aplikasi, tidak ada kehilangan data, kegagalan otomatis dan cepat ke komponen yang berlebihan, dan failover dan failback tombol tekan untuk pemeliharaan terencana. ——————————————————————————————————————————————————————– Ketahanan TI dan Ketersediaan Tinggi – Bukan Contoh!Agustus lalu, data center Nissan Group di Denver mogok karena pemadaman listrik. Sistem yang terpengaruh dikenal secara internal sebagai NNANet. Ini adalah solusi Nissan yang digunakan oleh karyawan untuk memesan mobil/suku cadang, mengelola penjualan rabat produk, mendapatkan info penarikan kendaraan, mengajukan klaim garansi yang diperlukan untuk menentukan harga dan memulai pekerjaan servis, dan mendapatkan informasi pembiayaan.NNANet digambarkan sebagai sumber kehidupan Nissan karena semua yang dilakukan Nissan melalui NNANet. Sistem tetap tidak aktif selama empat hari, memengaruhi operasi di banyak pengecer dan sistem produksi di dua pabrik. Perusahaan, pengecer, dan pelanggan semuanya terkena dampaknya. BenturanJelas, ini adalah contoh di mana sistem ketersediaan tinggi yang dikonfigurasi dengan benar, ditempatkan dengan benar akan menyelamatkan hari atau setidaknya meminimalkan dampak kerusakan. Apa situasi ketersediaan tinggi benar-benar berubah menjadi bencana bagi Nissan sebagai “perdagangan antara konsumen, pengecer, jaringan distribusi, pabrik dan perusahaan keuangan.” semua terpengaruh selama empat hari.[1]Nissan mengatur ulang target penjualan dealer sebesar 10 persen untuk bulan ini sebagai akibat dari kecelakaan tersebut. Dampak finansial total untuk Nissan dan dealer/pengecer/mitranya masih harus dilihat. Ketahanan TI– Contoh Dunia Nyata!Cayan™ adalah penyedia teknologi pembayaran terkemuka dan Genius Customer Engagement Platform® menggabungkan dan mengintegrasikan setiap teknologi transaksi yang mungkin, jenis pembayaran, dan program pelanggan – baik saat ini maupun di masa depan – ke dalam satu platform. Platform Genius, serta aplikasi mission-critical lainnya di Cayan, berjalan di SQL Server. Pelanggan Cayan termasuk beberapa pengecer online terbesar di dunia, perusahaan yang tidak menoleransi waktu henti. “Prioritas utama kami adalah memastikan bahwa pelanggan kami dapat menyelesaikan transaksi terus menerus 24 jam sehari, tujuh hari seminggu,” kata Paul Vienneau, Chief Technology Officer, Cayan. Cayan membutuhkan ketersediaan tinggi dan pemulihan bencana sistem untuk database SQL Server mereka. Perusahaan menganggap cluster penyimpanan bersama tradisional, tetapi solusi SAN mahal, rumit untuk dikelola, dan menimbulkan risiko yang terkait dengan satu titik kegagalan. Untuk alasan ini, staf TI Cayan memutuskan untuk menggunakan kluster SIOS #SANLess. Cluster SANLess menggunakan penyimpanan lokal sehingga overhead kinerja minimal dan waktu respons aplikasi yang cepat. Perangkat lunak SIOS, SIOS DataKeeper, terintegrasi dengan Windows Server Failover Clustering (WSFC). SIOS menggunakan efisien, real-time, replikasi data untuk menyinkronkan penyimpanan lokal di node cluster utama dan jarak jauh, membuatnya tampak di WSFC sebagai SAN virtual. BenturanSejak menerapkan kluster SIOS SANless, Cayan tidak mengalami downtime atau kehilangan data. Komentar Paul Vienneau, CTO, “Kami sangat senang dengan perangkat lunak SIOS DataKeeper. Itu bertemu atau melebihi harapan kami. Implementasi dan administrasi yang berkelanjutan mudah dilakukan, dan kami tidak mengalami downtime sejak kami mengimplementasikan klaster SIOS SANLess kami.” Tidak ada masalah kepuasan pelanggan untuk dilaporkan, tidak ada pendapatan yang hilang, tidak ada karyawan yang tidak produktif, tidak ada gangguan pada bisnis. ———————————————————————————————————————————————— SIOS: Mencapai Ketahanan TI dengan Ketersediaan TinggiSIOS DataKeeper™ menggunakan replikasi tingkat blok yang efisien untuk menjaga sinkronisasi penyimpanan lokal, memungkinkan node sekunder di cluster Anda untuk terus beroperasi setelah failover dengan akses ke data terbaru. Produk SIOS secara unik melindungi aplikasi berbasis Windows atau Linux yang beroperasi di lingkungan fisik, virtual, cloud atau hybrid cloud dan dalam kombinasi situs atau skenario pemulihan bencana, memungkinkan ketersediaan tinggi dan pemulihan bencana untuk aplikasi seperti SAP S/4HANA dan database , termasuk Oracle, SQL Server, DB2, dan banyak lainnya. Kesederhanaan “out-of-the-box”, fleksibilitas konfigurasi, keandalan, kinerja, dan efektivitas biaya produk SIOS membedakannya dari perangkat lunak pengelompokan lainnya. Di lingkungan Windows, SIOS DataKeeper Cluster Edition terintegrasi dengan mulus dan memperluas Windows Server Failover Clustering (WSFC) dengan menyediakan mekanisme replikasi data berbasis host yang dioptimalkan kinerja. Sementara WSFC mengelola kluster perangkat lunak, SIOS melakukan replikasi untuk mengaktifkan perlindungan bencana dan memastikan nol kehilangan data dalam kasus di mana kluster penyimpanan bersama tidak mungkin atau tidak praktis, seperti di lingkungan penyimpanan cloud, virtual, dan berkinerja tinggi. Di lingkungan Linux, SIOS LifeKeeper™ dan SIOS DataKeeper untuk Linux menyediakan kombinasi ketersediaan tinggi yang terintegrasi secara erat pengelompokan failover , pemantauan aplikasi berkelanjutan, replikasi data, dan kebijakan pemulihan yang dapat dikonfigurasi, melindungi aplikasi penting bisnis Anda dari waktu henti dan bencana. Baik Anda berada di lingkungan Windows atau Linux, produk SIOS membebaskan tim TI Anda dari kerumitan dan tantangan dalam menciptakan dan mengelola infrastruktur komputasi ketersediaan tinggi. Mereka menyediakan kecerdasan, otomatisasi, fleksibilitas, ketersediaan tinggi, dan kemudahan penggunaan yang dibutuhkan manajer TI untuk melindungi aplikasi penting bisnis dari waktu henti atau kehilangan data. SIOS = Ketahanan IT dengan HA + DRCadangan, ketersediaan tinggi, pemulihan bencana, dan ketahanan siber adalah elemen penting dalam mencapai ketahanan TI. Dengan solusi SIOS, Anda dapat “memeriksa kotak” untuk ketersediaan tinggi dan pemulihan bencana – dua solusi dalam satu. Dengan kemampuan untuk mereplikasi ke beberapa target, Anda dapat mengonfigurasi kluster failover multi-node dengan node yang terletak di beberapa lokasi untuk melindungi sistem Anda dari kegagalan dan bencana. Untuk informasi lebih lanjut, dan untuk memastikan ketahanan TI untuk organisasi Anda, dapatkan demo gratis SIOS hari ini. Referensi:
Direproduksi dengan izin dari SIOS |
Desember 3, 2021 |
Cara Mencapai Ketersediaan Tinggi dengan ClusterCara Mencapai Ketersediaan Tinggi dengan ClusterDireproduksi dari SIOS
|
November 28, 2021 |
Empat Alasan Untuk Menggunakan Strategi Penghindaran Dalam Ketersediaan TinggiEmpat Strategi Penghindaran untuk Meningkatkan Ketahanan, Kinerja, dan Hasil ClusterLangkah Sederhana untuk Penerapan di Lingkungan Cluster Suite Perlindungan SIOS
Menghindari sesuatu – kita semua pernah melakukannya.Api tua yang kita lihat di toko saat berjalan-jalan dengan pasangan kita, seorang penjual ketika kita tidak “siap membeli”, dan bahkan seorang bos saat kita sedang “berlibur”.Ketika saya menjadi manajer tim pengembangan, saya melihat sekilas seorang reporter langsung menjelajah di sebuah toko ketika mereka seharusnya berada di luar kantor karena sakit.Mereka merunduk di antara rak pakaian dan bergegas menyusuri lorong berikutnya dan bergegas pergi.Kita semua pernah melakukannya, dan dalam beberapa kasus, untuk kesehatan mental, kesehatan fisik, atau alasan yang tetap pribadi dan pribadi, kita semua memerlukan beberapa tindakan penghindaran.Bahkan di HAJadi, bagaimana Anda menambahkan penghindaran ke Anda? Ketersediaan Tinggi lingkungan, dan mengapa? Empat alasan untuk menggunakan strategi penghindaran di Ketersediaan Tinggi
Salah satu alasan untuk menggunakan strategi penghindaran di HA adalah untuk meningkatkan kinerja aplikasi dan server.Pertimbangkan kasus tiga server yang menjalankan beban kerja produksi, sebut saja Server Alpha, Server Beta, Server Gamma.Server Alpha dan Beta menjalankan aplikasi penting yang didukung oleh database, sementara Server Gamma menjalankan tugas laporan dan transformasi data.Jika terjadi kegagalan Server Alpha, kegagalan ke Server Beta biasanya akan terjadi.Namun, karena server Beta sudah menjalankan beban kerja yang besar, beban aplikasi tambahan yang dihasilkan dapat mengakibatkan kelebihan server yang tidak diinginkan dan kinerja yang buruk untuk kedua aplikasi.Jadi mungkin bijaksana untuk menerapkan strategi penghindaran untuk memastikan bahwa Server Gamma dipilih sebagai target failover.
Perhatikan kembali skenario tiga server, Alpha, Beta, dan Gamma.Server Alfa dan Beta diskalakan untuk menangani beban kerja puncak, sedangkan Server Gamma adalah server dengan biaya yang dioptimalkan.Jika terjadi kegagalan Server Alpha dan Server Beta, kegagalan akan terjadi pada server yang dioptimalkan biaya, Gamma.Namun, server ini tidak diskalakan untuk menangani beban kerja puncak, atau beban kerja Server Alpha dan Server Beta secara bersamaan.Dalam hal ini, strategi penghindaran dapat digunakan untuk mengoptimalkan kinerja dengan secara otomatis memindahkan satu atau kedua beban kerja dari Server Gamma segera setelah host lain tersedia.
HA Optimization adalah skenario lain untuk menerapkan strategi penghindaran. Seperti strategi pengoptimalan kinerja, pengoptimalan HA digunakan untuk memastikan bahwa lingkungan Anda dapat bertahan dari sebagian besar skenario kegagalan dan bahwa aplikasi Anda dioptimalkan untuk menyediakan tingkat ketersediaan tertinggi yang memungkinkan kapan saja.Optimalisasi HA penting untuk aplikasi seperti SAP dengan proses enqueue yang direplikasi.Di lingkungan SAP mana pun, Anda tidak ingin instans ASCS (ABAP SAP Central Service) dan ERS (enqueue replica services) berada di server yang sama untuk waktu yang lama karena risiko kehilangan kunci dan pekerjaan yang dibatalkan. Untuk mencegah hal ini terjadi, Anda dapat menggunakan strategi penghindaran yang menyebabkan instans ERS dan ASCS selalu berjalan pada node cluster yang berlawanan.Pertimbangkan kasus tiga server yang menjalankan beban kerja produksi, sebut saja Server Alpha, Beta, Gamma.Server Alpha menjalankan instance ASCS, sementara Server Beta menjalankan instance ERS.Server Gamma berfungsi sebagai node ketiga untuk failover Server Beta (ERS) dan Server Alpha (ASCS).Jika Beta mogok, Anda tidak ingin sumber daya ERS berjalan pada node yang sama dengan instans ASCS.Untuk memastikan operasi ini, Anda dapat menerapkan strategi penghindaran yang secara otomatis memeriksa terlebih dahulu dan memastikan kedua aplikasi berada di server terpisah, dan mempertahankan praktik terbaik SAP ASCS/ERS untuk penguncian failover.
Misalkan Anda memiliki dua pusat data: City Alpha dan City Beta yang berjarak sekitar 70 mil dengan sebagian besar klien Anda berlokasi di antara keduanya. Namun, karena perubahan terbaru dalam organisasi internal, merger/penutupan dan akuisisi, dan persyaratan tata kelola, tim TI Anda harus menambahkan pusat data ketiga yang terletak di City Gamma, yang berjarak sekitar 350 mil dari Alpha dan Beta.Sekarang sumber daya yang terutama dilindungi di Alpha dan Beta juga diperluas ke lokasi Gamma.Mengingat bahwa sebagian besar pengguna dan tim berada di dekat lokasi Alfa dan Beta dan bahkan pengguna paling ekstrem berada di kota-kota tetangga, tim Anda perlu menghindari failover ke lokasi Gamma. Seperti strategi lainnya, penghindaran DR berupaya mengoptimalkan kinerja, biaya data regional masuk/keluar, latensi, dan akses klien dengan menghindari node DR jika hanya satu node dalam kedua wilayah yang gagal.Ini juga akan memastikan bahwa meskipun kedua node gagal setelah waktu yang berbeda, failover selalu terjadi pada node lain di cluster atau pusat data sebelum pindah ke DR. Jadi, bagaimana Anda menerapkan strategi penghindaran?Banyak penyedia memiliki aturan afinitas yang dapat dikonfigurasi, sementara yang lain menggunakan kombinasi prioritas server atau langkah manual.Dalam kasus Suite Perlindungan SIOS untuk Linux, Anda dapat menggunakan sejumlah metode bawaan termasuk:
Jika terjadi kegagalan, sumber daya akan dialihkan ke server yang memiliki sisa prioritas terendah dan mengalir ke server tambahan mana pun (Alpha, Beta, dan Gamma).Server Alpha adalah server utama untuk Resource.HR, Server Beta adalah server utama untuk Resource.MFG, dan Server Gamma adalah server cadangan untuk semua sumber daya/server.Menggunakan prioritas sumber daya, Resource.HR akan memiliki prioritas satu (1) di Server Alpha dan prioritas dua (2) di Server Gamma.Sedangkan Resource.MFG dapat memiliki prioritas satu (1) pada Server Beta dan prioritas dua (2) pada Server Gamma.Jika pelanggan ingin mengoptimalkan penggunaan lingkungan, maka Resource.HR dapat memiliki prioritas tiga (3) pada Server Beta dan Resource.MFG dapat memiliki prioritas tiga (3) pada Server Alpha.Jika terjadi kegagalan Server Alpha, sumber daya Resource.HR akan gagal ke Server Gamma terlebih dahulu sebelum mencoba masuk layanan (dipulihkan) di Server Alpha. Suite Perlindungan SIOS untuk Linux (UI dan CLI) memungkinkan pengguna untuk menentukan prioritas untuk setiap server dan kombinasi sumber daya.
Aturan kebijakan juga dapat digunakan untuk mencegah pemulihan sumber daya terjadi pada server tertentu dan dengan demikian memungkinkan sumber daya untuk menghindari server tertentu yang mungkin menjalankan beban kerja yang lebih kritis atau intensif sumber daya.Kebijakan umum meliputi:
Perlindungan SIOS untuk Linux CLI memungkinkan pengguna untuk menentukan aturan kebijakan yang dapat menonaktifkan failover ke sumber daya tertentu untuk server tertentu, menyediakan kebijakan sementara yang menjaga kegagalan, menonaktifkan kegagalan jenis aplikasi tertentu, kebijakan kendala, dan kebijakan kustom.
Cara paling terperinci untuk menetapkan strategi penghindaran sumber daya adalah dengan menerapkan skrip penghindaran spesifik dalam setiap hierarki.Metode ini akan memungkinkan pengguna untuk mengonfigurasi aplikasi tertentu, (misalnya app1 dan app2), untuk menghindari satu sama lain bila memungkinkan sambil mengizinkan aplikasi lain berjalan tanpa batasan.Dalam kasus tiga server kami, Alpha, Beta, dan Gamma, dan tiga sumber daya app1, app2, dan app3, metode ini akan memberikan fleksibilitas terbesar.Dalam contoh ini, app1 dan app2 akan berusaha menghindari kolokasi saat server gagal, tetapi app3 akan gagal ke node berikutnya yang tersedia berdasarkan prioritas tanpa batasan kolokasi. Untuk contoh tambahan strategi dan sumber daya penghindaran, pertimbangkan Suite Perlindungan SIOS untuk Linux dokumentasi .Jika pelanggan memiliki dua aplikasi, app1 dan app2, yang mereka perlukan untuk dijalankan pada node yang berbeda bila memungkinkan, pelanggan dapat membuat dua sumber daya node daun terminal penghindaran menggunakan sumber daya gen/aplikasi SIOS Protection Suite untuk Linux dan ‘/opt/LifeKeeper /lkadm/bin/avoid_restore’ skrip. Direproduksi dari SIOS
|