April 26, 2022 |
Satu-satunya cara terbaik untuk menyebarkan kuorum/saksiSatu-satunya cara terbaik untuk menyebarkan kuorum/saksiSelama pertemuan baru-baru ini, pelanggan mengajukan pertanyaan tentang Ketersediaan Tinggi (HA) dan kebutuhan kelayakan kuorum/saksi. Pertanyaan mereka adalah, “Apa cara terbaik untuk menyebarkan kuorum/saksi?” Jawaban atas pertanyaan mereka sederhana, tidak ada satu pun cara terbaik untuk menerapkan kuorum.Untuk memahami alasannya, mari kita mulai dengan mendefinisikan tiga hal utama: apa yang dimaksud dengan sumber saksi, sumber kuorum, dan skenario otak terbelah. Apa itu otak terbelah?Dalam lingkungan cluster normal, aplikasi yang dilindungi berjalan pada node utama di cluster.Jika terjadi kegagalan aplikasi pada node utama tersebut, perangkat lunak pengelompokan memindahkan operasi aplikasi ke node sekunder atau remote, yang mengambil peran utama. Pada waktu tertentu, hanya ada satu simpul utama. Split brain adalah suatu kondisi yang terjadi ketika anggota cluster tidak dapat berkomunikasi satu sama lain, tetapi dalam keadaan berjalan dan beroperasi, dan kemudian mengambil kepemilikan sumber daya bersama secara bersamaan. Akibatnya, Anda memiliki dua pengemudi bus yang memperebutkan kemudi.Otak terbelah, karena sifatnya yang merusak, dapat menyebabkan kehilangan data atau kerusakan data dan sebaiknya dihindari melalui penggunaan fungsi anggar, kuorum, saksi, atau kuorum/saksi untuk arbitrase klaster. Di sebagian besar manajer klaster, kuorum dipertahankan ketika:
Di sebagian besar manajer klaster, kuorum hilang ketika:
Apa itu sumber daya saksi (atau server)?Sumber daya saksi adalah server, titik akhir jaringan, atau perangkat yang digunakan untuk mencapai dan mempertahankan kuorum ketika sebuah cluster memiliki jumlah anggota yang genap.Sebuah cluster dengan jumlah anggota ganjil, menggunakan mayoritas cluster, tidak perlu menggunakan sumber daya saksi karena semua anggota server cluster menengahi keanggotaan mayoritas. Apa yang dimaksud dengan kuorum dan sumber kuorum?Sumber daya kuorum adalah sumber daya (perangkat, sistem, penyimpanan blok, penyimpanan file, berbagi file, dll) yang berfungsi sebagai sarana untuk arbitrase status dan keanggotaan cluster.Di beberapa manajer klaster, kuorum adalah sumber daya di dalam klaster yang membantu atau diperlukan untuk setiap status klaster dan keputusan keanggotaan klaster.Di manajer klaster lain, kuorum berfungsi sebagai pemutus ikatan untuk menghindari perpecahan otak. Lebih dari Satu Cara untuk Menyebarkan KuorumMengingat sifat kritis kuorum, arsitektur HA sangat penting untuk menyebarkan sumber daya kuorum/saksi dengan benar, dan untungnya (atau sayangnya) tidak ada satu pun , cara terbaik untuk menerapkan kuorum.Ada beberapa faktor yang dapat membentuk cara di mana saksi dan sumber-sumber kuorum Anda berperilaku.Faktor-faktor ini meliputi: 1. Apakah penerapan Anda akan dilakukan di tempat, cloud, atau hybridMenyebarkan di pusat data lokal di mana perangkat penyimpanan tambahan, seperti penyimpanan saluran serat, perangkat atau koneksi kontrol daya, atau perangkat stonith tradisional hadir akan memberi pelanggan opsi tambahan untuk fungsi kuorum dan saksi yang mungkin tidak berada di cloud.Demikian pula, lingkungan cloud dan hibrid menghadirkan perbedaan dalam hal apa yang dapat diterapkan dan kuorum kasus penggunaan apa yang diterapkan untuk dicegah. Selain itu, persyaratan dan perbedaan latensi dapat membatasi jenis perangkat dan sumber daya apa yang tersedia untuk konfigurasi kuorum/saksi. 2. Tujuan pemulihan AndaTujuan pemulihan juga penting untuk dipertimbangkan saat merancang dan merancang sumber daya kuorum dan saksi Anda.Dalam contoh dua cluster node (node A dan node B), ketika node A mengalami kehilangan konektivitas ke node B, apa prioritas tertinggi untuk pemulihan. Jika sumber saksi/kuorum berada dalam jaringan yang sama dengan simpul A, ini dapat mengakibatkan simpul A tetap online, tetapi terputus dari klien, sementara simpul B tidak dapat menilai kuorum dan pengambilalihan.Demikian juga, jika perangkat kuorum hanya hidup di wilayah, pusat data, atau jaringan dengan node B, kehilangan dapat mengakibatkan kegagalan sumber daya ke jaringan atau pusat yang mati atau jauh dari node utama yang berfungsi dan beroperasi. 3. Redundansi Pusat Data (atau Wilayah) yang Tersedia Dalam Infrastruktur AndaRedundansi pusat data atau wilayah juga merupakan faktor penting dalam topologi HA Anda dengan kuorum/saksi. Jika pusat data Anda hanya memiliki dua tingkat redundansi, Anda harus memahami keseimbangan antara penempatan kuorum/saksi di pusat data yang sama dengan node cluster utama atau standby. Jika pusat data memiliki lebih dari dua tingkat redundan, seperti zona ketersediaan ketiga atau akses ke wilayah kedua, opsi ini akan memberikan tingkat redundansi yang lebih tinggi untuk cluster. 4. Persyaratan Pemulihan BencanaMemahami persyaratan pemulihan bencana Anda yang sebenarnya juga merupakan faktor utama dalam desain Anda. Jika perangkat lunak manajer klaster Anda memerlukan akses ke kuorum/saksi untuk memulihkan dari pemadaman pusat data total (atau kegagalan wilayah), maka Anda harus memahami dampak ini pada desain Anda.Banyak paket perangkat lunak ketersediaan tinggi memiliki alat atau metode untuk skenario ini, tetapi jika perangkat lunak Anda tidak, desain dan penempatan kuorum/saksi Anda mungkin perlu mengakomodasi kenyataan ini. 5. Jumlah Anggota Dalam Cluster, dan Lokasi MerekaServer kuorum/saksi tambahan biasanya tidak diperlukan ketika cluster berisi jumlah node yang ganjil.Namun, jika hanya menggunakan dua node dalam sebuah cluster atau menggunakan node DR yang tidak selalu tersedia dapat mengubah arsitektur Anda.Sebagai Wakil Presiden Pengalaman Pelanggan, saya telah bekerja dengan pelanggan yang telah menerapkan tiga arsitektur simpul, tetapi untuk penghematan biaya, mereka mengotomatiskan penghentian berkala server ketiga. 6. Sistem Operasi dan Manajer ClusterFaktor terakhir yang disebutkan dalam kuorum/saksi adalah pengelola klaster dan sistem operasi.Tidak semua perangkat lunak HA dan manajer cluster sama dalam hal penyebaran kuorum/saksi atau arbitrase status kuorum.Beberapa perangkat lunak pengelompokan memerlukan disk bersama untuk arbitrase, yang lain lebih fleksibel memungkinkan pembagian (NFS, SMB, EFS, File Azure, dan S3).Menyadari apa yang dibutuhkan manajer klaster Anda, dan mode yang didukungnya terkait dengan kuorum (mayoritas sederhana, saksi, berbagi file, dll.) tidak hanya akan memengaruhi apa yang Anda terapkan, tetapi juga bagaimana Anda menerapkannya. Satu-satunya cara terbaik untuk menyebarkan server kuorum/saksi adalah dengan memahami definisi vendor Anda tentang kuorum/saksi dan opsi yang tersedia, mengetahui kebutuhan Anda, mempertimbangkan keterbatasan atau peluang yang disajikan oleh pusat data Anda (atau lingkungan cloud) dan merancang solusinya yang memberikan sistem kritis Anda tingkat perlindungan tertinggi terhadap otak terbelah, kegagalan palsu, dan waktu henti. -Cassius Rhee, Wakil Presiden, Pengalaman Pelanggan |
||||||||||||||||||||||||||||||||||||||||||
April 21, 2022 |
Mengukur dan Meningkatkan Performa Throughput Tulis di GCP Menggunakan SIOS DataKeeper untuk WindowsMengukur dan Meningkatkan Performa Throughput Tulis di GCP Menggunakan SIOS DataKeeper untuk WindowsLatar belakangPostingan ini berfungsi untuk mendokumentasikan temuan saya di GCP terkait performa penulisan ke disk yang direplikasi ke GCP. Tapi pertama-tama, beberapa informasi latar belakang. Seorang pelanggan menyatakan keprihatinannya bahwa DataKeeper menambahkan sejumlah besar overhead ke kinerja tulis mereka saat menguji dengan cermin sinkron antara Google Zones di wilayah yang sama. Tes asli yang mereka lakukan adalah dengan file bitmap pada drive C, yang merupakan SSD persisten. Dalam konfigurasi ini mereka hanya mendorong sekitar 70 MBps. Mereka mencoba merelokasi bitmap ke disk GCP ekstrem, tetapi performanya tidak meningkat. Memindahkan Bitmap ke SSD LokalSaya menyarankan agar mereka memindahkan bitmap ke SSD lokal, tetapi mereka ragu-ragu karena mereka percaya disk ekstrim yang mereka gunakan untuk bitmap memiliki latensi dan throughput yang sama baiknya atau lebih baik daripada SSD lokal, jadi mereka ragu itu akan membuat perbedaan. Selain itu, menambahkan SSD lokal bukanlah tugas sepele karena hanya dapat ditambahkan saat VM awalnya disediakan. Memilih Jenis InstanceSaat saya mulai menyelesaikan tugas saya, hal pertama yang saya temukan adalah tidak semua jenis instans mendukung SSD lokal. Misalnya, E2-Standard-8 tidak mendukung SSD lokal. Untuk pengujian pertama saya, saya memilih jenis instans C2-Standar-8, yang dianggap “dioptimalkan untuk komputasi”. Saya memasang SSD persisten 500 GB dan mulai menjalankan beberapa tes kinerja tulis dan dengan cepat menemukan bahwa saya hanya bisa membuat disk menulis sekitar 140MBps daripada kecepatan maksimal 240MBps. Pelanggan mengkonfirmasi bahwa mereka melihat hal yang sama. Itu membingungkan, tetapi kami memutuskan untuk melanjutkan dan mencoba jenis instance yang berbeda. Jenis instans kedua yang kami pilih adalah N2-Standar-8. Dengan jenis instans ini, kami dapat mendorong disk ke kecepatan throughput maksimum 240 MBps saat tidak mereplikasi disk. Saya memindahkan bitmap ke SSD lokal yang telah saya sediakan dan mengulangi tes yang sama pada mirror sinkron (DataKeeper v8.8.2) dan mendapatkan hasil yang ditunjukkan di bawah ini. HasilParameter uji diskspd diskspd.exe -c96G -d10 -r -w100 -t8 -o3 -b64K -Sh -LD:data.dat diskspd.exe -c96G -d10 -r -w100 -t8 -o3 -b8K -Sh -LD:data .dat diskspd.exe -c96G -d10 -r -w100 -t8 -o3 -b4K -Sh -LD:data.dat MBpsData
KesimpulanUkuran tulis 64k dan 4k semuanya dikenakan overhead yang dapat dianggap sebagai "dapat diterima" untuk replikasi sinkron. Ukuran tulis 8k tampaknya menimbulkan jumlah overhead yang lebih signifikan, meskipun latensi rata-rata 3,183 ms masih cukup rendah. -Dave Bermingham, Direktur, Keberhasilan Pelanggan Direproduksi dengan izin dari SIOS |
||||||||||||||||||||||||||||||||||||||||||
April 17, 2022 |
Bagaimana COVID-19 Mempengaruhi Ketersediaan TinggiBagaimana COVID-19 Mempengaruhi Ketersediaan TinggiDibandingkan dengan teman, keluarga, dan mereka yang membutuhkan perawatan, rawat inap, atau perawatan intensif, gejala COVID saya ringan. Ini kemungkinan merupakan hasil dari kesehatan yang cukup baik, baik dosis vaksin, suntikan booster, maupun deteksi dini dan pengobatan.Dan, hati saya untuk setiap keluarga yang kehilangan orang yang dicintai karena aspek apa pun dari pandemi ini, dan untuk semua orang yang kehilangan kesempatan dan momen spesial.Saat saya dan beberapa anggota tim SIOS kami pulih dari COVId-19, kami ingin membagikan lima hal yang mungkin dihadapi Tim TI Anda saat mereka memerangi COVID dan waktu henti perusahaan, dan lima hal yang dapat Anda lakukan untuk membantu mereka. Lima Kekhawatiran COVID Menghadapi Tim IT
Jadi, apa yang harus dilakukan oleh tim TI, pemangku kepentingan, dan manajer ketika tim mereka mengalami masalah dengan COVID-19. Lima Cara untuk Membantu Tim IT Memerangi COVID
Saat pandemi berlanjut, kita semua berharap untuk masa depan yang sangat menyerupai keadaan normal, termasuk lebih sedikit penyakit, ketakutan, dan kekhawatiran.Sementara itu, menjadi lebih sadar akan kekhawatiran yang dihadapi anggota tim Anda selama penyakit dan pemulihan COVID akan sangat membantu Anda secara proaktif mempersiapkan dan mengatasi badai saat ini.Selain itu, pelajaran utama yang dipetik dari pandemi ini dapat diterapkan di sejumlah organisasi lain, kehidupan karyawan, dan masalah global. Direproduksi dengan izin dari SIOS |
||||||||||||||||||||||||||||||||||||||||||
April 13, 2022 |
Cara Mendapatkan Hasil Maksimal dari Panggilan Dukungan Teknis AndaCara Mendapatkan Hasil Maksimal dari Anda Panggilan Dukungan TeknisPakar dukungan teknis membagikan kiat mereka tentang cara mempercepat penyelesaian masalahSIOS memberikan perlindungan ketersediaan tinggi untuk aplikasi, database, dan ERP paling penting pelanggan kami. Saat pelanggan kami menghubungi dukungan teknis, tidak ada waktu untuk disia-siakan. Kami telah mendapatkan reputasi (dan beberapa penghargaan) untuk keahlian HA/DR dan keunggulan dukungan kami. Kami telah meminta tim dukungan teknis kami untuk membagikan lima pertanyaan berikut yang dapat mempercepat penyelesaian masalah Anda. Diagnosis yang Cepat dan AkuratDukungan teknis yang menyeluruh dan akurat mirip dengan mendiagnosis suatu penyakit. Bayangkan meminta dokter Anda untuk mengobati sakit kepala. Tubuh manusia adalah interaksi kompleks dari berbagai sistem. Sumber masalah Anda mungkin tidak jelas atau bahkan di kepala Anda. Untuk mendiagnosis masalah dan merekomendasikan perawatan, dokter Anda biasanya memulai dengan pertanyaan yang ditujukan untuk mengidentifikasi keadaan yang menyebabkan gejala Anda. Pengelompokan failover juga melibatkan banyak sistem di setiap lapisan infrastruktur TI – jaringan, penyimpanan, OS, aplikasi, database, dan server. Dan seperti sakit kepala Anda yang sebenarnya, masalah HA Anda sering kali disebabkan oleh sesuatu yang tidak terkait dengan perangkat lunak pengelompokan HA Anda. Seperti dokter Anda, seorang profesional pendukung yang baik akan mengajukan berbagai pertanyaan untuk mengkarakterisasi masalah Anda. Semakin banyak informasi yang dapat Anda berikan tentang masalah dukungan Anda, semakin cepat dan efektif masalah tersebut dapat didiagnosis dan diselesaikan. Resolusi Masalah Pelacakan CepatSebagai praktik terbaik TI, pertimbangkan untuk mencatat informasi utama dan perubahan sistem sebagai latihan bisnis yang berkelanjutan. Dengan memberikan jawaban atas pertanyaan kunci berikut di ujung jari Anda, proses ini akan mempercepat diagnosis dan penyelesaian masalah jalur cepat. (Ini juga dapat membantu Anda mencegah masalah terjadi di tempat pertama).
Selama lebih dari 20 tahun, tim Pengalaman Pelanggan SIOS telah membantu pelanggan perusahaan menerapkan solusi HA/DR untuk berbagai kasus penggunaan. Kami menghargai pelanggan kami dan mendorong mereka untuk menghubungi kami setiap kali mereka memiliki pertanyaan tentang HA/DR mereka.
|
||||||||||||||||||||||||||||||||||||||||||
April 9, 2022 |
Dua Kebenaran dan Kebohongan: Memahami Kebenaran Sejati Tentang KetersediaanDua Kebenaran dan Kebohongan: Memahami Kebenaran Sejati Tentang KetersediaanKami memainkan dua kebenaran dan kebohongan di acara perusahaan tahun lalu. Permainan melibatkan mengajukan dua pernyataan yang benar dan satu pernyataan yang tidak benar untuk melihat apakah Anda bisa menipu kebanyakan orang. Pemenang mengajukan ide-ide yang semuanya tampak dapat dipercaya atau tidak dapat dipercaya, tergantung pada sejarah pribadi Anda. Inilah yang dikatakan:
Saya tumbuh dalam komunitas kecil tanpa lampu lalu lintas, sehingga tampaknya mungkin, tetapi saya skeptis. Saya pernah mendengar cerita tentang orang-orang yang bertemu di usia dini, dan menikah di usia remaja, jadi itu mungkin tetapi juga salah satu yang mungkin ingin saya tandai. Yang ketiga juga tampaknya benar, tetapi saya bertanya-tanya siapa yang akan pindah dari universitas luar negeri yang bergengsi kembali ke kota asal tanpa lampu lalu lintas untuk kuliah di perguruan tinggi negeri. Untuk apa yang tampak seperti selamanya, seluruh kelompok beralasan dan merenungkan mana dari tiga pernyataan yang bohong.Dan, sepertinya tidak ada yang bisa melihatnya. Beberapa dari kami beralasan bahwa jika kampung halaman tidak memiliki lampu lalu lintas, apakah benar-benar ada universitas juga?Beberapa orang berpendapat bahwa kecil kemungkinannya dia kuliah di universitas luar negeri yang bergengsi, mengingat usianya, tahun-tahun di perusahaan itu, dan berbagai gelar.Setelah musyawarah akhir putusan itu, dua kebenaran itu nomor satu dan nomor dua.Kebohongan itu nomor tiga. Dengan semua informasi yang berputar-putar tentang Ketersediaan Tinggi , Anda mungkin merasa seperti sedang memainkan permainan "Dua Kebenaran dan Kebohongan". Tergantung di mana Anda melihat, Anda mungkin menemukan pernyataan tentang ketersediaan yang tampaknya dapat dipercaya, tetapi tidak sepenuhnya benar saat Anda menggali lebih dalam.Misalnya, pernyataan yang diterima secara luas berikut ini sebenarnya tidak benar:
Jadi Apa Kebenaran Sejati?Ketika rekan kerja kami membagikan tiga pernyataannya, kami semua salah.Kampung halamannya adalah komunitas kecil, perbatasannya disangga oleh kota-kota besar dengan lampu lalu lintas, tetapi kotanya sendiri tidak memilikinya sendiri. Dan, ternyata, dia lulus lebih awal dan pergi ke institut teknologi luar negeri yang terkenal dan bergengsi di Georgia, sebelum rindu kampung halaman dan pindah ke universitas negeri di kampung halamannya.Jadi kebohongannya adalah tentang kakek-neneknya.Meskipun mereka mungkin atau mungkin tidak bertemu pada usia dini, mereka pasti tidak bertemu di kelas dua. Kebenaran tentang ketersediaan tinggi adalah bahwa ketersediaan penyimpanan dan ketersediaan platform atau infrastruktur tidak cukup dengan sendirinya.Untuk menciptakan infrastruktur ketersediaan tinggi yang paling kuat, tersedia, tangguh, dan andal, Anda juga harus menyertakan solusi tingkat komersial untuk menyediakan pemantauan, peringatan, dan pemulihan yang sadar aplikasi.Anda juga ingin solusi tersebut mengetahui kemampuan ketersediaan tinggi penyimpanan Anda, memiliki kesadaran yang kuat tentang nuansa dan kesenjangan infrastruktur, dan memiliki kemampuan untuk memanfaatkan praktik terbaik di seluruh arsitektur untuk membantu aplikasi, database, dan layanan Anda mencapai tujuan bisnis Anda. |