Date: September 23, 2021
Tag: Linux
Memahami dan Menghindari Skenario Otak Terpisah
Membelah otak. Sebagian besar pembaca blog kami pasti pernah mendengar istilah tersebut, dalam konteks komputasi, namun kami tidak bisa tidak bersimpati dengan mereka yang citra mental pertamanya adalah kekacauan yang akan terjadi jika seseorang memiliki dua otak, keduanya sama-sama memegang kendali pada saat itu. waktu yang sama.
Apa itu Skenario Failover Cluster Split Brain?
Dalam skenario failover cluster split brain, tidak ada node yang dapat berkomunikasi dengan yang lain, dan server siaga dapat mempromosikan dirinya sendiri untuk menjadi server aktif karena diyakini bahwa node aktif telah gagal. Hal ini menyebabkan kedua node menjadi ‘aktif’ karena masing-masing akan melihat yang lain gagal. Akibatnya, integritas dan konsistensi data terganggu karena data pada kedua node akan berubah. Ini disebut sebagai otak terbelah.
Ada dua jenis skenario split-brain yang mungkin terjadi untuk hierarki sumber daya SAP HANA jika langkah-langkah yang tepat tidak diambil untuk menghindarinya.
- Otak Pemisahan Sumber Daya HANA: Sumber daya HANA Aktif (ISP) pada beberapa node cluster. Situasi ini biasanya disebabkan oleh pemadaman jaringan sementara yang mempengaruhi jalur komunikasi antara node cluster.
- Replikasi Sistem SAP HANA Split Brain: Sumber daya HANA Aktif (ISP) pada node utama dan Siaga (OSU) pada node cadangan, tetapi database berjalan dan terdaftar sebagai situs replikasi utama pada kedua node. Situasi ini biasanya disebabkan oleh kegagalan untuk menghentikan database pada node utama sebelumnya selama failover, mengaktifkan Autostart untuk database, atau administrator database secara manual menjalankan “hdbnsutil -sr_takeover” di situs replikasi sekunder di luar lingkungan perangkat lunak pengelompokan .
Menghindari Masalah Otak Terbelah
Rekomendasi untuk menghindari atau menyelesaikan setiap jenis skenario otak terbelah dalam Suite Perlindungan SIOS lingkungan pengelompokan diberikan di bawah ini.
Saat dalam skenario split-brain, pesan yang mirip dengan berikut ini dicatat dan disiarkan ke semua konsol terbuka setiap interval quickCheck (default 2 menit) hingga masalah teratasi.
EMERG:hana:quickCheck:HANA-SPS_HDB00:136363:WARNING: Terjadi kegagalan komunikasi sementara antara server hana2-1 dan hana2-2. Intervensi manual diperlukan untuk meminimalkan risiko kehilangan data. Untuk mengatasi situasi ini, harap hentikan salah satu hierarki sumber daya berikut: HANA-SPS_HDB00 pada hana2-1 atau HANA-SPS_HDB00 pada hana2-2. Server tempat hierarki sumber daya dihentikan layanannya akan menjadi situs Replikasi Sistem SAP HANA sekunder.
Rekomendasi untuk resolusi:
- Selidiki database pada setiap node cluster untuk menentukan instance mana yang berisi data paling mutakhir atau relevan. Penentuan ini harus dilakukan oleh administrator database yang memenuhi syarat yang akrab dengan data.
- Sumber daya HANA pada simpul yang berisi data yang perlu dipertahankan akan tetap Aktif (ISP) di LifeKeeper, dan hierarki sumber daya HANA pada simpul yang akan didaftarkan ulang sebagai situs replikasi sekunder akan ditiadakan sepenuhnya di Penjaga Kehidupan. Klik kanan pada setiap sumber daya daun dalam hierarki sumber daya HANA pada simpul di mana hierarki harus dihentikan dan klik Sedang dalam perbaikan …
- Setelah hierarki sumber daya SAP HANA berhasil dihentikan, LifeKeeper akan mendaftarkan ulang node Siaga sebagai situs replikasi sekunder selama interval quickCheck berikutnya (default 2 menit). Setelah replikasi dilanjutkan, semua data pada node Siaga yang tidak ada pada node Aktif akan hilang. Setelah node Siaga didaftarkan ulang sebagai situs replikasi sekunder, hierarki SAP HANA telah kembali ke status sangat tersedia.
Replikasi Sistem SAP HANA Resolusi Otak Split
Saat dalam skenario split-brain ini, pesan yang mirip dengan yang berikut ini dicatat dan disiarkan ke semua konsol yang terbuka setiap saat. Periksa interval (default 2 menit) hingga masalah teratasi.
EMERG:hana:quickCheck:HANA-SPS_HDB00:136364:PERINGATAN: Basis data SAP HANA HDB00 berjalan dan terdaftar sebagai master utama pada hana2-1 dan hana2-2. Intervensi manual diperlukan untuk meminimalkan risiko kehilangan data. Untuk mengatasi situasi ini, harap hentikan instance database HDB00 pada hana2-2 dengan menjalankan perintah 'su – spsadm -c “sapcontrol -nr 00 -function Stop”' di server tersebut. Setelah dihentikan, itu akan menjadi situs Replikasi Sistem SAP HANA sekunder.
Rekomendasi untuk resolusi:
- Selidiki database pada setiap node cluster untuk menentukan apakah ada data penting di node siaga yang tidak ada di node aktif. Jika data penting telah dikomit ke database pada node Standby saat dalam keadaan split-brain, data perlu disalin secara manual ke node Aktif. Penentuan ini harus dilakukan oleh administrator database yang memenuhi syarat yang akrab dengan data.
- Setelah data yang hilang telah disalin dari database pada node Siaga ke node Aktif, hentikan database pada node Siaga dengan menjalankan perintah yang diberikan dalam pesan peringatan LifeKeeper:
su – adm -c “sapcontrol -nr <Inst#> -function Stop” di mana ID Sistem SAP huruf kecil untuk instalasi HANA dan <Inst#> adalah nomor instans untuk instans HDB (misalnya, nomor instans, misalnya, HDB00 adalah 00)
- Setelah database berhasil dihentikan, LifeKeeper akan mendaftarkan ulang node Siaga sebagai situs replikasi sekunder selama interval quickCheck berikutnya (default 2 menit). Setelah replikasi dilanjutkan, semua data pada node Siaga yang tidak ada pada node Aktif akan hilang. Setelah node Siaga didaftarkan ulang sebagai situs replikasi sekunder, hierarki SAP HANA telah kembali ke status sangat tersedia.
Menyadari skenario otak terbelah yang umum dan mengambil langkah-langkah ini untuk menguranginya dapat menghemat waktu Anda dan melindungi integritas data.
Direproduksi dengan izin dari SIOS