November 23, 2022 |
SAP pada Praktik Terbaik Ketersediaan Tinggi AzureSAP pada Praktik Terbaik Ketersediaan Tinggi AzureDalam video berikut, Bala Anbalagan, arsitek senior SAP untuk Microsoft dengan pengalaman 20 tahun di SAP, menjelaskan praktik terbaik untuk mengonfigurasi ketersediaan tinggi guna melindungi solusi SAP di Azure. Dia juga meninjau kesalahan yang sering dilakukan saat mengimplementasikan solusi HA di cloud dan faktor utama yang harus diketahui pengguna saat mengonfigurasi SIOS LifeKeeper. Mengonfigurasi Solusi Ketersediaan Tinggi SAP di CloudBala menjelaskan bahwa setiap pengguna SAP harus ingat bahwa a ketersediaan tinggi solusi sangat diperlukan, terutama di cloud. Setiap penyedia cloud perlu membuat perubahan di lingkungan mereka. Meskipun mereka memiliki tingkat layanan yang tinggi untuk infrastruktur perangkat keras mereka, akan ada periode waktu henti singkat yang dapat membuat sistem SAP Anda benar-benar mati. Penting juga bagi pengguna untuk mengonfigurasi SAP HA dengan benar. Tujuan utama penginstalan solusi HA adalah untuk melindungi dari downtime, tetapi jika Anda tidak melakukannya dengan benar, Anda hanya membuang-buang waktu dan uang, terlepas dari cloud tempat Anda menjalankannya. Penting untuk mengikuti aturan konfigurasi penyedia cloud Anda. Jika Anda salah mengonfigurasi HA atau gagal menguji failover dan failback, ini dapat menyebabkan gangguan bisnis saat Anda tidak menduganya – khususnya selama periode pemanfaatan tinggi. Apa yang membuat konfigurasi SIOS mudah?SIOS memiliki proses konfigurasi yang cukup mudah. Pada dasarnya, Anda hanya perlu LifeKeeper diinstal di setiap node cluster Anda dan Anda menggunakan berbagai jenis modul kit pemulihan khusus aplikasi (ARK) SIOS (yang disertakan dengan LifeKeeper) tergantung pada aplikasi yang ingin Anda pulihkan. Selain itu, prosesnya sangat mudah diikuti dengan GUI langsung – kecerdasan sudah ada di dalamnya, dan Anda tidak perlu mengubah detail GUI. Secara otomatis mendeteksi sebagian besar informasi, semakin menyederhanakan proses penyiapan. Mengetahui ARK mana yang akan digunakan dan cara menggunakannya penting dalam proses konfigurasi. ARK adalah modul perangkat lunak yang menyediakan kecerdasan khusus aplikasi untuk perangkat lunak LifeKeeper. SIOS menyediakan ARK terpisah untuk aplikasi yang berbeda. Misalnya, untuk SAP HANA, Anda menginstal SIOS SAP HANA ARK untuk mengaktifkan LIfeKeeper untuk mengotomatiskan langkah-langkah konfigurasi, mendeteksi kegagalan, dan mengelola failover yang andal untuk SAP HANA sembari mempertahankan praktik terbaik SAP. Kesalahan Terbesar dalam Menerapkan HA untuk SAP di AzurePengguna biasanya menerapkan HA untuk solusi SAP di Azure dengan proses yang sama seperti yang mereka lakukan di lingkungan lokal. Mereka perlu mengubah pola pikir mereka. Selalu pastikan untuk mengikuti rekomendasi yang diberikan oleh cloud provider, yaitu membaca dokumen dan menyimpan parameter sesuai anjuran cloud provider. Kesalahan umum lainnya adalah menambahkan terlalu banyak kerumitan. Beberapa pelanggan memasukkan semuanya ke dalam satu cluster, tetapi cluster harus dipisahkan untuk server yang berbeda. Membuat cluster terlalu besar menambah kerumitan yang tidak perlu dan potensi risiko. Pengujian menyeluruh dalam setiap aspek sangat penting dalam hal pengelompokan HA. Menguji konfigurasi HA sebelum ditayangkan serta secara berkala (dan sering) adalah hal terbaik yang dapat Anda lakukan untuk mencegah waktu henti yang tidak terduga. Belajar lebih tentang SAP ketersediaan tinggi praktik terbaik dalam video di bawah atau hubungi kami untuk informasi selengkapnya tentang menerapkan ketersediaan tinggi dan pemulihan bencana untuk aplikasi penting Anda di cloud. Direproduksi dengan izin dari SIOS
|
November 20, 2022 |
Hari-hari sederhana HA & DR telah berlaluHari-hari sederhana HA & DR telah berlaluMembolak-balik saluran TV, saya tersandung pada adegan dalam film "He's Just Not That Into You" dengan Drew Barrymore, mengatakan apa yang sebagian besar dari kita rasakan di tahun 2022 tentang Teknologi dan terutama ketersediaan tinggi dan pemulihan bencana: "Saya merindukan hari-hari ketika Anda memiliki satu nomor telepon dan satu mesin penjawab dan satu mesin penjawab itu memiliki satu kaset dan satu kaset itu memiliki pesan dari seorang pria atau tidak. Dan sekarang Anda hanya perlu berkeliling memeriksa semua portal berbeda ini hanya untuk ditolak oleh tujuh teknologi berbeda. Ini melelahkan.” Terkadang, tidakkah Anda berharap hanya ada satu cloud atau bahkan mungkin tidak ada platform cloud; satu DB berjalan di satu OS; dan hanya aplikasi ujung depan yang perlu dikhawatirkan. Tapi, dunia telah berubah dan bergerak lebih cepat, dan menjadi lebih rumit.Kemajuan teknologi, dampak dari merger dan akuisisi, serta meningkatnya selera dan kecepatan masyarakat kita selama 24/7, dengan miliaran konsumen yang mencari kesepakatan terbaru dan pengalaman terbaik, berarti hari-hari sederhana telah berlalu. 4 kebenaran keras tentang ketersediaan Anda
Tentu saja lingkungan perusahaan Anda tidak sederhana.Anda memiliki sistem dan aplikasi lawas, jenis yang sudah ada hampir sejak kartu berlubang.Anda memiliki sistem baru, dibuat untuk aplikasi dan database generasi baru.Selain itu, Anda memiliki solusi yang dibuat satu dekade lalu untuk menjembatani kesenjangan atau rentang waktu antara bermigrasi dari satu platform ke platform lainnya, tetapi terlepas dari upaya terbaik Anda, sistem ini tetap ada. Ditambah dengan tantangan ini adalah kumpulan sistem dan sumber daya TI yang berkembang dari merger dan akuisisi Perusahaan U. Menyampaikan HA tidak sesederhana yang Anda pikirkan di era baru.
Sebagai Wakil Presiden Pengalaman Pelanggan, kami telah melihat kerusakan yang disebabkan oleh arsitektur yang buruk.Meskipun penerapan perangkat lunak HA pasti dapat membantu meningkatkan ketersediaan aplikasi dan database, perangkat lunak HA tidak akan pernah sepenuhnya mengatasi persyaratan yang tidak lengkap, jaringan yang buruk, kurangnya perangkat keras yang berlebihan, atau komponen arsitektur lainnya yang hilang.Tim kami pernah bekerja dengan pelanggan untuk memperbaiki lingkungan berukuran kecil yang membuat sistem mereka tidak stabil selama waktu pengoperasian puncak.Karena arsitektur mereka yang buruk, yang mencakup ketidakstabilan jaringan dan perangkat keras, tim mereka sering kesulitan untuk memulihkan diri dari masalah downtime yang dapat dihindari.Untuk mendapatkan solusi yang lengkap dan sehat, sangat tersedia, dan tangguh, Anda perlu menerapkan perangkat lunak yang hebat sebagai bagian dari arsitektur yang baik.
Mengembangkan solusi HA tangguh tingkat perusahaan dengan ketersediaan tinggi, dibangun di atas arsitektur yang solid dengan kemampuan untuk berkembang bukanlah proses yang sederhana.Merancang dan merancang ketahanan, aplikasi, dan ketersediaan data tidak semudah mengambil sekotak campuran kue dari rak.Lemparkan berbagai alat, proses dari tim yang berbeda, campuran SLA, dan jenis OS, aplikasi, database, dan platform dan Anda memiliki resep untuk membutuhkan bantuan. Baru-baru ini, saya mewawancarai seorang veteran 20 tahun yang bekerja di lingkungan dukungan perusahaan.Dia menggambarkan berapa banyak dari rekan-rekannya, dan bahkan dirinya sendiri, belum mampu menangani beban mempertahankan ketersediaan perusahaan kritis.Admin Anda, tidak hanya membutuhkan bantuan ketika mereka sudah bangun sejak jam 2 pagi berurusan dengan bencana, multi-sistem, multi-aplikasi, runtuhnya pusat data yang hampir selesai, tetapi juga dalam kerja keras sehari-hari ketersediaan perusahaan di salah satu yang paling era teknologi yang kompleks yang pernah ada.
“Sementara penyedia cloud publik biasanya menjamin beberapa tingkat ketersediaan dalam perjanjian tingkat layanan mereka, SLA tersebut hanya berlaku untuk perangkat keras cloud.” Ada banyak alasan lain untuk downtime aplikasi yang tidak dicakup oleh SLA penyedia cloud, termasuk:
Sebagai VP Pengalaman Pelanggan, kami telah melihat satu atau dua hal, termasuk serangan denial of service yang disebabkan oleh gagal keluar dalam rutinitas rekursi, kelelahan sistem, karantina perangkat lunak keamanan aplikasi yang sehat, kritis, kepanikan kernel, dan mesin virtual yang secara acak menyalakan ulang.Jika strategi HA Anda hanya mengandalkan SLA hypervisor Anda, solusi Anda mungkin tidak tersedia sebanyak yang Anda kira. Anda perlu melindungi aplikasi penting dengan perangkat lunak pengelompokan yang dapat memantau dan mendeteksi masalah, merespons masalah dengan andal, dan jika perlu memindahkan operasi ke server siaga untuk memastikan bahwa produk dan layanan Anda tetap andal dan tersedia saat dan di mana pun dibutuhkan. Pusat data tunggal kami telah menjadi serangkaian platform cloud, yang mencakup lusinan pusat data.Aplikasi kerja sigung kami telah menjadi bagian dari perkumpulan solusi front end, middleware, dan backend kritis yang harus kami kelola di Windows, Linux, dan beberapa varietas * Nix yang berbeda.Pawai teknologi berarti bahwa kita ketersediaan tinggi telah menjadi lebih kompleks dan membutuhkan arsitektur yang lebih baik.Ini juga berarti bahwa tim kita membutuhkan lebih banyak bantuan untuk mengelola semuanya, dan jika kita tidak berhati-hati, itu bisa berarti kita tetap rentan dan terekspos.Manakah dari empat kebenaran yang paling banyak dihadapi tim Anda? Cassius Rhue, Pengalaman Pelanggan VP Direproduksi dengan izin dari SIOS |
November 15, 2022 |
Apa yang Dilakukan Driver Baru di SIOS LifeKeeper untuk Windows Untuk Anda?Apa yang Dilakukan Driver Baru di SIOS LifeKeeper untuk Windows Untuk Anda?Membuat perlindungan data di lingkungan bersama dan tanpa SAN menjadi lebih kuat di tahun-tahun mendatang.Apa Coca-Cola, KitKat, SalesForce, dan SIOS LifeKeeper untuk Windows memiliki kesamaan?Berikut adalah beberapa petunjuk:
Perusahaan-perusahaan ini membuat peningkatan signifikan pada produk, layanan, dan solusi ikonik mereka untuk melayani pelanggan mereka dengan lebih baik, beradaptasi dan mempersiapkan masa depan, dan memanfaatkan kekuatan mereka.Dengan cara yang sama, SIOS telah membuat peningkatan dramatis pada produk SIOS LifeKeeper untuk Windows kami. Sebelum LifeKeeper untuk Windows versi 8.9.0, fungsi penyimpanan bersama, termasuk pagar I/O serta identifikasi dan manajemen drive ditangani oleh driver NCR_LKF.Dimulai dengan rilis SIOS LifeKeeper untuk Windows versi 8.9.0, SIOS Technology Corp. mendesain ulang arsitektur driver penyimpanan bersama. Dimulai dengan rilis saat ini, driver NCR_LKF telah dihapus dan diganti dengan driver SIOS ExtMirr, mesin di belakang replikasi penyimpanan tanpa SAN dari SIOS DataKeeper / SIOS DataKeeper Cluster Edition. Lima manfaat signifikan dari perubahan arsitektur NCR_LKF di SIOS LifeKeeper untuk Windows:
Driver ExtMirr menyediakan driver filter yang lebih modern untuk mengelola fungsionalitas penyimpanan bersama.Sementara driver NCR_LKF berfokus pada "menyalakan lampu" dan "keamanan data", arsitektur driver tertinggal dari driver yang lebih modern.Driver ExtMirr mempertahankan perlindungan data tersebut, sekaligus lebih kompatibel, lebih modern, dan lebih mudah didukung di versi OS Windows yang lebih baru.
Pengemudi yang digunakan dalam SIOS DataKeeper dan SIOS DataKeeper Cluster Edition menyertakan arsitektur pagar yang kuat. Sementara driver NCR_LKF mampu menahan I/O, driver baru ini lebih tangguh dan telah diuji di lingkungan SAN dan tanpa SAN. Pagar I/O yang ditingkatkan memanfaatkan kunci volume dan informasi kepemilikan node dalam volume yang dilindungi.
Memanfaatkan pagar I/O untuk driver ExtMirr yang digunakan dalam produk DataKeeper berarti solusi LifeKeeper untuk Windows meningkat dalam integrasi dengan lini produk DataKeeper.Driver ExtMirr juga termasuk yang terbaru Penandatanganan driver Microsoft dan bekerja mulus dengan Sistem Operasi yang menerapkan penandatanganan driver dan Boot Aman.
Driver ExtMirr memberi pelanggan dan administrator sekumpulan besar utilitas baris perintah untuk mendapatkan dan mengelola status volume.Perintah emcmd asli untuk kedua produk SIOS DataKeeper. Mereka sekarang dapat digunakan untuk administrasi yang lebih mudah dengan konfigurasi volume bersama SIOS LifeKeeper. Pelanggan dan mitra yang memanfaatkan penyimpanan bersama dan konfigurasi yang direplikasi dengan LifeKeeper untuk produk Windows kini memiliki seperangkat alat baris perintah untuk diketahui dan digunakan. Alat emcmd menggantikan volume.exe, volsvc, dan alat driver filter NCR_LKF serupa sebelumnya untuk administrasi (mengunci, membuka kunci, dll).
Dengan penambahan driver ExtMirr ke dalam SIOS LifeKeeper untuk Windows, konfigurasi penyimpanan bersama, serta konfigurasi replikasi, kini akan mengalami peningkatan dalam pembaruan, fitur baru, dan perbaikan. Sementara driver NCR_LKF menyediakan fondasi yang kokoh dan basis yang stabil untuk pagar I/O, beralih ke driver ExtMirr berarti pelanggan akan melihat kekuatan dan stabilitas yang sama, dengan pembaruan yang lebih cepat untuk dukungan produk baru Menyelaraskan dua produk ke satu driver mungkin tidak sama mencoloknya dengan pembaruan SalesForce Classic ke Lightning, tetapi menambahkan fungsionalitas yang signifikan, meningkatkan kekuatan dan umur panjang solusi SIOS DataKeeper dan SIOS LifeKeeper, dan akan membuat perlindungan data di lingkungan bersama dan tanpa SAN menjadi lebih kuat untuk tahun-tahun mendatang. Cassius Rhue, Pengalaman Pelanggan VP Direproduksi dengan izin dari SIOS |
November 11, 2022 |
Cara membuat ulang sistem file dan sumber daya mirror untuk memastikan informasi ukuran sudah benarCara membuat ulang sistem file dan sumber daya mirror untuk memastikan informasi ukuran sudah benarSaat bekerja dengan clustering ketersediaan tinggi (HA), penting untuk memastikan bahwa konfigurasi semua node dalam cluster sejajar satu sama lain. Konfigurasi 'cermin' ini membantu meminimalkan titik kegagalan pada kluster, memberikan standar perlindungan HA yang lebih tinggi. Sebagai contoh, kami telah melihat situasi di mana mirror-size diperbarui pada node sumber tetapi informasi yang sama tidak diperbarui pada node target. Ketidakcocokan ukuran mirror mencegah LifeKeeper memulai node target dalam failover. Di bawah ini adalah langkah-langkah yang disarankan untuk membuat ulang sumber cermin pada node target dengan informasi ukuran yang sama dengan sumber: Langkah:
![]()
![]()
![]() Kemudian, pilih sumber daya Sistem File (/mnt/sps) untuk Tag Sumber Daya Anak. ![]() Ini akan menghasilkan dua hierarki, satu dengan sumber daya IP (VIP) dan satu lagi dengan sumber daya sistem file (/mnt/fs) dan sumber daya cermin (datarep-sps).
![]()
Contoh: mount /dev/sdb1 /mnt/sps
![]()
![]()
Ketika resource "extend" selesai pilih "Finish" dan kemudian "Done". ![]()
![]()
![]() Direproduksi dengan izin dari SIOS |
November 9, 2022 |
Menjelaskan Perbedaan Halus tapi Penting Antara Switchover, Failover, dan RecoveryMenjelaskan Perbedaan Halus tapi Penting Antara Switchover, Failover, dan RecoveryKetersediaan tinggi adalah spesialisasi dan seperti kebanyakan spesialisasi, ia memiliki kosakata dan terminologinya sendiri. Pelanggan kami biasanya sangat berpengetahuan tentang TI tetapi jika mereka belum pernah bekerja di lingkungan HA, beberapa terminologi HA umum kami dapat menyebabkan cukup banyak kebingungan – bagi mereka dan bagi kami. Mereka terdengar sederhana tetapi dengan makna yang sangat spesifik dalam konteks HA. Tiga istilah ini dibahas di sini – swithover, failover, dan recovery. Apa itu Peralihan? ?Peralihan adalah dimulai oleh pengguna tindakan melalui ketersediaan tinggi (HA) solusi pengelompokan antarmuka pengguna atau CLI. Dalam peralihan, pengguna secara manual memulai tindakan untuk mengubah sumber atau server utama untuk aplikasi yang dilindungi. Dalam skenario peralihan yang khas, semua aplikasi dan dependensi yang berjalan dihentikan secara berurutan, dimulai dengan aplikasi induk dan diakhiri ketika semua turunan/dependensi dihentikan. Setelah aplikasi dan dependensinya dihentikan, mereka kemudian dimulai ulang secara teratur di server utama atau sumber yang baru ditunjuk. Misalnya, jika Anda memiliki sumber daya Alpha, Beta, dan Gamma. Resource Alpha bergantung pada resource Beta dan Gamma. Sumber Daya Beta tergantung pada sumber daya Gamma.Dalam peristiwa peralihan, sumber daya Alpha dihentikan terlebih dahulu, diikuti oleh Beta, dan akhirnya Gamma.Setelah ketiganya dihentikan, peralihan terus membawa sumber daya ke status operasional di server yang dimaksud.Proses dimulai dengan sumber daya Gamma, diikuti oleh Beta, dan akhirnya operasi start up selesai untuk sumber daya Alpha. Takeaway kunci: Jika tidak ada kegagalan untuk menyebabkan tindakan, maka itu adalah peralihan Apa itu Failover?Operasi failover biasanya merupakan tindakan yang dimulai oleh non-pengguna sebagai respons terhadap kerusakan server atau reboot yang tidak terduga/tidak direncanakan. Pertimbangkan skenario cluster HA dengan dua node, Node A dan Node B.Dalam skenario ini, semua aplikasi penting Alpha, Beta, dan Gamma dimulai dan beroperasi di Node A. Dalam skenario ini, failover adalah apa yang terjadi ketika Node A mengalami reboot yang tidak terduga/tidak direncanakan, matikan, hentikan, atau panik. Setelah perangkat lunak HA mendeteksi bahwa Node A tidak lagi berfungsi dan tersedia secara operasional dalam cluster (seperti yang ditentukan oleh solusi), itu akan memicu operasi failover untuk memulihkan akses aplikasi kritis, sumber daya, layanan, dan dependensi pada node cluster yang tersedia , Node B dalam hal ini.Dalam skenario failover, karena Node A telah mengalami crash (atau kegagalan langsung simulasi lainnya) tidak ada proses untuk berhenti pada Node A, dan akibatnya setelah tindakan deteksi dan pagar yang tepat telah diproses, Node B akan segera memulai proses pemulihan sumber daya. Seperti dalam kasus peralihan, proses dimulai dengan sumber daya Gamma, diikuti oleh Beta, dan akhirnya operasi pengaktifan selesai untuk sumber daya Alpha. Secara tradisional, operasi failover membutuhkan waktu lebih sedikit daripada switchover. Hal ini karena pengolahan kegagalan tidak memerlukan sumber daya apa pun untuk dihentikan (atau dihentikan) pada node primer (dalam-layanan atau aktif) sebelumnya. ![]() Takeaway Kunci: Kegagalan terjadi sebagai respons terhadap kegagalan sistem. Apa Pemulihan ?Peristiwa pemulihan mudah dikacaukan dengan failover. Peristiwa pemulihan terjadi ketika proses, server, jalur komunikasi, disk, atau bahkan sumber daya cluster gagal dan perangkat lunak ketersediaan tinggi beroperasi sebagai respons terhadap kegagalan yang diidentifikasi. Sebagian besar solusi perangkat lunak HA mampu melakukan berbagai cara untuk menangani peristiwa pemulihan. Metode yang paling menonjol meliputi:
Karena banyaknya variasi dalam kebijakan pemulihan, mudah untuk melihat peristiwa pemulihan yang menyerupai perilaku peralihan. Hal ini sering terjadi pada metode 1 dan 5. Dalam skenario ini, aplikasi dan layanan dihentikan secara tertib sebelum dimulai pada node jarak jauh. Metode 2 dan 3, pelanggan akan sering melihat perilaku yang mirip dengan failover. Dalam metode 2 dan 3, server utama dimulai ulang atau dipagari oleh perangkat lunak HA yang menciptakan perilaku yang dapat diamati mirip dengan failover.Metode 4 biasanya merupakan opsi yang jarang digunakan, tetapi merupakan gabungan dari peralihan dan kegagalan.Metode 4 dimulai dengan penghentian aplikasi dan layanan dengan anggun, diikuti dengan memulai ulang aplikasi dan layanan (seperti peralihan). Namun, jika restart lokal aplikasi dan layanan gagal, sistem akan dimulai ulang (seperti failover), tetapi tanpa benar-benar gagal ke node cluster jarak jauh. Meskipun jarang, Metode 4 sering digunakan dalam kasus di mana terdapat klaster yang tidak seimbang, atau digunakan dengan metodologi berbasis kebijakan. Takeaway kunci: Peristiwa pemulihan tergantung pada metode yang dipilih. Terminologi HA antara vendor adalah area di mana istilah umum dapat memiliki arti yang berbeda. Saat Anda menerapkan dan memelihara solusi klaster Anda dengan aplikasi perusahaan, pastikan Anda memahami persyaratan penyedia solusi untuk failover, switchover, dan pemulihan.Dan, saat Anda melakukannya, pastikan Anda tahu apakah restoran akan meletakkan saus di samping (dalam piring), atau di samping (kentang tumbuk Anda) Diperbanyak dengan izin dari SIOS |