Date: 12 7 月, 2020
什麼是Amazon CloudWatch?
您可以使用CloudWatch做什麼以及需要考慮的一些障礙
隨著AWS在雲市場中佔據主導地位,許多公司正在使用Amazon AWS將其本地系統遷移到雲中。 那麼,應該如何管理在AWS環境中運行的系統?
在此博客文章中,我們將介紹AWS提供的監視服務Amazon CloudWatch的功能,以及實現它的挑戰以及如何解決它們。
使用Amazon CloudWatch密切監視您的AWS環境
為了確保您擁有穩定的雲環境,快速檢測異常(“系統損害”)並及時做出響應非常重要。 對於任何遷移到雲的組織而言,監視已成為一項重要且必要的任務。 這與管理本地應用程序和基礎結構沒有什麼不同。那麼,您應該如何在AWS環境中進行監控?一種選擇是使用Amazon CloudWatch,它監視CPU,內存和磁盤使用情況,並在超過預定閾值時通知您。 另外,您可以設置自己的指標來監視各種項目,例如應用程序日誌。
關於Amazon CloudWatch的最好之處在於,它是AWS本身提供的一項服務。 它與Amazon EC2和其他AWS服務具有很高的親和力,因此它可以快速響應頻繁的功能擴展和規範更改,並可以輕鬆支持AWS Auto Scaling,後者會根據負載自動增加或減少資源。 Amazon CloudWatch可根據每種環境的獨特情況提供精確的監控。
Amazon CloudWatch實施挑戰
儘管Amazon CloudWatch非常適合擁有經驗豐富的雲工程師和DevOps團隊的組織,但一般用戶應該注意一些事項。
Amazon CloudWatch可有效監視組織的AWS環境,但它需要一定水平的技能和知識來配置和部署。 尤其是當您設置自己的指標,設置警報或考慮到Auto Scaling時,複雜性會增加。 例如,如果要設置監視,這很容易,但是如果要設置電子郵件,重新啟動,自動縮放等,則可能會遇到困難,具體取決於資源情況。
如果您要使用“發生錯誤時重新啟動服務器”之類的指示來自動化恢復過程,則必須首先使用AWS Lambda腳本創建恢復方案,該腳本提供了有關條件和要採取的措施的詳細說明。 您的團隊對AWS Lambda有多熟悉?
Amazon CloudWatch的主要優點是您可以密切監視您的環境,但是要做到這一點,您必須事先為每個系統正確設計要監視的項目以及何時監視閾值等。 這些設計任務可能會花費很多時間。 當然,您的關鍵任務系統需要以這種方式進行嚴密監視,但是這種詳細程度和復雜程度並不適合所有系統。對於某些網站,例如內部網站或WordPress服務器,您將希望最大程度地降低運營和人工成本。在這種情況下,我們建議您考慮使用一種更易於操作和管理的工具。
SIOS AppKeeper,用於監視在AWS上運行的操作系統和應用程序服務
對於非關鍵任務應用,我們建議使用SIOS Technology的SIOS AppKeeper。 AppKeeper易於安裝和配置,並可監視在EC2實例上運行的應用程序的服務(進程)。 當檢測到錯誤時,AppKeeper會自動重新啟動服務,並在必要時重新啟動實例。 即使是初次遷移到雲的用戶也可以設置AppKeeper來監視其EC2實例並自動恢復,而無需具備複雜的腳本編寫技能。
使用AppKeeper,無需選擇要監視的單個服務。您只需選擇要監視的EC2實例以及要自動執行的操作即可。 您始終可以更詳細地了解要監視哪些服務以及如何監視這些服務,但是AppKeeper的設計使其易於配置。 當檢測到錯誤或從中自動恢復錯誤時,會記錄並存儲故障日誌,以便以後可以調查故障原因。
建議您不要根據Amazon SLA和恢復要求清點環境清單,而要使用SIOS AppKeeper監視您想減少運營開銷的系統和應用程序,而不是使用Amazon CloudWatch來密切監視AWS環境中的所有內容。
請繼續關注未來的博客文章,我們將更詳細地比較如何設置CloudWatch和AppKeeper以執行相同的功能。