本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS Resilience Hub – 彈性管理
AWS Resilience Hub 可讓您集中定義、驗證和追蹤 AWS 應用程式的彈性。 AWS Resilience Hub 可協助您保護應用程式免受中斷,並降低復原成本,以最佳化業務連續性,協助滿足合規和法規要求。您可以使用 AWS Resilience Hub 執行下列動作:
-
分析您的基礎設施並取得建議,以改善應用程式的彈性。除了改善應用程式彈性的架構指引之外,建議還提供程式碼以符合彈性政策、實作測試、警示和標準操作程序 (SOPs),您可以在整合和交付 (CI/CD) 管道中與您的應用程式部署和執行。
-
在不同條件下評估復原時間目標 (RTO) 和復原點目標 (RPO)。
-
最佳化業務永續性,同時降低復原成本。
-
在生產中發生問題之前,先識別並解決問題。
在將應用程式部署至生產環境之後,您可以將 AWS Resilience Hub 新增至 CI/CD 管道,以便在發行至生產環境之前驗證每個建置。
AWS Resilience Hub 運作方式
下圖提供如何 AWS Resilience Hub 運作的高階大綱。
- 描述
-
從 AWS CloudFormation 堆疊、Terraform 狀態檔案、Amazon Elastic Kubernetes Service 叢集匯入資源 AWS Resource Groups,或從已在 中定義的應用程式進行選擇,以描述您的應用程式myApplications。
- 定義
-
為您的應用程式定義彈性政策。這些政策包括應用程式、基礎設施、可用區域RTO和區域中斷的 和 RPO 目標。這些目標用於估計應用程式是否符合彈性政策。
- 評估
-
在您描述應用程式並將彈性政策連接至應用程式後,請執行彈性評估。 AWS Resilience Hub 評估使用 Well-Architected Framework 的 AWS 最佳實務來分析應用程式的元件,並發現潛在的恢復能力弱點。這些弱點可能是基礎設施設定不完整、組態錯誤,或需要額外組態改善的情況所造成。若要改善彈性,請根據評估報告的建議更新您的應用程式和彈性政策。建議包括元件、警示、測試和復原的組態SOPs。然後,您可以執行另一個評估,並將結果與先前的報告進行比較,以查看改善多少彈性。重複此程序,直到您的預估工作負載RTO和預估工作負載RPO符合您的 RTO和 RPO 目標為止。
- 驗證
-
執行測試以測量 AWS 資源的彈性,以及從應用程式、基礎設施、可用區域和 AWS 區域 事件復原所需的時間。為了測量彈性,這些測試會模擬 AWS 資源的中斷。中斷的範例包括網路無法使用錯誤、容錯移轉、已停止的程序、Amazon RDS開機復原,以及可用區域的問題。
- 檢視和追蹤
-
在將 AWS 應用程式部署到生產環境之後,您可以使用 繼續 AWS Resilience Hub 追蹤應用程式的彈性狀態。如果發生中斷,操作員可以在 中檢視中斷, AWS Resilience Hub 並啟動相關聯的復原程序。