AWS Resilience Hub – 耐障害性管理 - AWS レジリエンスハブ

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Resilience Hub – 耐障害性管理

AWS Resilience Hub を使用すると、 AWS アプリケーションの耐障害性を定義、検証、追跡するための一元的な場所が得られます。 AWS Resilience Hub は、アプリケーションを中断から保護し、復旧コストを削減してビジネス継続性を最適化し、コンプライアンスと規制の要件を満たすのに役立ちます。 AWS Resilience Hub を使用して、以下を実行できます。

  • インフラストラクチャを分析し、アプリケーションの障害耐性を向上させるための推奨事項を入手してください。アプリケーションの耐障害性を向上させるためのアーキテクチャガイダンスに加えて、この推奨事項では、障害耐性ポリシーを満たし、統合および配信 (CI/CDSOPs) パイプラインでアプリケーションを使用してデプロイおよび実行できるテスト、アラーム、標準運用手順 () を実装するためのコードを提供します。

  • さまざまな条件下で、目標復旧時間 (RTO) と目標復旧時点 (RPO) の目標を評価します。

  • 復旧コストを削減しながら、事業継続性を最適化します。

  • 本番環境で問題が発生する前に問題を特定して解決します。

アプリケーションを本番環境にデプロイしたら、CI/CD パイプライン AWS Resilience Hub に を追加して、本番環境にリリースされる前にすべてのビルドを検証できます。

AWS Resilience Hub の仕組み

次の図は、 AWS Resilience Hub の仕組みの概要を示しています。

の AWS Resilience Hub 仕組みを示すフローチャート。
説明

AWS CloudFormation スタック、Terraform 状態ファイル、 AWS Resource Groups Amazon Elastic Kubernetes Service クラスターからリソースをインポートしてアプリケーションを記述するか、 で既に定義されているアプリケーションから選択できますmyApplications。

定義

アプリケーションの回復力ポリシーを定義します。これらのポリシーにはRTO、アプリケーション、インフラストラクチャ、アベイラビリティーゾーン、およびリージョンの中断に対する および RPOターゲットが含まれます。これらの目標は、アプリケーションが障害耐性ポリシーを満たしているかどうかを推定するために使用されます。

評価

アプリケーションについて説明し、それに障害耐性ポリシーを添付したら、障害耐性評価を実行します。この AWS Resilience Hub 評価では、 AWS Well-Architected フレームワークのベストプラクティスを使用して、アプリケーションのコンポーネントを分析し、潜在的な回復力の弱点を発見します。これらの弱点は、インフラストラクチャの設定が不完全であること、設定ミス、または追加の設定改善が必要な状況によって発生する可能性があります。障害耐性を向上させるには、評価レポートの推奨事項に従ってアプリケーションと障害耐性ポリシーを更新してください。推奨事項には、コンポーネント、アラーム、テスト、復旧の設定が含まれますSOPs。その後、別の評価を行い、その結果を前回のレポートと比較して、障害耐性がどの程度向上するかを確認できます。推定ワークロードRTOと推定ワークロードが RTOおよび RPOのターゲットRPOを満たすまで、このプロセスを繰り返します。

検証

テストを実行して、 AWS リソースの回復力と、アプリケーション、インフラストラクチャ、アベイラビリティーゾーン、インシデント AWS リージョン からの復旧にかかる時間を測定します。回復性を測定するために、これらのテストでは AWS リソースの停止をシミュレートします。停止の例としては、ネットワーク使用不可エラー、フェイルオーバー、プロセス停止、Amazon RDSブートリカバリ、アベイラビリティーゾーンの問題などがあります。

表示と追跡

AWS アプリケーションを本番環境にデプロイした後、 AWS Resilience Hub を使用してアプリケーションの障害耐性体制の追跡を継続できます。停止が発生した場合、オペレーターは で停止を表示 AWS Resilience Hub し、関連する復旧プロセスを起動できます。