レジリエンス分析フレームワーク - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

レジリエンス分析フレームワーク

アマゾンウェブサービスのジョン・フォルメント、ブルーノ・エマー、スティーブン・フーパー、ジェイソン・バート、マイケル・ハーケン (AWS)

2023 年 9 月(ドキュメント履歴)

一貫性のある反復可能な基準とプロセスは、継続的改善の重要な部分です。これは分散システムのレジリエンスにも当てはまります。このガイダンスの目的は、障害モードとそれがワークロードに及ぼす影響を分析する一貫した方法を提供する回復力分析フレームワークを導入することです。このフレームワークを設計から運用に至るまで、ワークロードのライフサイクル全体にわたって使用することで、さまざまな潜在的な障害モードに対するワークロードの耐障害性を一貫性のある再現可能な方法で継続的に向上させることができます。これにより、レジリエンスの目標を達成し、ワークロードの望ましいレジリエンス特性を維持することができます。

このフレームワークは、AWS ソリューションアーキテクチャのフィールドチームがさまざまな業界の顧客と協力してきた経験を基に開発されました。プロダクトマネージャー、ソフトウェア開発者、システムエンジニア、運用チーム、アーキテクトなど、さまざまな役職に就く可能性のあるビルダーを対象としています。これらは、分析対象のシステム、サービス、または製品について最もよく知っている人々です。このフレームワークを継続的に使用することで、段階的な進歩を遂げ、長期的なレジリエンス目標を達成することができます。

フレームワークの焦点は、潜在的な障害モードと、その影響を軽減するために使用できる予防および是正措置を特定することです。依存関係でのエラー率の上昇など、直接制御できないコンポーネントで障害が発生した場合でも、それらの障害がワークロードにどのように影響するか、また障害に対応するようにそのワークロードをどのように設計するかを検討する必要があります。最終的には、次のことに焦点を当てる必要があります。対応できる障害自分でコントロールできる緩和策を用いることによって

このガイドでは、フレームワークの概要を説明し、次にワークロードを特定して文書化する方法、フレームワークをそのワークロードに適用する方法、および潜在的な障害を発見した場合の緩和戦略を評価する方法について説明します。

目次