기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
레질리언스 분석 프레임워크
존 포르멘토, 브루노 에머, 스티븐 후퍼, 제이슨 바르토, 마이클 하켄, 아마존 웹 서비스 (AWS)
2023년 9월(문서 기록)
일관되고 반복 가능한 표준 및 프로세스는 지속적인 개선의 중요한 부분입니다. 이는 분산 시스템의 복원력에서도 마찬가지입니다. 이 지침의 목적은 장애 모드를 분석하고 워크로드에 미치는 영향을 일관되게 분석하는 방법을 제공하는 복원력 분석 프레임워크를 소개하는 것입니다. 설계에서 운영에 이르기까지 워크로드의 라이프사이클 전반에 걸쳐 이 프레임워크를 사용하면 일관되고 반복 가능한 방식으로 광범위한 잠재적 장애 모드에 대한 워크로드의 복원력을 지속적으로 개선할 수 있습니다. 이를 통해 레질리언스 목표를 달성하고 워크로드의 원하는 레질리언스 속성을 유지할 수 있습니다.
이 프레임워크는 여러 업계의 고객과 함께 작업한 AWS 솔루션 아키텍처 현장 팀의 경험을 바탕으로 개발되었습니다. 제품 관리자, 소프트웨어 개발자, 시스템 엔지니어, 운영 팀, 설계자 등 다양한 직함을 가질 수 있는 건축업자를 대상으로 합니다. 이들은 분석 대상 시스템, 서비스 또는 제품에 대해 가장 잘 아는 사람들입니다. 지속적인 연습에서 프레임워크를 사용하면 점진적인 진전을 이루고 장기적인 탄력성 목표를 달성하는 데 도움이 될 수 있습니다.
프레임워크의 초점은 잠재적 장애 모드와 그 영향을 완화하는 데 사용할 수 있는 예방 및 수정 조치를 식별하는 것입니다. 종속성의 오류율 증가와 같이 사용자가 직접 제어할 수 없는 구성 요소에서 장애가 발생하더라도 이러한 장애가 워크로드에 미치는 영향과 이러한 장애에 대응하도록 해당 워크로드를 설계하는 방법을 고려해야 합니다. 궁극적으로는 다음 사항에 집중해야 합니다.대응할 수 있는 장애제어할 수 있는 완화 방법을 사용함으로써
이 가이드에서는 프레임워크를 개괄적으로 설명한 다음 워크로드를 식별하고 문서화하는 방법, 해당 워크로드에 프레임워크를 적용하는 방법, 발견된 잠재적 장애에 대한 완화 전략을 평가하는 방법을 설명합니다.
목차