Amazon CloudWatch – Funktionen

Übersicht

Amazon CloudWatch ist ein Überwachungs- und Management-Service, der Daten und umsetzbare Einblicke für AWS-, On-Premises, Hybrid- und andere Cloud-Anwendungen sowie Infrastruktur-Ressourcen bereitstellt. Sie können auch alle Ihre Leistungs- und Funktionsdaten in Form von Protokollen und Metriken von einer einzigen Plattform aus erfassen und darauf zugreifen, anstatt diese in Silos (Server, Netzwerk oder Datenbank) zu überwachen. CloudWatch ermöglicht Ihnen die Überwachung Ihres gesamten Stacks (Anwendungen, Infrastruktur, Netzwerk und Services) und die Nutzung von Alarmen, Protokollen und Ereignisdaten, um automatisierte Aktionen auszuführen und die durchschnittliche Zeit zur Problemlösung (Mean Time to Resolution, MTTR) zu verkürzen. Dies setzt wichtige Ressourcen frei und ermöglicht es Ihnen, sich auf die Erstellung von Anwendungen und die Schaffung von Geschäftswert zu konzentrieren.

CloudWatch bietet Ihnen umsetzbare Einsichten, durch die Sie die Anwendungsleistung optimieren, die Ressourcenauslastung verwalten und den systemweiten Funktionszustand verstehen können. CloudWatch bietet bis zu einer Sekunde Sichtbarkeit von Metrik- und Protokolldaten, 15 Monate Datenaufbewahrung (Metriken) und die Möglichkeit, Berechnungen an den Metriken auszuführen. Dies ermöglicht Ihnen die Durchführung von Verlaufsanalysen zur Kostenoptimierung sowie einen Echtzeiteinblick in Bezug auf die Optimierung von Anwendungen und Infrastrukturressourcen. Mit CloudWatch Container Insights können Sie Ihre containerisierten Anwendungen und Microservices überwachen, Fehler beheben und Alarme auslösen. Mit CloudWatch können Sie Nutzungsdaten zur Datenverarbeitung erfassen, aggregieren und zusammenfassen, darunter CPU-, Speicher-, Festplatten und Netzwerkdaten, aber auch Diagnoseinformationen, wie z. B. Container-Neustartfehler, um so DevOps-Techniker dabei zu unterstützen, Probleme zu isolieren und sie schneller zu lösen. Mit Container Insights erhalten Sie Einblicke in Container-Verwaltungsservices, darunter Amazon ECS for Kubernetes (EKS), Amazon Elastic Container Service (ECS), AWS Fargate und das unabhängige Kubernetes (k8s). 

Sammeln

Mit dem Amazon-CloudWatch-Logs-Service können Sie Protokolle Ihrer Ressourcen, Anwendungen und Services nahezu in Echtzeit sammeln und speichern. Es gibt drei Hauptkategorien von Protokollen:

1) Verkaufte Protokolle. Diese werden von AWS-Services nativ für Sie veröffentlicht. Zurzeit werden Amazon-VPC-Flow-Protokolle und Amazon-Route-53-Protokolle unterstützt.

2) Von AWS-Services veröffentlichte Protokolle. Zurzeit veröffentlichen mehr als 30 AWS-Services Protokolle auf CloudWatch. Diese Services umfassen Amazon API Gateway, AWS Lambda, AWS CloudTrail und viele mehr.

3) Benutzerdefinierte Protokolle. Dabei handelt es sich um Protokolle von Ihrer eigenen Anwendung und von lokalen Ressourcen sowie von anderen Clouds.

Sie können mit AWS Systems Manager einen CloudWatch-Agenten installieren oder mit der API-Aktion PutLogData Protokolle mühelos veröffentlichen.

Amazon CloudWatch ermöglicht Ihnen die Erfassung von Standardmetriken von über 70 AWS-Services, z. B. Amazon Elastic Compute Cloud (Amazon EC2), Amazon DynamoDB, Amazon Simple Storage Service (Amazon S3), Amazon ECS, AWS Lambda und Amazon API Gateway, ohne dass Sie irgendeine Maßnahme ergreifen müssen. So veröffentlichen Amazon-EC2-Instances beispielsweise automatisch Metriken über die CPU-Nutzung, die Datenübertragung und die Datenträgernutzung, damit Sie Statusänderungen besser verstehen. Sie können integrierte Metrikern für API Gateway zur Erfassung der Latenz oder integrierte Metriken für AWS Lambda zur Erkennung von Fehlern und Drosselungen nutzen. Amazon CloudWatch ermöglicht Ihnen ebenfalls die Erfassung von Anwendungsmetriken (z. B. Nutzeraktivität, Fehlermetriken oder verbrauchter Speicher) aus Ihren eigenen Anwendungen, um die Leistungsfähigkeit zu überwachen, Probleme zu beheben und Trends zu erkennen. Sie können diese Metriken mit CloudWatch Agent oder der API-Aktion PutMetricData in CloudWatch veröffentlichen. Wenn Sie über die Standard-Infrastruktur-Metriken hinausgehende detailliertere Metriken benötigen, z. B. gemeinsame Metriken von Amazon Kinesis Data Streams, können Sie diese einfach pro Ressource wählen. Ähnlich sind Anwendungsmetriken mit einer Frequenz von bis zu einer Sekunde verfügbar, und können in Statistik, Diagrammen und Warnungen mit hoher Auflösung genutzt werden.

Container Insights vereinfacht die Sammlung und Aggregierung von kuratierten Metriken und Protokollen für das Container-Ökosystem. Es sammelt Leistungsmetriken zur Datenverarbeitungsleistung, wie z. B. CPU-, Speicher-, Netzwerk-und Festplattendaten, aus den einzelnen Containern als Leistungsereignisse und generiert automatisch angepasste Metriken, die für die Überwachung und für Alarmmeldungen verwendet werden. Die Leistungsereignisse werden als CloudWatch Logs mit Metadaten zur ausgeführten Umgebung aufgenommen, z. B. die Amazon-EC2-Instance-ID, Service und die Amazon Elastic Block Store (Amazon EBS)-Volume-Bindungsbereitstellung und -ID, um die Überwachung und Fehlerbehebung zu vereinfachen. Die angepassten Metriken in CloudWatch werden automatisch aus diesen aufgenommenen Protokollen extrahiert und können nachfolgend mit der erweiterten Abfragesprache in CloudWatch Logs Insights weiter analysiert werden. Container Insights bietet außerdem eine Option zum Sammeln von Anwendungsprotokollen (stdout/stderr), angepassten Protokollen, vordefinierten Amazon-EC2-Instance-Protokollen, Amazon EKS/k8s-Datenebenen-Protokollen und Amazon-EKS-Steuerungsebenen-Protokollen. Bei Amazon EKS- und k8s-Clustern kann ein vordefinierter FluentD-Agent zum Sammeln Ihrer Protokolle verwendet werden. Weitere Informationen finden Sie in der Dokumentation zur Einrichtung von Container Insights-Protokollen. Bei Amazon ECS können der Amazon-CloudWatch-Logs-Protokollierungstreiber oder Fluent Bit zum Sammeln von Anwendungsprotokollen verwendet werden.

CloudWatch Lambda Insights vereinfacht die Sammlung und Aggregation von kuratierten Metriken und Protokollen aus AWS-Lambda-Funktionen. Es sammelt Rechenleistungsmetriken wie CPU, Speicher und Netzwerk von jeder Lambda-Funktion als Leistungsereignisse und generiert gleichzeitig automatisch benutzerdefinierte Metriken, die zur Überwachung und Alarmierung verwendet werden. Die Leistungsereignisse werden als CloudWatch Logs aufgenommen, um die Überwachung und Fehlerbehebung zu vereinfachen. Die angepassten Metriken in CloudWatch werden automatisch aus diesen aufgenommenen Protokollen extrahiert und können nachfolgend mit der erweiterten Abfragesprache in CloudWatch Logs Insights weiter analysiert werden. Weitere Einzelheiten finden Sie in der Dokumentation Erste Schritte mit Lambda Insights.

Mit Amazon CloudWatch Metric Streams können Sie fortlaufende, nahezu in Echtzeit ausgeführte Metriken-Streams zu einem Ziel Ihrer Wahl erstellen. Damit wird es leichter, CloudWatch-Metriken über einen HTTP-Endpunkt von Amazon Kinesis Data Firehose an beliebte Drittanbieter zu senden. Sie können einen fortlaufenden, skalierbaren Stream erstellen, einschließlich der aktuellsten CloudWatch-Metriken, um Dashboards, Alarme und andere Tools anzutreiben, die auf korrekte und zeitnahe Metrikdaten angewiesen sind. Sie können Ihre Metriken problemlos auf Ihren Data Lake in AWS lenken (z. B. auf Amazon S3) und können sofort mit der Nutzungs- oder Leistungsanalyse mit Tools wie Amazon Athena beginnen.

Überwachen

Mit der kontoübergreifenden Beobachtbarkeit in Amazon CloudWatch können Sie Anwendungen überwachen und Fehler beheben, die sich über mehrere Konten innerhalb einer Amazon-Web-Services-Region erstrecken. Sie können in einer zentralen Ansicht nach Protokollgruppen suchen, die in mehreren Konten gespeichert sind, kontoübergreifende Abfragen für Logs Insights durchführen und kontoübergreifende Regeln für Contributor Insights erstellen, um die wichtigsten Ersteller von Protokolleinträgen zu identifizieren. Außerdem können Sie Kennzahlen von vielen Konten in einer konsolidierten Ansicht visualisieren und Benachrichtigungen erstellen, bei denen Kennzahlen von anderen Konten ausgewertet werden, damit Sie über Anomalien und Tendenzen informiert werden. Mithilfe der kontoübergreifenden Beobachtbarkeit in Container Insights können Sie Ihre Container-Umgebung in Ihrem gesamten Unternehmen überwachen und Risiken proaktiv lokalisieren, bevor Ihre Benutzererfahrung beeinträchtigt wird. Mit der kontoübergreifenden Beobachtbarkeit in CloudWatch können Sie eine interaktive Karte Ihrer kontoübergreifenden Anwendungen anzeigen und mit Application Signals mit einem Schritt auf relevante Metriken, Protokolle und Traces zugreifen. Sie können diese Funktion auch verwenden, um einen kontoübergreifenden Metrik-Stream einzurichten, um Metriken, die sich über mehrere Amazon-Konten innerhalb einer Amazon-Web- Services-Region erstrecken, in einem einzigen Metrik-Stream einzubeziehen. Dank der kontoübergreifenden Beobachtbarkeit in CloudWatch erhalten Sie mit wenigen Schritten eine ganzheitliche betriebliche Übersicht, ohne dass zusätzliche Data Pipelines erforderlich sind. So sparen Sie Zeit, Aufwand und Geld bei der Verwaltung von Infrastruktur und Anwendungen.

Mit Amazon-CloudWatch-Dashboards können Sie wiederverwendbare Diagramme erstellen und Ihre Cloud-Ressourcen und Anwendungen in einer einheitlichen Ansicht visualisieren. Sie können Metriken und Protokolldaten in einem einzigen Dashboard nebeneinander grafisch darstellen, um den Kontext schnell zu erfassen und von der Problemdiagnose zum Verständnis der eigentlichen Ursache übergehen. Sie können beispielsweise Schlüsselmetriken wie die CPU- und Speichernutzung visualisieren und sie mit der Kapazität vergleichen. Sie können auch das Protokollmuster einer bestimmten Metrik in Beziehung setzen und Alarme festlegen, die bei Leistungs- und Funktionsproblemen proaktiv ausgegeben werden. Dadurch erhalten Sie einen systemweiten Einblick in den Funktionszustand und haben die Möglichkeit, Probleme schnell zu beheben und die durchschnittliche Zeit bis zur Problemlösung (Mean Time to Resolution, MTTR) zu verkürzen.

Mit den zusammengesetzten Alarmen von Amazon CloudWatch können Sie mehrere Alarme kombinieren und das Alarmrauschen reduzieren. Falls ein Anwendungsproblem mehrere Ressourcen in der Anwendung betrifft, erhalten Sie eine einzelne Alarmbenachrichtigung für die gesamte Anwendung anstelle einer Benachrichtigung für jede betroffene Ressource. Auf diese Weise können Sie sich weiterhin darauf konzentrieren, die Ursache der betrieblichen Probleme zu finden, um Anwendungsausfallzeiten zu reduzieren. Sie können einen Gesamtzustand für eine Gruppierung von Ressourcen, wie z. B. eine Anwendung, AWS-Region oder Availability Zone, bereitstellen.

Amazon-CloudWatch-Alarme ermöglichen Ihnen die Definition eines Schwellenwerts für Metriken und die Auslösung einer Aktion. Sie können hochauflösende Alarme erstellen, ein Perzentil als Statistik festlegen und ggf. eine Aktion angeben oder den Alarm ignorieren. Sie können beispielsweise Alarme für Amazon EC2-Metriken erstellen, Benachrichtigungen festlegen und eine oder mehrere Aktionen ausführen, um nicht benutzte oder nicht ausgelastete Instances zu erkennen und herunterzufahren. Echtzeitalarme für Metriken und Ereignisse ermöglichen es Ihnen, Ausfallzeiten und mögliche Auswirkungen auf die Geschäftstätigkeit auf ein Minimum zu reduzieren.

Anwendungen und Infrastrukturressourcen generieren Unmengen an Funktions- und Überwachungsdaten in Form von Protokollen und Metriken. Mit Amazon CloudWatch können Sie nicht nur auf diese Datensätze zugreifen und sie auf einer einzigen Plattform visualisieren, sondern auch Metriken und Protokolle in Beziehung setzen. Dies unterstützt Sie dabei, schnell von der Problemdiagnose zum Verstehen der eigentlichen Ursache überzugehen. Sie können z. B. ein Protokollmuster (beispielsweise einen Fehler) mit einer bestimmten Metrik in Beziehung setzen und Alarme festlegen, die bei Leistungs- und Funktionsproblemen aktiv ausgegeben werden.

Amazon CloudWatch Application Insights bietet eine automatisierte Einrichtung der Beobachtbarkeit für Ihre Unternehmensanwendungen, sodass Sie Einblick in den Zustand dieser Anwendungen erhalten. Es ermöglicht die Ermittlung und Einrichtung von Schlüsselmetriken und Protokollen für die von Ihnen genutzten Anwendungsressourcen und Technologien, z. B. Datenbank, Web- (IIS) und Anwendungsserver, Betriebssystem, Load Balancer, Warteschlangen usw. Diese Telemetriedaten werden ständig überwacht, um Anomalien und Fehler zu erkennen und zu korrelieren und Sie über Probleme in der Anwendung zu informieren. Um die Fehlersuche zu erleichtern, erstellt es automatisierte Dashboards für erkannte Probleme, in denen korrelierte metrische Anomalien und Protokollfehler sowie zusätzliche Erkenntnisse aufgeschlüsselt werden, die auf mögliche Ursachen hinweisen. Auf diese Weise können Sie schnell Gegenmaßnahmen ergreifen und sicherstellen, dass Ihre Anwendungen einwandfrei funktionieren und Endbenutzer nicht beeinträchtigt werden.

Container Insights mit verbesserter Beobachtbarkeit

Container Insights mit verbesserter Beobachtbarkeit ist jetzt für Amazon Elastic Kubernetes Service (Amazon EKS) auf EC2, Amazon Elastic Container Service (Amazon ECS) auf EC2 und ECS auf Fargate verfügbar. Verbesserte Beobachtbarkeit bietet detaillierte ECS- und EKS-Leistungsmetriken auf Containerebene, Kube-State-Metriken und EKS-Steuerebenen-Metriken, sodass Sie verschiedene Container-Ebenen visuell allgemein und detailliert aufschlüsseln können, um Probleme wie Speicherlecks in einzelnen Containern leicht zu erkennen. Container Insights zeigt Ihnen jetzt eine Liste von Container-Ebenen, die hohe Mengen an Ressourcen verbrauchen, sodass Sie Risiken in Ihrer Umgebung erkennen können, auch wenn Sie noch keine Alarme eingerichtet haben, und proaktive Maßnahmen ergreifen können, bevor Ihr Endbenutzererlebnis beeinträchtigt wird. Container Insights mit verbesserter Beobachtbarkeit bietet einen einfachen Einstieg, bei dem Sie Ihre Cluster mit dem CloudWatch-Beobachtbarkeits-Add-on für EKS automatisch instrumentieren oder mit einer einfachen Aktivierung in ECS sofort mit der Erfassung von Telemetrie beginnen können.

Container Insights ohne verbesserte Beobachtbarkeit

CloudWatch Container Insights sammelt, aggregiert und fasst Metriken und Protokolle Ihrer containerisierten Anwendungen und Microservices zusammen, die auf Amazon ECS, Amazon EKS, Kubernetes-Plattformen auf Amazon EC2 und AWS Fargate (sowohl für Amazon ECS als auch Amazon EKS) ausgeführt werden. Container Insights sammelt sofort Container-Metriken wie CPU-, Speicher-, Festplatten- und Netzwerkmetriken und bietet tiefere Diagnoseinformationen, wie z. B. Fehler beim Container-Neustart, damit Sie Probleme isolieren und schnell lösen können. Container Insights bietet die Beobachtbarkeit Ihrer Container in automatischen Dashboards, sodass Sie den Zustand und die Leistung Ihrer Anwendung einfach überwachen können. Sie können auch CloudWatch-Alarme für Container-Insights-Metriken einrichten, um über Anomalien informiert zu werden, bevor die Leistung Ihrer Anwendung beeinträchtigt wird.

 

Internet Monitor verschafft Ihnen einen Überblick darüber, wie sich Internetprobleme auf die Leistung und Verfügbarkeit zwischen Ihren bei AWS gehosteten Anwendungen und Ihren Endbenutzern auswirken, und verkürzt die Zeit, die Sie für die Diagnose dieser Probleme benötigen, von Tagen auf Minuten. Sie können Messungen für verschiedene Zeiträume und mit unterschiedlichem geografischem Detailgrad erkunden, schnell die Auswirkungen von Problemen visualisieren und dann Maßnahmen ergreifen, um Endbenutzern eine bessere Erfahrung zu bieten. So können Sie beispielsweise zu anderen AWS-Services wechseln oder Zugriffe über verschiedene AWS-Regionen zu Ihrem Workload weiterleiten. Wird ein Problem durch das AWS-Netzwerk verursacht, erhalten Sie automatisch eine Benachrichtigung über das AWS-Servicestatus-Dashboard, in der Ihnen mitgeteilt wird, welche Schritte AWS unternimmt, um das Problem zu beheben. Internet Monitor stellt in CloudWatch-Metriken und CloudWatch Logs Messungen bereit, die eine einfache Integration von Gesundheitsinformationen für Regionen und Netzwerke, die für Ihre Anwendung spezifisch sind, ermöglichen. Außerdem sendet Internet Monitor Gesundheitsereignisse an Amazon EventBridge, sodass Sie Benachrichtigungen einrichten können. Internet Monitor überwacht Ihre Anwendung über Amazon Virtual Private Clouds (VPCs), Verteilungen in Amazon CloudFront und Verzeichnisse in Amazon WorkSpaces.

CloudWatch Lambda Insights bietet automatische Dashboards in der CloudWatch-Konsole. Diese Dashboards fassen die Rechenleistung und die Fehler zusammen. Jedes Dashboard enthält die Liste der Metriken für das ausgewählte Zeitfenster und ermöglicht es Ihnen, kontextbezogen (basierend auf dem Zeitfenster und der ausgewählten Funktion) tiefer in Anwendungsprotokolle, AWS-X-Ray-Traces und Leistungsereignisse einzutauchen.

Amazon CloudWatch Anomaly Detection nutzt Machine-Learning (ML)-Algorithmen zur kontinuierlichen Analyse der Daten einer Metrik und zur Erkennung von Verhaltensanomalien. Damit können Sie Alarme erstellen, die Schwellenwerte automatisch auf Basis natürlicher Metrikmuster anpassen, darunter Uhrzeit, Saisonalität nach Wochentag oder Trendänderungen. Mithilfe von Anomalieerkennungsbändern lassen sich Metriken auch auf Dashboards visualisieren. Dadurch können Sie unerwartete Abweichungen Ihrer Metriken überwachen, isolieren und beheben.

Mit Amazon CloudWatch ServiceLens können Sie den Zustand, die Leistung und die Verfügbarkeit Ihrer Anwendungen visualisieren und analysieren. CloudWatch ServiceLens führt CloudWatch-Metriken und -Protokolle sowie Traces aus AWS X-Ray zu einer zentralen Ansicht Ihrer Anwendungen und deren Abhängigkeiten zusammen. So können Sie schnell Leistungsengpässe zuordnen, die Ursachen von Anwendungsproblemen isolieren und betroffene Nutzer ermitteln. CloudWatch ServiceLens bietet Ihnen Einblicke in drei Hauptbereiche Ihrer Anwendungen: mit Infrastrukturüberwachung (Metriken und Protokolle liefern Informationen zu den Ressourcen, die Ihre Anwendungen unterstützen), Transaktionsüberwachung (Traces bieten Informationen zu Abhängigkeiten zwischen den Ressourcen) und Endnutzerüberwachung (Canaries überwachen die Endpunkte und benachrichtigen Sie, wenn sich das Endbenutzererfahrung verschlechtert). CloudWatch ServiceLens bietet eine Serviceübersicht, in der die Verknüpfungen all Ihrer Ressourcen in ihrem Kontext visualisiert werden. Über eine intuitive Benutzeroberfläche können Sie korrelierte Überwachungsdaten einer gründlichen Analyse unterziehen.

Mit Amazon CloudWatch Synthetics können Sie Anwendungsendpunkte einfacher überwachen. Es führt 24/7 Tests an Ihren Endpunkten aus und warnt Sie, wenn unerwartetes Verhalten auftritt. Mit den anpassbaren Tests können Sie z. B. auf Verfügbarkeit, Latenz, Transaktionen, fehlerhafte Links, schrittweise Aufgabenfertigstellung, Seitenladefehler, Ladelatenzen für UI-Ressourcen, komplexe Assistenten-Abläufe und Checkout-Abläufe in Ihren Anwendungen prüfen. Außerdem können Sie mit CloudWatch Synthetics problematische Anwendungsendpunkte isolieren und sie zugrunde liegenden Infrastrukturproblemen zuordnen, um so die MTTR zu reduzieren. Mit dieser neuen Funktion kann CloudWatch jetzt Canary-Datenverkehr erfassen. So können Sie die Kundenerfahrung kontinuierlich verifizieren, auch wenn gerade kein Kundendatenverkehr für Ihre Anwendungen vorhanden ist, und etwaige Probleme erkennen, bevor sie Kunden betreffen. CloudWatch Synthetics unterstützt die Überwachung von REST-APIs, URLs und Website-Inhalten und prüft auf nicht autorisierte Änderungen durch Phishing, Code Injection und Cross-Site-Scripting.

Amazon CloudWatch RUM gibt Ihnen die Sichtbarkeit in die clientseitige Leistung Ihren Anwendungen und reduziert die MTTR. Es erlaubt Ihnen die Erfassung von clientseitigen Daten zur Leistung von Webanwendungen in nahezu Echtzeit, um Probleme zu identifizieren und zu beheben. CloudWatch RUM ergänzt die Daten von CloudWatch Synthetics, um Ihnen mehr Sichtbarkeit in Ihr Endbenutzererfahrung zu liefern. Sie können Leistungsanomalien visualisieren und die relevanten Debugging-Daten (wie Fehlermeldungen, Stack-Traces und Benutzersitzungen) verwenden, um Leistungsprobleme zu beheben (z. B. JavaScript-Fehler, Abstürze und Latenz). Sie können Erkenntnisse über die diversen Auswirkungen auf Endbenutzer erhalten, inklusive die Anzahl der Benutzer, Geolocations und Browser. CloudWatch RUM aggregiert Daten über den Weg Ihrer Benutzer durch Ihre Anwendung, was Ihnen dabei helfen kann, festzustellen, welche Funktionen Sie starten sollten und welche Fehlerbehebungen Sie als Priorität setzen sollten.

Handeln

Auto Scaling unterstützt Sie bei der Automatisierung der Kapazitäts- und Ressourcenplanung. Sie können einen Schwellenwert für einen Alarm bei einer Schlüsselmetrik festlegen und eine automatisierte Auto-Scaling-Aktion auslösen. Beispielsweise könnten Sie einen Auto-Scaling-Workflow zum Hinzufügen oder Entfernen von EC2-Instances auf Basis von CPU-Nutzungsmetriken einrichten und die Ressourcenkosten optimieren.

CloudWatch Events stellt einen Ereignisstrom von Systemereignissen bereit, der Änderungen Ihrer AWS-Ressourcen nahezu in Echtzeit beschreibt. Er ermöglicht es Ihnen, schnell auf Funktionsänderungen zu reagieren und Korrekturmaßnahmen zu ergreifen. Sie schreiben einfach Regeln, in denen Sie angeben, welche Ereignisse für Ihre Anwendung von Interesse sind und welche automatisierten Aktionen durchgeführt werden sollen, wenn ein Ereignis mit einer Regel übereinstimmt. Sie können beispielsweise eine Regel festlegen, um AWS-Lambda-Funktionen aufzurufen oder ein Amazon-Simple-Notification-Service (SNS)-Thema zu benachrichtigen.

Bei Amazon-EKS- und k8s-Clustern können Sie mit Container Insights Alarme zu Computing-Metriken erstellen, um so Auto-Scaling-Richtlinien Ihrer Amazon-EC2-Auto-Scaling-Gruppe auszulösen. Außerdem können Sie beliebige Amazon-EC2-Instances anhalten, beenden, neu starten und wiederherstellen. Bei Amazon-ECS-Clustern können Computing-Metriken aus Ihren Aufgaben und Services für Service Auto Scaling verwendet werden.  

 

Analysieren

Amazon CloudWatch Logs Insights ermöglicht es Ihnen, mehr aus Ihren Protokolldaten herauszuholen. Sie können in der AWS-Konsole an CloudWatch gesendete Protokolle abfragen oder mit dem Schreiben von Abfragen mit Aggregationen, Filtern und regulären Ausdrücken beginnen, um eine vollständige betriebliche Transparenz zu gewährleisten. Darüber hinaus können Sie Zeitreihendaten visualisieren, einzelne Protokollereignisse aufschlüsseln und Abfrageergebnisse in CloudWatch-Dashboards exportieren.

Mithilfe generativer KI können Sie Ihre Protokolle in natürlicher Sprache abfragen (als Vorschau) und schnell umsetzbare Erkenntnisse gewinnen, indem Sie Fragen vom Typ „Zeig mir die langsamsten Lambda-Funktionen“ stellen. Sie können die benötigten Protokolldaten in einfacher Sprache beschreiben, und CloudWatch generiert automatisch eine maßgeschneiderte Abfrage, sodass Sie Protokolle einfach analysieren und Erkenntnisse schneller gewinnen können, unabhängig von Ihrer Expertise.

Mithilfe von KI/ML können Sie die Protokolluntersuchung auch mit CloudWatch Logs Anomaly Detection beschleunigen. Dabei werden Machine-Learning-Algorithmen verwendet, die aus jahrzehntelangen Betriebsdaten von Amazon.com und AWS in immensem Umfang gelernt haben. Mit dieser Funktion kann CloudWatch gemeinsame Strukturen in Protokolldatensätzen erkennen, wichtige Inhalte und Trends extrahieren und Anomalien identifizieren, sodass Sie die MTTR beschleunigen können, ohne Konfigurationsparameter einrichten zu müssen.

Mit CloudWatch Logs Live Tail können Sie Streaming-Protokolldaten interaktiv in Echtzeit in einer zentralen Ansicht analysieren. Starten Sie kontextbezogene Abfragen, um nahtlos von der Echtzeit-Protokollüberwachung zu tieferen Protokollanalysen und einer beschleunigten Untersuchung und Lösung von Vorfällen überzugehen. Live Tail macht benutzerdefinierte Lösungen überflüssig und konsolidiert wichtige Protokollierungsfunktionen, damit Sie die Zeit bis zur Erkennung und Behebung optimieren können.

Die neue Integration zwischen CloudWatch Logs und OpenSearch Service ermöglicht es AWS-Kunden, Protokolle sowohl in CloudWatch als auch in OpenSearch Service abzufragen und zu analysieren. So erhalten Sie Zugriff auf das Beste aus beiden Lösungen, ohne dass komplexe Datenpipelines und Extraktions-, Transformations- und Ladevorgänge (ETL) erforderlich sind. AWS-Kunden können Protokolle zentral in CloudWatch Logs speichern und gleichzeitig tiefgreifende Analysen nutzen, die von OpenSearch Service unterstützt werden. CloudWatch-Logs-Kunden erhalten Zugriff auf die OpenSearch-Service-Abfragefunktionen (Piped Processing Language und Unterstützung für SQL-Abfragen) und die automatischen Dashboards für populäre AWS-Protokolle (z. B. VPC, WAF, CloudTrail). OpenSearch Service-Kunden erhalten Zugriff auf CloudWatch Logs ohne Datenduplizierung und Verwaltung der zugehörigen Pipelines. Mithilfe von OpenSearch Service Discover können sie in CloudWatch Logs gespeicherte Betriebsprotokolldaten mithilfe von OpenSearch Service SQL und Piped Processing Language analysieren, was es einfacher macht, komplexe Abfragen und Visualisierungen ihrer Daten ohne Datenverschiebung durchzuführen.

Amazon CloudWatch ermöglicht Ihnen die Überwachung von Trends und Saisonalität mit 15 Monaten an Metrikdaten (Speicherung und Aufbewahrung). Anhand dieser Daten können Sie Verlaufsanalysen ausführen, um die Ressourcennutzung zu optimieren. Mit CloudWatch können Sie auch Zustandsmetriken von bis zu 1 Sekunde erfassen, einschließlich eigener Metriken (z. B. die Ihrer On-Premises Anwendungen). Detaillierte Echtzeitdaten ermöglichen eine bessere Visualisierung und bieten die Möglichkeit, Trends zu erkennen und zu überwachen, um Anwendungsleistung und Funktionszustand zu optimieren.

Mit Amazon CloudWatch Metric Math können Sie Berechnungen über mehrere Metriken zur Echtzeitanalyse durchführen, sodass Sie mühelos Einblick in Ihre bestehenden CloudWatch-Metriken erhalten und den Funktionszustand und die Leistung Ihrer Infrastruktur besser verstehen. Sie können diese berechneten Metriken in der AWS Management Console visualisieren, sie zu CloudWatch-Dashboards hinzufügen oder sie mit der API-Aktion GetMetricData abrufen. Metric Math unterstützt arithmetische Operationen (wie +, -, /, * und mathematische Funktionen wie Summe, Durchschnitt, Minimum, Maximum und Standardabweichung).

CloudWatch Container Insights und Lambda Insights vereinfachen die Analyse von Beobachtbarkeitsdaten, indem sie Metriken, Protokolle und Traces miteinander korrelieren, und bieten einfache Drilldowns für eine schnellere Ursachenanalyse und Fehlerbehebung. Container Insights und Lambda Insights bieten Deep-Links zu XRay für die Trace-Analyse und zu granularen Protokollen wie Performance-Protokollereignissen, Anwendungsprotokollen (stdout/stderr) und benutzerdefinierten Protokollen, die erweiterte Analysen über CloudWatch Logs Insights ermöglichen. Container Insights bietet außerdem Einblicke in Amazon-ECS-Lebenszyklusereignisse, Kennzahlen auf Amazon EC2-Instance-Ebene, Amazon EKS/k8s-Datenebene und Amazon EKS-Steuerungsebene, um eine durchgängige Beobachtbarkeit in Ihren Container-Umgebungen zu gewährleisten.

Mit dem CloudWatch-Abfragegenerator für natürliche Sprache können Sie auch Ihre Metriken und Protokolle in Ihren Containern und Serverless-Anwendungen, die auf AWS Lambda ausgeführt werden, abfragen, indem Sie Anfragen vom Typ „Zeig mir die langsamsten Lambda-Funktionen“ stellen. Auf diese Weise können Sie Telemetrie und Oberflächeninformationen einfacher analysieren, unabhängig von Ihrem Fachwissen in Abfragesprachen.

CloudWatch Lambda Insights vereinfacht die Analyse von beobachtbaren Daten aus Metriken, Protokollen und Traces durch die Vereinfachung der Tiefenverknüpfung von automatischen Dashboards mit granularen Leistungsereignissen, Anwendungsprotokollen und benutzerdefinierten Protokollen unter Verwendung der erweiterten Abfragesprache von CloudWatch Logs Insights.

Amazon CloudWatch enthält jetzt Contributor Insights. Damit können Sie Zeitreihendaten analysieren, um eine Ansicht der wichtigsten Contributors (Einflussfaktoren) zur Systemleistung zu erhalten. Einmal eingerichtet, läuft Contributor Insights kontinuierlich ohne weitere Benutzereingriffe. So können Entwickler und Betreiber während eines betrieblichen Ereignisses Probleme schneller isolieren, diagnostizieren und beheben. Contributor Insights hilft Ihnen, zu verstehen, wer oder was sich auf die System- und Anwendungsleistung auswirkt, z. B. spezielle Ressourcen-, Kundenkonto- oder API-Aufrufe. So können Sie Ausreißer identifizieren, die stärksten Datenverkehrsmuster finden und die meistgenutzten Systemprozesse in eine Rangfolge bringen. Außerdem können Sie Contributor-Insights-Regeln erstellen, um Muster in strukturierten Protokollereignissen zu bewerten, während sie an CloudWatch Logs gesendet werden, darunter Protokolle von AWS-Services wie AWS CloudTrail, Amazon Virtual Private Cloud (Amazon VPC) und Amazon API Gateway, sowie benutzerdefinierte Protokolle, die von Ihren Service- oder On-Premise-Servern und anderen Clouds gesendet werden (z. B. Apache-Zugriffsprotokolle). Contributor Insights bewertet diese Protokollereignisse in nahezu Echtzeit und zeigt Berichte an, die die wichtigsten Beiträge und die Anzahl einzigartiger Beiträge in einem Datensatz anzeigen. Ein Contributor ist eine aggregierte Metrik, die auf Abmessungen, die in Protokollfeldern in CloudWatch Logs enthalten sind, z. B. Konto-ID oder Schnittstellen-ID in VPC Flow Logs, oder anderen benutzerdefinierten Abmessungen basiert. Sie können die Contributor-Daten anhand Ihrer eigenen benutzerdefinierten Kriterien sortieren und filtern. Berichtsdaten von Contributor Insights können in CloudWatch-Dashboards grafisch neben CloudWatch-Metriken oder ergänzend zu CloudWatch-Alarmen angezeigt werden.

Amazon CloudWatch Metrics Insights ist eine schnelle, flexible, SQL-basierte Abfrage-Engine, mit der Sie Trends und Muster innerhalb Millionen von Betriebsmetriken in nahezu Echtzeit identifizieren können. Mit Metrics Insights können Sie mit flexiblen Abfragen und spontanen Metrikaggregationen einen besseren Einblick in Ihre Infrastruktur und die Leistung großer Anwendungen gewinnen. Metrics-Insights-Anfragen können verwendet werden, um starke Visualisierungen zu erstellen, die Ihnen helfen, Probleme schnell und proaktiv zu überwachen und auszusondern, wodurch die MTTR reduziert wird. 

Amazon CloudWatch Evidently lässt Anwendungs-Entwickler Experimente ausführen und unbeabsichtigte Konsequenzen von neuen Funktionen zu identifizieren, bevor sie zur allgemeinen Nutzung freigegeben werden, wodurch das Risiko bei dem Rollout neuer Funktionen rediziert wird. Evidently lässt Sie neue Funktionen im gesamten Anwendungs-Stack zu validieren, was die Sicherheit der Veröffentlichung erhöht. Beim Start neuer Funktionen können Sie sie einem kleinen Benutzerkreis aussetzen, Schlüsselmetriken wie Seiten-Ladezeiten oder Konversationen überwachen und danach Datenverkehr aufrufen. Evidently lässt Sie auch verschiedene Designs ausprobieren, Benutzerdaten sammeln und die wirksamsten Produktionsdesigns realisieren. 

 

Compliance und Sicherheit

Amazon CloudWatch ist in AWS Identity and Access Management (IAM) integriert, damit Sie kontrollieren können, welche Benutzer und Ressourcen eine Zugangserlaubnis für Ihre Daten haben und wie der Zugriff erfolgt.

Amazon CloudWatch Logs ist auch mit PCI und FedRamp kompatibel. Daten werden im Ruhezustand und bei der Übertragung verschlüsselt. Sie können Ihre Protokollgruppen mit der Verschlüsselung von AWS Key Management Service (AWS KMS) verschlüsseln, um Compliance und Sicherheit zu erhöhen.

Mit dem Amazon CloudWatch Logs-Datenschutz lassen sich Datenschutzrichtlinien definieren, die von Systemen und Anwendungen erfasste sensible Daten erkennen und schützen können. Diese Funktion identifiziert und maskiert sensible Informationen in Ihren Protokollen automatisch mithilfe von ML und eines Musterabgleichs auf der Grundlage der von Ihnen definierten Richtlinie. Dank des Datenschutzes können Sie Ihre Architektur optimieren, indem Sie die Datenschutzlogik aus Ihren Anwendungen entfernen. Gleichzeitig werden Ihre Compliance-Ziele damit unterstützt. Sie können in Ihren Datenschutzrichtlinien festlegen, dass Protokolle gescannt werden, während sie aufgenommen werden. So lässt sich bestimmen, wie viele sensible Daten sie enthalten, und erkannte sensible Daten können maskiert werden. Die Maskierung von Daten kann zur Prüfung von Sicherheitsfachleuten aufgehoben werden, indem diese erhöhte Rechte mit IAM verwenden.