Amazon Athena Amazon EMR Amazon-Redshift

Wann sollte ich Athena verwenden?

Abfragedienste wie Amazon Athena, Data Warehouses wie Amazon Redshift und ausgeklügelte Datenverarbeitungs-Frameworks wie Amazon sind EMR alle auf unterschiedliche Bedürfnisse und Anwendungsfälle zugeschnitten. Die folgende Anleitung kann Ihnen helfen, einen oder mehrere Services basierend auf Ihren Anforderungen auszuwählen.

Amazon Athena

Mit Athena können Sie in Amazon S3 gespeicherte unstrukturierte, semistrukturierte und strukturierte Daten analysieren. Beispiele hierfür sind CSVJSON, oder spaltenförmige Datenformate wie Apache Parquet und Apache. ORC Sie können Athena verwenden, um Ad-hoc-Abfragen mit auszuführen ANSISQL, ohne die Daten aggregieren oder in Athena laden zu müssen.

Athena lässt sich QuickSight für eine einfache Datenvisualisierung in Amazon integrieren. Sie können Athena verwenden, um Berichte zu erstellen oder Daten mit Business Intelligence-Tools oder SQL Clients zu untersuchen, die mit einem JDBC oder einem ODBC Treiber verbunden sind. Weitere Informationen finden Sie unter Was ist Amazon QuickSight im QuickSight Amazon-Benutzerhandbuch undStellen Sie mit Treibern eine Connect zu Amazon Athena ODBC her JDBC.

Athena lässt sich in das integrieren AWS Glue Data Catalog, das einen persistenten Metadatenspeicher für Ihre Daten in Amazon S3 bietet. Auf diese Weise können Sie Tabellen erstellen und Daten in Athena auf der Grundlage eines zentralen Metadatenspeichers abfragen, der in Ihrem gesamten Amazon Web Services Services-Konto verfügbar ist und in die Funktionen ETL und Datenermittlung von AWS Glue integriert ist. Weitere Informationen finden Sie unter Verwenden Sie AWS Glue Data Catalog , um eine Verbindung zu Ihren Daten herzustellen Was ist AWS Glue? im Entwicklerhandbuch für AWS Glue .

Mit Amazon Athena können Sie ganz einfach interaktive Abfragen zu Daten direkt in Amazon S3 ausführen, ohne Daten formatieren oder Infrastruktur verwalten zu müssen. Zum Beispiel ist Athena nützlich, wenn Sie eine schnelle Abfrage für Webprotokolle ausführen möchten, um ein Leistungsproblem auf Ihrer Website zu beheben. Mit Athena können Sie schnell loslegen: Sie definieren einfach eine Tabelle für Ihre Daten und beginnen mit der Standardabfrage. SQL

Sie sollten Amazon Athena verwenden, wenn Sie interaktive SQL Ad-hoc-Abfragen für Daten auf Amazon S3 ausführen möchten, ohne Infrastruktur oder Cluster verwalten zu müssen. Amazon Athena bietet die einfachste Möglichkeit, Ad-hoc-Abfragen für Daten in Amazon S3 auszuführen, ohne dass Server eingerichtet oder verwaltet werden müssen.

Eine Liste der Funktionen AWS-Services , die Athena nutzt oder in die Athena integriert, finden Sie unter. AWS-Service Integrationen mit Athena

Amazon EMR

Amazon EMR macht es im Vergleich zu lokalen Bereitstellungen einfach und kostengünstig, stark verteilte Verarbeitungs-Frameworks wie Hadoop, Spark und Presto auszuführen. Amazon EMR ist flexibel — Sie können benutzerdefinierte Anwendungen und Code ausführen und spezifische Rechen-, Speicher-, Speicher- und Anwendungsparameter definieren, um Ihre Analyseanforderungen zu optimieren.

Zusätzlich zur Ausführung von SQL Abfragen EMR kann Amazon eine Vielzahl von Scale-Out-Datenverarbeitungsaufgaben für Anwendungen wie maschinelles Lernen, Graphanalyse, Datentransformation, Streaming-Daten und praktisch alles, was Sie programmieren können, ausführen. Sie sollten Amazon verwenden, EMR wenn Sie benutzerdefinierten Code verwenden, um extrem große Datensätze mit den neuesten Big-Data-Verarbeitungs-Frameworks wie Spark, Hadoop, Presto oder Hbase zu verarbeiten und zu analysieren. Amazon EMR gibt Ihnen die volle Kontrolle über die Konfiguration Ihrer Cluster und die darauf installierte Software.

Sie können Amazon Athena verwenden, um Daten abzufragen, die Sie mit Amazon EMR verarbeiten. Amazon Athena unterstützt viele der gleichen Datenformate wie AmazonEMR. Athenas Datenkatalog ist kompatibel mit Hive-Metastore. Wenn Sie Hive-Metastore verwenden EMR und bereits einen haben, können Sie Ihre DDL Kontoauszüge auf Amazon Athena ausführen und Ihre Daten sofort abfragen, ohne Ihre Amazon-Jobs zu beeinträchtigen. EMR

Amazon-Redshift

Ein Data Warehouse wie Amazon Redshift ist die beste Wahl, wenn Sie Daten aus vielen verschiedenen Quellen – wie Lagersystemen, Finanzsystemen und Einzelhandelsverkaufssystemen – in einem gemeinsamen Format zusammenfassen und für lange Zeiträume speichern müssen. Wenn Sie aus historischen Daten umfangreiche Geschäftsberichte erstellen möchten, ist ein Data Warehouse wie Amazon Redshift die beste Wahl. Die Abfrage-Engine in Amazon Redshift wurde optimiert, um bei der Ausführung komplexer Abfragen, die eine große Anzahl sehr großer Datenbanktabellen verbinden, besonders gut zu funktionieren. Wenn Sie Abfragen für hochstrukturierte Daten mit vielen Joins in vielen sehr großen Tabellen ausführen müssen, entscheiden Sie sich für Amazon Redshift.

Weitere Informationen darüber, wann Sie Athena verwenden sollten, finden Sie unter den folgenden Ressourcen:

Entscheidungsleitfaden für Analyseservices in AWS im im Ressourcen-Center für die ersten Schritte
Wann sollte Athena im Vergleich zu anderen Big-Data-Diensten in Amazon Athena verwendet werden FAQs
Amazon Athena – Übersicht
Amazon-Athena-Features
Amazon Athena FAQs
Blog-Posts von Amazon Athena

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Was ist Amazon Athena?

Möglichkeiten, Athena zu verwenden