Esegui un'analisi interattiva dei dati in streaming - Servizio gestito per Apache Flink

Il servizio gestito da Amazon per Apache Flink era precedentemente noto come Analisi dei dati Amazon Kinesis per Apache Flink.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Esegui un'analisi interattiva dei dati in streaming

Utilizza un notebook serverless basato su Apache Zeppelin per interagire con i tuoi dati di streaming. Il notebook può contenere più note e ogni nota può contenere uno o più paragrafi in cui scrivere il codice.

La seguente SQL query di esempio mostra come recuperare dati da una fonte di dati:

%flink.ssql(type=update) select * from stock;

Per altri esempi di query Flink Streaming, consultate Esempi e tutorial per notebook Studio in Managed Service for Apache Flink quanto segue e SQL Queries nella documentazione di Apache Flink.

È possibile utilizzare le SQL query Flink nel notebook Studio per interrogare i dati di streaming. Puoi anche usare Python (TableAPI) e Scala (Table and DatastreamAPIs) per scrivere programmi per interrogare i tuoi dati di streaming in modo interattivo. Puoi visualizzare i risultati delle query o dei programmi, aggiornarli in pochi secondi ed eseguirli nuovamente per visualizzare i risultati aggiornati.

Interpreti Flink

Puoi specificare la lingua utilizzata dal servizio gestito per Apache Flink per eseguire l'applicazione utilizzando un interprete. Con il servizio gestito da Amazon per Apache Flink puoi utilizzare i seguenti interpreti:

Nome Classe Descrizione
%flink FlinkInterpreter Crea ExecutionEnvironment/StreamExecutionEnvironment/BatchTableEnvironment/StreamTableEnvironmente fornisce un ambiente Scala
%flink.pyflink PyFlinkInterpreter Fornisce un ambiente python
%flink.ipyflink IPyFlinkInterpreter Fornisce un ambiente ipython
%flink.ssql FlinkStreamSqlInterpreter Fornisce un ambiente stream sql
%flink.bsql FlinkBatchSqlInterpreter Fornisce un ambiente sql in batch

Per ulteriori informazioni sugli interpreti Flink, consulta Interprete Flink per Apache Zeppelin.

Se si utilizzano %flink.pyflink o %flink.ipyflink come interpreti, è necessario utilizzare il ZeppelinContext per visualizzare i risultati all'interno del notebook.

Per esempi più PyFlink specifici, consulta Interroga i flussi di dati in modo interattivo utilizzando Managed Service per Apache Flink Studio e Python.

Variabili dell'ambiente tabellare Apache Flink

Apache Zeppelin fornisce l'accesso alle risorse dell'ambiente tabellare utilizzando variabili di ambiente.

Puoi accedere alle risorse dell'ambiente tabellare Scala con le seguenti variabili:

Variabile Risorsa
senvStreamExecutionEnvironment
stenvStreamTableEnvironment for blink planner

Puoi accedere alle risorse dell'ambiente tabellare Python con le seguenti variabili:

Variabile Risorsa
s_envStreamExecutionEnvironment
st_envStreamTableEnvironment for blink planner

Per ulteriori informazioni sull'utilizzo degli ambienti tabellari, consulta Concetti e comuni API nella documentazione di Apache Flink.