Che cos'è Zero-ETL?

Crea un account AWS

Esplora le offerte di analisi gratuite

Visualizza le offerte gratuite per i servizi di analisi nel cloud

Scopri i servizi di analisi

Accelera l'innovazione con il pacchetto più completo di servizi di analisi

Sfoglia i corsi di formazione sull'analisi

Inizia subito la formazione sull'analisi grazie a contenuti creati da esperti AWS

Leggi i blog sull'analisi

Leggi le ultime notizie sui prodotti e sulle best practice per l'analisi di AWS

Che cos'è Zero-ETL?

Zero-ETL è un insieme di integrazioni che elimina o riduce al minimo la necessità di creare pipeline di dati ETL. Estrazione, trasformazione e caricamento (ETL) è il processo di combinazione, pulizia e normalizzazione dei dati provenienti da diverse fonti per prepararli per i carichi di lavoro di analisi, intelligenza artificiale (IA) e machine learning (ML). I processi ETL tradizionali richiedono molto lavoro e sono complessi da sviluppare, mantenere e dimensionare. Invece, le integrazioni Zero-ETL facilitano lo spostamento dei dati da punto a punto senza la necessità di creare pipeline di dati ETL. Zero-ETL può anche consentire l'esecuzione di query tra silos di dati senza la necessità di spostare i dati stessi.

Ulteriori informazioni su ETL »

Quali sfide ETL risolve l'integrazione Zero-ETL?

Le integrazioni Zero-ETL risolvono molte delle attuali sfide di spostamento dei dati nei processi ETL tradizionali.

Maggiore complessità del sistema

Le pipeline di dati ETL aggiungono un ulteriore livello di complessità alle tue attività di integrazione dei dati. La mappatura dei dati, eseguita in modo che corrispondano allo schema di destinazione desiderato, implica complesse regole e richiede la gestione delle incongruenze e dei conflitti dei dati. È necessario implementare meccanismi efficaci di gestione, registrazione e notifica degli errori per diagnosticare i problemi. I requisiti di sicurezza dei dati aumentano ulteriormente i vincoli del sistema.

Costi aggiuntivi

Le pipeline ETL sono costose sin dall'inizio e i costi possono aumentare vertiginosamente con l'aumento del volume di dati. L'archiviazione di dati duplicati tra sistemi potrebbe non essere conveniente per grandi volumi di dati. Inoltre, la scalabilità dei processi ETL richiede spesso costosi aggiornamenti dell'infrastruttura, ottimizzazione delle prestazioni delle query e tecniche di elaborazione parallela. Se i requisiti cambiano, l'ingegneria dei dati deve monitorare e testare costantemente la pipeline durante il processo di aggiornamento, aumentando i costi di manutenzione.

Ritardi nell'analisi, IA e ML

L'ETL richiede in genere agli ingegneri dei dati di creare codice personalizzato e agli ingegneri DevOps di implementare e gestire l'infrastruttura necessaria per dimensionare il carico di lavoro. In caso di modifiche alle origini dati, gli ingegneri devono modificare manualmente il codice e implementarlo nuovamente. Il processo può richiedere settimane, con conseguenti ritardi nell'esecuzione dei carichi di lavoro di analisi, intelligenza artificiale e machine learning. Inoltre, il tempo necessario per creare e implementare pipeline di dati ETL rende i dati inadatti per casi d'uso quasi in tempo reale, come l'inserimento di annunci online, il rilevamento di transazioni fraudolente o l'analisi in tempo reale della catena di approvvigionamento. In questi scenari, si perde l'opportunità di migliorare l'esperienza dei clienti, di affrontare nuove opportunità di business o di ridurre i rischi aziendali.

Quali sono i vantaggi di Zero-ETL?

Zero-ETL offre diversi vantaggi alla strategia dei dati di un'organizzazione.

Maggiore agilità

Zero-ETL semplifica l'architettura dei dati e riduce gli sforzi di ingegneria dei dati. Consente l'inclusione di nuove origini dati senza la necessità di rielaborarne grandi quantità. Questa flessibilità migliora l'agilità, supportando il processo decisionale basato sui dati e la rapida innovazione.

Efficienza dei costi

Zero-ETL utilizza tecnologie di integrazione dei dati scalabili e native del cloud, che consentono alle aziende di ottimizzare i costi in base all'utilizzo effettivo e alle esigenze di elaborazione dei dati. Le organizzazioni riducono i costi dell'infrastruttura, gli sforzi di sviluppo e gli oneri generali di manutenzione.

Informazioni in tempo reale

I processi ETL tradizionali spesso comportano aggiornamenti periodici in batch, con conseguente ritardo nella disponibilità dei dati. Zero-ETL, invece, fornisce l'accesso ai dati in tempo reale o quasi in tempo reale, garantendo dati più aggiornati per analisi, IA/ML e creazione di report. Ottieni informazioni più accurate e tempestive per casi d'uso come dashboard in tempo reale, esperienza di gioco ottimizzata, monitoraggio della qualità dei dati e analisi del comportamento dei clienti. Le organizzazioni effettuano previsioni basate sui dati con maggiore sicurezza, migliorano le esperienze dei clienti e promuovono approfondimenti basati sui dati in tutta l'azienda.

Quali sono i diversi casi d'uso di Zero-ETL?

Esistono tre casi d'uso principali per Zero-ETL.

Query federata

Le tecnologie di query federate offrono la possibilità di eseguire query su una varietà di origini dati senza dover provvedere allo spostamento dei dati. È possibile utilizzare comandi SQL familiari per eseguire query e unire dati da diverse fonti come database operativi, data warehouse e data lake. Le griglie dati in memoria (IMDG) archiviano i dati in memoria per essere conservati nella cache ed elaborati, in modo da poter sfruttare i vantaggi dell'analisi immediata e dei tempi di risposta alle query. È quindi possibile conservare i risultati dell'unione in un archivio dati per ulteriori analisi e utilizzo successivo.

Importazione dati di streaming

Le piattaforme di streaming di dati e di accodamento dei messaggi trasmettono dati in tempo reale da diverse fonti. Un'integrazione Zero-ETL con un data warehouse consente di importare dati da più flussi di questo tipo e di presentarli per l'analisi quasi istantaneamente. Non è necessario organizzare i dati di streaming per la trasformazione su altri servizi di archiviazione.

Replica istantanea

Tradizionalmente, lo spostamento dei dati da un database transazionale a un data warehouse centrale richiedeva sempre una soluzione ETL complessa. Oggigiorno, Zero-ETL può fungere da strumento di replica dei dati, duplicando istantaneamente i dati dal database transazionale al data warehouse. Il meccanismo di duplicazione utilizza tecniche di acquisizione dei dati di modifica (CDC) e può essere integrato nel data warehouse. La duplicazione è invisibile agli utenti: le applicazioni archiviano i dati nel database transazionale e gli analisti eseguono query sui dati dal warehouse.

In che modo AWS può supportare i tuoi sforzi Zero-ETL?

AWS sta investendo in un futuro Zero-ETL. Ecco alcuni esempi di servizi che offrono supporto integrato per Zero-ETL.

Amazon Athena è un servizio di analisi interattivo serverless basato su framework open source, che supporta formati di file e tabelle aperte. Athena fornisce un modo semplificato e flessibile per analizzare petabyte di dati dove risiede. È possibile analizzare i dati o creare applicazioni da un data lake Amazon Simple Storage Service (S3) e oltre 30 origini dati, incluse origini dati on-premise o altri sistemi cloud utilizzando SQL o Python. Athena è basato su motori Trino e Presto open source e framework Apache Spark, senza necessità di provisioning o configurazione.

L'importazione dati di streaming Amazon Redshift acquisisce centinaia di megabyte di dati al secondo dal flusso di dati Amazon Kinesis o da Amazon MSK. Definisci uno schema o scegli di inserire dati semi-strutturati con il tipo di dati SUPER per eseguire query sui dati in tempo reale.

L'integrazione Zero-ETL di Amazon Aurora con Amazon Redshift consente analisi e machine learning (ML) quasi in tempo reale. Utilizza Amazon Redshift per i carichi di lavoro di analisi su petabyte di dati transazionali di Aurora. È una soluzione completamente gestita per rendere disponibili i dati transazionali in Amazon Redshift dopo la scrittura su un cluster Aurora DB.

La copia automatica di Amazon Redshift da S3 semplifica e automatizza l'importazione di file in Amazon Redshift. Questa funzionalità importa continuamente i dati non appena vengono creati nuovi file in S3 senza attività di codifica personalizzata o importazione manuale.

Il controllo degli accessi alla condivisione dati con AWS Lake Formation gestisce centralmente l'accesso granulare ai dati condivisi all'interno dell'organizzazione. È possibile definire, modificare e controllare le autorizzazioni su tabelle, colonne e righe all'interno di Amazon Redshift.

Inizia a usare Zero-ETL in AWS oggi stesso creando un account gratuito!

Passaggi successivi su AWS

Consulta ulteriori risorse correlate al prodotto

Visualizza le offerte gratuite per i servizi Analytics nel cloud

Registrati per creare un account gratuito

Ottieni accesso istantaneo al Piano gratuito di AWS.

Registrati

Inizia a lavorare nella console

Inizia subito a creare nella Console di gestione AWS.

Accedi

Che cos'è Zero-ETL?

Che cos'è Zero-ETL?

Quali sfide ETL risolve l'integrazione Zero-ETL?

Maggiore complessità del sistema

Costi aggiuntivi

Ritardi nell'analisi, IA e ML

Quali sono i vantaggi di Zero-ETL?

Maggiore agilità

Efficienza dei costi

Informazioni in tempo reale

Quali sono i diversi casi d'uso di Zero-ETL?

Query federata

Importazione dati di streaming

Replica istantanea

In che modo AWS può supportare i tuoi sforzi Zero-ETL?

Passaggi successivi su AWS

Fine del supporto per Internet Explorer