Questo corso è dedicato agli analisti di dati che desiderano utilizzare la piattaforma Azure Databricks per la preparazione e l'analisi avanzata dei dati. I partecipanti impareranno come sfruttare le funzionalità distribuite di Apache Spark, gestire la qualità dei dati e il versioning con Delta Lake, creare pipeline automatizzate utilizzando Delta Live Tables e implementare la governance con Unity Catalog.
Il corso fornisce un approccio pratico all'orchestrazione dei flussi di lavoro per distribuzioni di produzione e sviluppo collaborativo tramite notebook Python e SQL, consentendo la distribuzione di dati preparati su larga scala.
Il corso è consigliato per:
- Analisti di dati che lavorano con grandi set di dati
- Professionisti che desiderano implementare soluzioni moderne per case sul lago
- Squadre che utilizzano Azure Databricks per l'analisi e l'elaborazione dei dati
- Utenti che desiderano collaborare tramite notebook in Python o SQL
Dopo aver completato il corso, saprai come:
- Esplora e configura la piattaforma Azure Databricks
- Eseguire analisi esplorative dei dati (EDA) con Databricks Notebooks
- Utilizzi Apache Spark per l'elaborazione e la trasformazione dei dati
- Gestisci la qualità e la coerenza dei dati con Delta Lake
- Crea pipeline di dati con Delta Live Tables
- Orchestrare e automatizzare le attività con Azure Flussi di lavoro di Databricks
Non ci sono prerequisiti, ma si consiglia di:
- Hai conoscenze di base nell'analisi dei dati
- Hai esperienza con SQL e/o Python
- Comprendere i concetti di base di cloud computing
- Esplorando la piattaforma Azure Databricks
- Panoramica del servizio
- Architettura e funzionalità di base
- Analisi dei dati con Azure Databricks
- Metodi di acquisizione dei dati
- Esplorare i dati con i notebook collaborativi
- Utilizzo di Apache Spark in Azure Databricks
- Esecuzione di lavori Spark
- Visualizzare e trasformare i dati su larga scala
- Gestione dei dati con Delta Lake
- Transazioni ACID e applicazione dello schema
- Viaggio nel tempo e controllo delle versioni
- Creazione di pipeline con Delta Live Tables
- Elaborazione dati in tempo reale
- Automazione dei processi con Delta Live Tables
- Implementazione di attività con Azure Flussi di lavoro di Databricks
- Orchestrazione di flussi di lavoro complessi
- Automazione di analisi e processi di ML
Non ci sono programmi di certificazione in questo momento.

