Questo corso ti insegnerà come sfruttare la potenza di Apache Spark e dei cluster ad alta capacità nella piattaforma. Azure Databricks per eseguire complesse attività di ingegneria dei dati in cloudEsplorerai le architetture di elaborazione in streaming, implementerai processi automatizzati e capirai come ottimizzare le prestazioni utilizzando Delta Live Tables. Inoltre, imparerai a orchestrare e monitorare i processi di dati attraverso Azure Databricks Jobs, applica misure di governance e sicurezza ai dati e integra Databricks con altri servizi Azure.
Il corso è consigliato per:
- Ingegneri dei dati che sviluppano soluzioni di elaborazione dati su larga scala.
- Data Scientist che hanno bisogno di utilizzare Azure Databricks per la preparazione e l'elaborazione di grandi set di dati.
- Sviluppatori ELT che implementano flussi di dati complessi in cloud.
- Professionisti che desiderano imparare come orchestrare, proteggere e ottimizzare i processi dei dati in Azure Mattoncini di dati.
Dopo aver completato il corso, saprai come:
- Implementare processi incrementali utilizzando Spark Structured Streaming.
- Sviluppa architetture di streaming con Delta Live Tables.
- Ottimizza le prestazioni dei carichi di lavoro dei dati in Spark e Delta Live Tables.
- Crea e gestisci flussi di lavoro CI/CD in Azure Mattoncini di dati.
- Automatizzare e orchestrare i flussi di dati attraverso Azure Lavori Databricks e Azure Fabbrica di dati.
- Gestisci la sicurezza, la privacy e la governance dei dati con Unity Catalog.
- Utilizzi SQL Warehouses in Azure Databricks per query relazionali.
- correre Azure Notebook Databricks in Azure Data Factory per scalare i processi di ingegneria dei dati.
Non ci sono prerequisiti.
- Elaborazione incrementale con Spark Structured Streaming
- Introduzione allo streaming strutturato Spark
- Implementazione e monitoraggio di processi incrementali
- Architetture di streaming con tabelle Delta Live
- Modelli architettonici per dati in tempo reale
- Utilizzo di Delta Live Tables per i processi di streaming
- Ottimizzazione delle prestazioni con Spark e Delta Live Tables
- Strategie di ottimizzazione dell'esecuzione in Spark
- Aumento delle prestazioni delle pipeline di dati
- Implementazione di flussi di lavoro CI/CD in Azure Databricks
- Integrazione e consegna continue
- Automatizza la distribuzione di codice e processi
- Automatizza le attività con Azure Lavori Databricks
- Creazione e pianificazione di lavori in Azure Databricks
- Integrazione con Azure Fabbrica di dati e Azure DevOps
- Processi di monitoraggio e ridimensionamento
- Governance dei dati e sicurezza in Azure Databricks
- Unity Catalog e controllo dell'accesso ai dati
- Gestione della privacy e della conformità
- Utilizzo di SQL Warehouse in Azure Databricks
- Query SQL relazionali su grandi set di dati
- Ottimizzazione dell'analisi tramite SQL Warehouses
- Esecuzione di notebook Databricks con Azure Fabbrica di dati
- Integrazione dei notebook nelle pipeline di dati
- Automazione dei processi di ingegneria dei dati su larga scala cloud
- Microsoft DP-3011: Implementazione di una soluzione di analisi dei dati con Azure Databricks
- Microsoft DP-3012: Implementazione di una soluzione di analisi dei dati con Azure Analisi delle sinapsi
- Microsoft DP-500: Progettazione e implementazione di soluzioni di analisi su scala aziendale utilizzando Microsoft Azure e Microsoft Power BI
Non ci sono programmi di certificazione in questo momento.

