Microsoft DP-3027: Implementare una soluzione di ingegneria dei dati con Azure Databricks

Questo corso ti insegnerà come sfruttare la potenza di Apache Spark e dei cluster ad alta capacità nella piattaforma. Azure Databricks per eseguire complesse attività di ingegneria dei dati in cloudEsplorerai le architetture di elaborazione in streaming, implementerai processi automatizzati e capirai come ottimizzare le prestazioni utilizzando Delta Live Tables. Inoltre, imparerai a orchestrare e monitorare i processi di dati attraverso Azure Databricks Jobs, applica misure di governance e sicurezza ai dati e integra Databricks con altri servizi Azure.

A chi è rivolto?

Il corso è consigliato per:

  • Ingegneri dei dati che sviluppano soluzioni di elaborazione dati su larga scala.
  • Data Scientist che hanno bisogno di utilizzare Azure Databricks per la preparazione e l'elaborazione di grandi set di dati.
  • Sviluppatori ELT che implementano flussi di dati complessi in cloud.
  • Professionisti che desiderano imparare come orchestrare, proteggere e ottimizzare i processi dei dati in Azure Mattoncini di dati.

Cosa imparerai?

Dopo aver completato il corso, saprai come:

  • Implementare processi incrementali utilizzando Spark Structured Streaming.
  • Sviluppa architetture di streaming con Delta Live Tables.
  • Ottimizza le prestazioni dei carichi di lavoro dei dati in Spark e Delta Live Tables.
  • Crea e gestisci flussi di lavoro CI/CD in Azure Mattoncini di dati.
  • Automatizzare e orchestrare i flussi di dati attraverso Azure Lavori Databricks e Azure Fabbrica di dati.
  • Gestisci la sicurezza, la privacy e la governance dei dati con Unity Catalog.
  • Utilizzi SQL Warehouses in Azure Databricks per query relazionali.
  • correre Azure Notebook Databricks in Azure Data Factory per scalare i processi di ingegneria dei dati.

Prerequisiti:

Non ci sono prerequisiti.

Orario del corso:

I materiali del corso sono in inglese. L'insegnamento si svolge in rumeno.

  1. Elaborazione incrementale con Spark Structured Streaming
    • Introduzione allo streaming strutturato Spark
    • Implementazione e monitoraggio di processi incrementali
  2. Architetture di streaming con tabelle Delta Live
    • Modelli architettonici per dati in tempo reale
    • Utilizzo di Delta Live Tables per i processi di streaming
  3. Ottimizzazione delle prestazioni con Spark e Delta Live Tables
    • Strategie di ottimizzazione dell'esecuzione in Spark
    • Aumento delle prestazioni delle pipeline di dati
  4. Implementazione di flussi di lavoro CI/CD in Azure Databricks
    • Integrazione e consegna continue
    • Automatizza la distribuzione di codice e processi
  5. Automatizza le attività con Azure Lavori Databricks
    • Creazione e pianificazione di lavori in Azure Databricks
    • Integrazione con Azure Fabbrica di dati e Azure DevOps
    • Processi di monitoraggio e ridimensionamento
  6. Governance dei dati e sicurezza in Azure Databricks
    • Unity Catalog e controllo dell'accesso ai dati
    • Gestione della privacy e della conformità
  7. Utilizzo di SQL Warehouse in Azure Databricks
    • Query SQL relazionali su grandi set di dati
    • Ottimizzazione dell'analisi tramite SQL Warehouses
  8. Esecuzione di notebook Databricks con Azure Fabbrica di dati
    • Integrazione dei notebook nelle pipeline di dati
    • Automazione dei processi di ingegneria dei dati su larga scala cloud

Ti consigliamo di proseguire con:

Programmi di certificazione

Non ci sono programmi di certificazione in questo momento.

Microsoft DP-3027: Implementare una soluzione di ingegneria dei dati con Azure Databricks

Offerte personalizzate per gruppi di almeno 2 persone

Dettagli del Corso

Durata:

1
Zile

Prezzo:

Su richiesta

Consegna:

Insegnamento in aula, aula ibrida, aula virtuale

livello:

3. intermedio

Ruoli:

Analista di dati, Ingegnere dei dati, Scienziato dei dati