Microsoft DP-3011: Implementare una soluzione di analisi dei dati con Azure Databricks

Questo corso è dedicato agli analisti di dati che desiderano utilizzare la piattaforma Azure Databricks per la preparazione e l'analisi avanzata dei dati. I partecipanti impareranno come sfruttare le funzionalità distribuite di Apache Spark, gestire la qualità dei dati e il versioning con Delta Lake, creare pipeline automatizzate utilizzando Delta Live Tables e implementare la governance con Unity Catalog.

Il corso fornisce un approccio pratico all'orchestrazione dei flussi di lavoro per distribuzioni di produzione e sviluppo collaborativo tramite notebook Python e SQL, consentendo la distribuzione di dati preparati su larga scala.

A chi è rivolto?

Il corso è consigliato per:

  • Analisti di dati che lavorano con grandi set di dati
  • Professionisti che desiderano implementare soluzioni moderne per case sul lago
  • Squadre che utilizzano Azure Databricks per l'analisi e l'elaborazione dei dati
  • Utenti che desiderano collaborare tramite notebook in Python o SQL

Cosa imparerai?

Dopo aver completato il corso, saprai come:

  • Esplora e configura la piattaforma Azure Databricks
  • Eseguire analisi esplorative dei dati (EDA) con Databricks Notebooks
  • Utilizzi Apache Spark per l'elaborazione e la trasformazione dei dati
  • Gestisci la qualità e la coerenza dei dati con Delta Lake
  • Crea pipeline di dati con Delta Live Tables
  • Orchestrare e automatizzare le attività con Azure Flussi di lavoro di Databricks

Prerequisiti:

Non ci sono prerequisiti, ma si consiglia di:

  • Hai conoscenze di base nell'analisi dei dati
  • Hai esperienza con SQL e/o Python
  • Comprendere i concetti di base di cloud computing

Orario del corso:

I materiali del corso sono in inglese. L'insegnamento si svolge in rumeno.

  1. Esplorando la piattaforma Azure Databricks
  • Panoramica del servizio
  • Architettura e funzionalità di base
  1. Analisi dei dati con Azure Databricks
  • Metodi di acquisizione dei dati
  • Esplorare i dati con i notebook collaborativi
  1. Utilizzo di Apache Spark in Azure Databricks
  • Esecuzione di lavori Spark
  • Visualizzare e trasformare i dati su larga scala
  1. Gestione dei dati con Delta Lake
  • Transazioni ACID e applicazione dello schema
  • Viaggio nel tempo e controllo delle versioni
  1. Creazione di pipeline con Delta Live Tables
  • Elaborazione dati in tempo reale
  • Automazione dei processi con Delta Live Tables
  1. Implementazione di attività con Azure Flussi di lavoro di Databricks
  • Orchestrazione di flussi di lavoro complessi
  • Automazione di analisi e processi di ML

Programmi di certificazione

Non ci sono programmi di certificazione in questo momento.

Microsoft DP-3011: Implementare una soluzione di analisi dei dati con Azure Databricks

Offerte personalizzate per gruppi di almeno 2 persone

Dettagli del Corso

Durata:

1
Zile

Prezzo:

Su richiesta

Consegna:

Insegnamento in aula, aula ibrida, aula virtuale

livello:

2. intermedio

Ruoli:

Data Analyst