Microsoft DP-3011: Implementing a Data Analytics Solution with Azure Databricks

Acest curs este dedicat analiștilor de date care doresc să utilizeze platforma Azure Databricks pentru pregătirea și analiza avansată a datelor. Participanții vor învăța cum să valorifice capabilitățile distribuite ale Apache Spark, să gestioneze calitatea datelor și versiunile acestora cu Delta Lake, să construiască pipeline-uri automatizate folosind Delta Live Tables și să implementeze guvernanța cu Unity Catalog.

Cursul oferă o abordare practică asupra orchestrării fluxurilor de lucru pentru implementări în producție și dezvoltare colaborativă prin notebook-uri Python și SQL, permițând livrarea de date pregătite la scară largă.

Cui i se adresează?

Cursul este recomandat pentru:

  • Analiști de date care lucrează cu seturi mari de date
  • Profesioniști care doresc să implementeze soluții moderne de tip lakehouse
  • Echipe care folosesc Azure Databricks pentru analiză și procesare de date
  • Utilizatori care doresc să colaboreze prin notebook-uri în Python sau SQL

Ce vei învăța?

După finalizarea cursului, vei ști cum să:

  • Explorezi și configurezi platforma Azure Databricks
  • Realizezi analize exploratorii de date (EDA) cu Databricks Notebooks
  • Utilizezi Apache Spark pentru procesarea și transformarea datelor
  • Gestionezi calitatea și consistența datelor cu Delta Lake
  • Construiești pipeline-uri de date cu Delta Live Tables
  • Orchestrarezi și automatizezi sarcini cu Azure Databricks Workflows

Cerințe preliminare:

Nu există cerințe preliminare, dar este recomandat să:

  • Ai cunoștințe de bază în analiza datelor
  • Ai experiență cu SQL și/sau Python
  • Înțelegi conceptele de bază ale cloud computing

Agenda cursului:

Materialele de curs sunt în limba Engleză. Predarea se face în limba Română.

  1. Explorarea platformei Azure Databricks
  • Prezentarea generală a serviciului
  • Arhitectura și funcționalitățile de bază
  1. Analiza datelor cu Azure Databricks
  • Metode de ingestie a datelor
  • Explorarea datelor cu notebook-uri colaborative
  1. Utilizarea Apache Spark în Azure Databricks
  • Execuția job-urilor Spark
  • Vizualizarea și transformarea datelor la scară
  1. Managementul datelor cu Delta Lake
  • Tranzacții ACID și enforcement de schemă
  • Time travel și versionare
  1. Construirea de pipeline-uri cu Delta Live Tables
  • Procesare de date în timp real
  • Automatizarea proceselor cu Delta Live Tables
  1. Implementarea sarcinilor cu Azure Databricks Workflows
  • Orchestrarea fluxurilor de lucru complexe
  • Automatizarea analizelor și proceselor de ML

Programe de certificare

Nu sunt programe de certificare în acest moment.

Microsoft DP-3011: Implementing a Data Analytics Solution with Azure Databricks

Oferte personalizate pentru grupuri de minim 2 persoane

Detalii curs

Durată:

1
zile

Preț:

La cerere

Livrare:

Predare în clasă, Clasă hibridă, Clasă virtuală

Nivel:

2. Intermediate

Roluri:

Data Analyst

Echipă de 2+ persoane? Primești ofertă dedicată!