Acest curs este dedicat analiștilor de date care doresc să utilizeze platforma Azure Databricks pentru pregătirea și analiza avansată a datelor. Participanții vor învăța cum să valorifice capabilitățile distribuite ale Apache Spark, să gestioneze calitatea datelor și versiunile acestora cu Delta Lake, să construiască pipeline-uri automatizate folosind Delta Live Tables și să implementeze guvernanța cu Unity Catalog.
Cursul oferă o abordare practică asupra orchestrării fluxurilor de lucru pentru implementări în producție și dezvoltare colaborativă prin notebook-uri Python și SQL, permițând livrarea de date pregătite la scară largă.
Cursul este recomandat pentru:
- Analiști de date care lucrează cu seturi mari de date
- Profesioniști care doresc să implementeze soluții moderne de tip lakehouse
- Echipe care folosesc Azure Databricks pentru analiză și procesare de date
- Utilizatori care doresc să colaboreze prin notebook-uri în Python sau SQL
După finalizarea cursului, vei ști cum să:
- Explorezi și configurezi platforma Azure Databricks
- Realizezi analize exploratorii de date (EDA) cu Databricks Notebooks
- Utilizezi Apache Spark pentru procesarea și transformarea datelor
- Gestionezi calitatea și consistența datelor cu Delta Lake
- Construiești pipeline-uri de date cu Delta Live Tables
- Orchestrarezi și automatizezi sarcini cu Azure Databricks Workflows
Nu există cerințe preliminare, dar este recomandat să:
- Ai cunoștințe de bază în analiza datelor
- Ai experiență cu SQL și/sau Python
- Înțelegi conceptele de bază ale cloud computing
- Explorarea platformei Azure Databricks
- Prezentarea generală a serviciului
- Arhitectura și funcționalitățile de bază
- Analiza datelor cu Azure Databricks
- Metode de ingestie a datelor
- Explorarea datelor cu notebook-uri colaborative
- Utilizarea Apache Spark în Azure Databricks
- Execuția job-urilor Spark
- Vizualizarea și transformarea datelor la scară
- Managementul datelor cu Delta Lake
- Tranzacții ACID și enforcement de schemă
- Time travel și versionare
- Construirea de pipeline-uri cu Delta Live Tables
- Procesare de date în timp real
- Automatizarea proceselor cu Delta Live Tables
- Implementarea sarcinilor cu Azure Databricks Workflows
- Orchestrarea fluxurilor de lucru complexe
- Automatizarea analizelor și proceselor de ML
Nu sunt programe de certificare în acest moment.