Azure Databricks este o platformă cloud complet gestionată pentru analiză avansată de date și machine learning, construită prin colaborare între Microsoft și echipa care a inițiat Apache Spark. Cursul te va învăța cum să utilizezi Azure Databricks pentru a antrena și implementa modele de machine learning la scară largă, într-un mod eficient și colaborativ.
Participanții vor explora întregul ciclu de viață al unui model ML — de la pregătirea datelor și antrenare, până la ajustarea hiperparametrilor, utilizarea AutoML și gestionarea în producție cu MLflow.
Cursul este recomandat pentru:
• Data Scientiști care doresc să implementeze soluții ML scalabile în Azure
• AI Engineers implicați în dezvoltarea, testarea și operaționalizarea modelelor ML
• Profesioniști care lucrează cu biblioteci open-source precum Scikit-learn, PyTorch sau TensorFlow
• Echipe care doresc să simplifice dezvoltarea AI folosind AutoML și MLflow în Databricks
După finalizarea cursului, vei ști cum să:
• Utilizezi Azure Databricks și Apache Spark pentru prelucrarea datelor
• Antrenezi modele de machine learning folosind framework-uri populare
• Optimizezi hiperparametrii cu ajutorul bibliotecii Optuna
• Automatizezi procesul de antrenare cu AutoML în Azure Databricks
• Utilizezi MLflow pentru urmărirea experimentelor și gestionarea modelelor
• Antrenezi modele de deep learning pentru scenarii complexe
• Implementezi și administrezi modele ML în medii de producție
Participanții ar trebui să aibă:
• Experiență în utilizarea Python pentru analiza datelor
• Cunoștințe despre antrenarea modelelor ML cu Scikit-Learn, TensorFlow sau PyTorch
• Familiaritate cu conceptele de machine learning și ciclul de viață al modelului
- Explorarea Azure Databricks
Introducere în platforma și arhitectura Azure Databricks - Utilizarea Apache Spark în Databricks
Prelucrarea și analizarea datelor la scară largă cu Spark - Antrenarea unui model ML în Databricks
Fluxul de bază: pregătirea datelor, antrenare, evaluare - Gestionarea ML lifecycle cu MLflow
Tracking, versionare, înregistrarea modelelor - Ajustarea hiperparametrilor cu Optuna
Optimizarea automată a performanței modelelor - Utilizarea AutoML în Azure Databricks
Crearea rapidă a modelelor eficiente pentru datele disponibile - Antrenarea modelelor de deep learning
Implementarea rețelelor neuronale pentru NLP, viziune și forecast - Gestionarea modelelor ML în producție
Orchestrarea și publicarea modelelor în medii de producție