Цей курс призначений для аналітиків даних, які хочуть використовувати платформу Azure Цеглини даних для розширеної підготовки та аналізу даних. Учасники навчаться використовувати розподілені можливості Apache Spark, керувати якістю даних та версіями за допомогою Delta Lake, створювати автоматизовані конвеєри за допомогою Delta Live Tables та впроваджувати управління за допомогою Unity Catalog.
Курс пропонує практичний підхід до оркестрації робочих процесів для розгортання у виробничих умовах та спільної розробки за допомогою блокнотів Python та SQL, що дозволяє доставляти підготовлені дані у великих масштабах.
Курс рекомендований для:
- Аналітики даних, що працюють з великими наборами даних
- Фахівці, які хочуть впровадити сучасні рішення для озерних будинків
- Команди, що використовують Azure Цеглини даних для аналізу та обробки даних
- Користувачі, які хочуть співпрацювати через блокноти на Python або SQL
Після завершення курсу ви знатимете, як:
- Дослідіть та налаштуйте платформу Azure Збір даних
- Виконуйте дослідницький аналіз даних (EDA) за допомогою блокнотів Databricks
- Ви використовуєте Apache Spark для обробки та перетворення даних
- Керуйте якістю та узгодженістю даних за допомогою Delta Lake
- Створення конвеєрів даних за допомогою дельта-таблиць у реальному часі
- Оркеструйте та автоматизуйте завдання за допомогою Azure Робочі процеси Databricks
Немає жодних передумов, але рекомендується:
- Ви маєте базові знання з аналізу даних
- Маєте досвід роботи з SQL та/або Python
- Зрозумійте основні поняття cloud computing
- Вивчення платформи Azure Збір даних
- Огляд послуг
- Архітектура та базові функціональні можливості
- Аналіз даних за допомогою Azure Збір даних
- Методи отримання даних
- Дослідження даних за допомогою спільних блокнотів
- Використання Apache Spark у Azure Збір даних
- Виконання завдань Spark
- Візуалізація та перетворення даних у великих масштабах
- Управління даними за допомогою Delta Lake
- Транзакції ACID та застосування схеми
- Подорожі в часі та керування версіями
- Побудова трубопроводів за допомогою таблиць Delta Live Tables
- Обробка даних у режимі реального часу
- Автоматизація процесів за допомогою таблиць Delta Live Tables
- Виконання завдань з Azure Робочі процеси Databricks
- Оркестрування складних робочих процесів
- Автоматизація аналітики та процесів машинного навчання

