Microsoft DP-3011: Впровадження рішення для аналізу даних за допомогою Azure Збір даних

Цей курс призначений для аналітиків даних, які хочуть використовувати платформу Azure Цеглини даних для розширеної підготовки та аналізу даних. Учасники навчаться використовувати розподілені можливості Apache Spark, керувати якістю даних та версіями за допомогою Delta Lake, створювати автоматизовані конвеєри за допомогою Delta Live Tables та впроваджувати управління за допомогою Unity Catalog.

Курс пропонує практичний підхід до оркестрації робочих процесів для розгортання у виробничих умовах та спільної розробки за допомогою блокнотів Python та SQL, що дозволяє доставляти підготовлені дані у великих масштабах.

Кому воно адресоване?

Курс рекомендований для:

  • Аналітики даних, що працюють з великими наборами даних
  • Фахівці, які хочуть впровадити сучасні рішення для озерних будинків
  • Команди, що використовують Azure Цеглини даних для аналізу та обробки даних
  • Користувачі, які хочуть співпрацювати через блокноти на Python або SQL

Що ти навчишся?

Після завершення курсу ви знатимете, як:

  • Дослідіть та налаштуйте платформу Azure Збір даних
  • Виконуйте дослідницький аналіз даних (EDA) за допомогою блокнотів Databricks
  • Ви використовуєте Apache Spark для обробки та перетворення даних
  • Керуйте якістю та узгодженістю даних за допомогою Delta Lake
  • Створення конвеєрів даних за допомогою дельта-таблиць у реальному часі
  • Оркеструйте та автоматизуйте завдання за допомогою Azure Робочі процеси Databricks

Передумови:

Немає жодних передумов, але рекомендується:

  • Ви маєте базові знання з аналізу даних
  • Маєте досвід роботи з SQL та/або Python
  • Зрозумійте основні поняття cloud computing

Розклад курсу:

Матеріали курсу англійською мовою. Викладання ведеться румунською мовою.

  1. Вивчення платформи Azure Збір даних
  • Огляд послуг
  • Архітектура та базові функціональні можливості
  1. Аналіз даних за допомогою Azure Збір даних
  • Методи отримання даних
  • Дослідження даних за допомогою спільних блокнотів
  1. Використання Apache Spark у Azure Збір даних
  • Виконання завдань Spark
  • Візуалізація та перетворення даних у великих масштабах
  1. Управління даними за допомогою Delta Lake
  • Транзакції ACID та застосування схеми
  • Подорожі в часі та керування версіями
  1. Побудова трубопроводів за допомогою таблиць Delta Live Tables
  • Обробка даних у режимі реального часу
  • Автоматизація процесів за допомогою таблиць Delta Live Tables
  1. Виконання завдань з Azure Робочі процеси Databricks
  • Оркестрування складних робочих процесів
  • Автоматизація аналітики та процесів машинного навчання

Програми сертифікації

Наразі програм сертифікації немає.

Microsoft DP-3011: Впровадження рішення для аналізу даних за допомогою Azure Збір даних

Індивідуальні пропозиції для груп від 2 осіб

Деталі курсу

Тривалість:

1
днів

Ціна:

На вимогу

Доставка:

Викладання в класі, гібридний клас, віртуальний клас

Рівень:

2. Середній

Ролі:

По аналізу даних