Цей інтенсивний одноденний курс надає учасникам навички, необхідні для створення та управління рішеннями для аналізу даних за допомогою Azure Synapse Analytics. Ви навчитеся працювати з пулами SQL (виділеними та безсерверними), керувати даними за допомогою Apache Spark у Synapse та реалізовувати процеси ELT (вилучення, завантаження, перетворення) за допомогою Synapse. Pipelines — знайомий досвід для тих, хто знає Azure Фабрика даних.
Завдяки практичним лабораторним роботам та реальним прикладам, курс забезпечує ґрунтовне розуміння оркестрації даних у сучасних середовищах озерних будинків та складів. Azure.
Курс рекомендований для:
• Інженери даних, які хочуть інтегрувати та аналізувати дані за допомогою Azure Синапс
• Адміністратори, що беруть участь у проектуванні та моніторингу потоків даних у cloud
• Фахівці, що використовують SQL та Python в аналітичних контекстах
• Користувачі, знайомі з блокнотами, такими як Databricks, Jupyter, Zeppelin тощо.
• Команди, які мають досвід роботи з Azure Фабрика даних, і вони хочуть розширити її в Synapse
Після завершення курсу ви знатимете, як:
• Запитувати файли з озера даних за допомогою безсерверного пулу SQL у Synapse
• Аналізуйте дані за допомогою Apache Spark Pools та Delta Lake
• Створення та керування конвеєрами даних за допомогою Synapse Pipelines
• Ви працюєте з реляційними сховищами даних у Synapse
• Використовуйте сучасні інструменти обробки та перетворення даних у Azure
Учасники повинні мати:
• Базові знання SQL та Python
• Досвід роботи з блокнотами на базі Spark (наприклад, Databricks, Jupyter)
• Знайомство з такими послугами, як Azure Фабрика даних
1. Вступ до Azure Synapse Analytics
Презентація архітектури та основних компонентів
2. Використання безсерверного SQL-пулу для запитів файлів в озері даних
Виконання прямих запитів до файлів JSON, CSV, Parquet
3. Аналіз даних за допомогою Apache Spark у Azure Синапс
Робота з блокнотами та маніпулювання даними за допомогою PySpark
4. Керування даними за допомогою Delta Lake в Synapse
Впровадження ACID-транзакцій, керування версіями та подорожей у часі
5. Аналіз даних у реляційному сховищі даних
Створення та запити до таблиць у виділеному пулі SQL
6. Побудова конвеєра даних за допомогою Synapse Pipelines
Оркестрування завдань ELT за допомогою інструментів, подібних до ADF

