Microsoft DP-3027: Adatmérnöki megoldás megvalósítása a következővel: Azure Adattárak

Ez a kurzus megtanítja, hogyan aknázhatod ki az Apache Spark és a platform nagy kapacitású klasztereinek erejét. Azure Databricks komplex adatmérnöki feladatok futtatásához cloudBemutatjuk a streamelt feldolgozási architektúrákat, automatizált folyamatokat valósítunk meg, és megértjük, hogyan optimalizálható a teljesítmény a Delta Live Tables használatával. Ezenkívül megtanuljuk az adatfolyamatok összehangolását és monitorozását a következőkön keresztül: Azure Databricks-feladatok, irányítási és biztonsági intézkedések alkalmazása az adatokra, valamint a Databricks integrálása más szolgáltatásokkal Azure.

Kinek szól?

A tanfolyam ajánlott:

  • Adatmérnökök, akik nagyméretű adatfeldolgozási megoldásokat fejlesztenek.
  • Adattudósok, akiknek használniuk kell Azure Databricks nagy adathalmazok előkészítéséhez és feldolgozásához.
  • ELT fejlesztők, akik komplex adatfolyamatokat valósítanak meg cloud.
  • Szakemberek, akik szeretnék megtanulni, hogyan szervezzék, biztosítsák és optimalizálják az adatfolyamatokat Azure Databricks.

Mit fogsz tanulni?

A kurzus elvégzése után tudni fogod, hogyan:

  • Inkrementális folyamatok megvalósítása Spark Structured Streaming használatával.
  • Fejlesszen streamelési architektúrákat a Delta Live Tables segítségével.
  • Optimalizálja az adatfeldolgozási feladatok teljesítményét a Spark és a Delta Live Tables táblákban.
  • CI/CD munkafolyamatok létrehozása és kezelése a következőben: Azure Databricks.
  • Automatizálja és hangolja össze az adatfolyamokat Azure Databricks-állások és Azure Adatgyár.
  • Kezelje az adatbiztonságot, az adatvédelmet és az irányítást az Unity Catalog segítségével.
  • SQL Warehouse-okat használsz a következőben: Azure Databricks relációs lekérdezésekhez.
  • fut Azure Databricks jegyzetfüzetek Azure Data Factory az adatmérnöki folyamatok skálázásához.

Előfeltételek:

Nincsenek előfeltételek.

Tanfolyam órarendje:

A tananyag angol nyelvű. A tanítás román nyelven folyik.

  1. Inkrementális feldolgozás Spark Structured Streaminggel
    • Bevezetés a Spark strukturált streamelésébe
    • Inkrementális folyamatok megvalósítása és monitorozása
  2. Architektúrák streamelése Delta Live Tables segítségével
    • Valós idejű adatokhoz készült architektúra modellek
    • Delta élő táblák használata streamelési folyamatokhoz
  3. Teljesítmény optimalizálása Spark és Delta élő táblázatokkal
    • Végrehajtás-optimalizálási stratégiák a Sparkban
    • Az adatfolyamatok teljesítményének növelése
  4. CI/CD munkafolyamatok megvalósítása Azure Adattárak
    • Folyamatos integráció és szállítás
    • Kód és folyamatok telepítésének automatizálása
  5. Feladatok automatizálása a következővel: Azure Databricks-állások
    • Feladatok létrehozása és ütemezése itt: Azure Adattárak
    • Integráció a Azure Adatgyár és Azure DevOps
    • Monitoring és skálázási folyamatok
  6. Adatkezelés és biztonság Azure Adattárak
    • Unity Catalog és adathozzáférés-vezérlés
    • Adatvédelem és megfelelőség kezelése
  7. SQL Warehouse-ok használata Azure Adattárak
    • Relációs SQL lekérdezések nagy adathalmazokon
    • Az elemzés optimalizálása SQL Warehouse-okon keresztül
  8. Databricks Notebookok futtatása Azure Data Factory
    • Jegyzetfüzetek integrálása adatfolyamatokba
    • Adatmérnöki folyamatok nagy léptékű automatizálása cloud

Javasoljuk, hogy folytassa:

Minősítési programok

Jelenleg nincsenek tanúsítási programok.

Microsoft DP-3027: Adatmérnöki megoldás megvalósítása a következővel: Azure Adattárak

Személyre szabott ajánlatok minimum 2 fős csoportoknak

Tanfolyam részletei

Időtartam:

1
nap

Ár:

Igény szerint

Szállítás:

Osztálytermi tanítás, hibrid tanterem, virtuális tanterem

Szint:

3. Középhaladó

Szerepek:

Adatelemző, Adatmérnök, Adattudós