Data Engineering on Google Cloud

Acest curs Data Engineering on Google Cloud de 4 zile oferă o pregătire completă pentru proiectarea, construirea și operarea sistemelor de procesare a datelor pe Google Cloud Platform (GCP). Participanții vor lucra cu principalele servicii de data engineering precum BigQuery, Dataflow, Dataproc, Pub/Sub, Dataplex și Cloud Storage, explorând concepte moderne de ingestie, stocare, transformare, analiză și orchestrare a datelor.

Trainingul include demonstrații, laboratoare practice și scenarii reale, ghidând participanții să construiască pipeline-uri scalabile, să optimizeze performanța și să implementeze arhitecturi de date robuste în cloud.

Cui i se adresează?

Cursul Data Engineering on Google Cloud este recomandat pentru:
• ingineri de date care construiesc sau administrează pipeline-uri în cloud
• specialiști Big Data care migrează spre ecosistemul Google Cloud
• administratori de baze de date și specialiști ETL
• analytics engineers care lucrează cu BigQuery
• profesioniști care se pregătesc pentru certificarea Professional Data Engineer, în cadrul traseului oficial Google Cloud

Ce vei învăța?

La finalul cursului Data Engineering on Google Cloud, participanții vor putea:
• proiecta sisteme scalabile de procesare a datelor în GCP
• construi pipeline-uri batch și streaming folosind serviciile Google Cloud
• implementa modele de date și fluxuri end-to-end
• opera sisteme de date cu gândire orientată spre fiabilitate, securitate și costuri
• aplica bune practici pentru automatizare, orchestrare și optimizare

Cerințe preliminare:

  • cunoștințe de bază SQL
  • recomandat: experiență într-un limbaj de programare (Python, Java etc.)
  • înțelegerea noțiunilor fundamentale de cloud

Agenda cursului:

Materialele de curs sunt în limba Engleză. Predarea se face în limba Română.

Module 01 – Data engineering tasks and components

  • rolul unui data engineer
    • data sources vs data sinks
    • formate de date
    • opțiuni de stocare în Google Cloud
    • managementul metadatelor
    • partajarea dataset-urilor cu Analytics Hub
    Lab: Loading Data into BigQuery

Module 02 – Data replication and migration

  • arhitectura de replicare și migrare
    • gcloud CLI
    • mutarea dataset-urilor
    • Datastream și cazurile de utilizare
    Lab: PostgreSQL → BigQuery Replication with Datastream

Module 03 – Extract & Load pipeline pattern (EL)

  • arhitectură EL
    • bq CLI
    • BigQuery Data Transfer Service
    • BigLake ca alternativă EL
    Lab: BigLake Qwik Start

Module 04 – Extract, Load & Transform pattern (ELT)

  • arhitectură ELT
    • scripting SQL și scheduling în BigQuery
    • Dataform
    Lab: Create & Execute SQL Workflow in Dataform

Module 05 – Extract, Transform & Load pattern (ETL)

  • arhitectură ETL
    • instrumente GUI în Google Cloud
    • procesare batch cu Dataproc
    • procesare streaming – opțiuni
    • Bigtable în pipeline-uri de date
    Labs:
    • Dataproc Serverless for Spark → Load BigQuery
    • Dataflow Real-Time Dashboard Pipeline

Module 06 – Automation techniques

  • pattern-uri de automatizare
    • Cloud Scheduler și Workflows
    • Cloud Composer
    • Cloud Run Functions
    • Eventarc
    Lab: Cloud Run Functions → Load BigQuery

Module 07 – Introduction to Data Engineering

  • rolul data engineer-ului
    • provocări ale data engineering-ului
    • introducere în BigQuery
    • data lakes vs data warehouses
    • guvernanță, acces și colaborare
    • studiu de caz
    Lab: Using BigQuery for Analysis

Module 08 – Build a Data Lake

  • arhitectura unui data lake
    • opțiuni de stocare și ETL
    • Cloud Storage ca data lake principal
    • securizarea Cloud Storage
    • utilizarea Cloud SQL
    Lab: Loading Taxi Data into Cloud SQL

Module 09 – Build a Data Warehouse

  • arhitectura modernă de data warehouse
    • BigQuery – concepte, încărcare date
    • explorarea schemelor
    • nested & repeated fields
    • partitioning & clustering
    Labs:
    • JSON & Array Handling in BigQuery
    • Partitioned Tables in BigQuery

Module 10 – Introduction to building batch pipelines

  • EL / ELT / ETL
    • calitatea datelor
    • execuția operațiilor în BigQuery
    Demo: ELT to Improve Data Quality

Module 11 – Execute Spark on Dataproc

  • ecosistemul Hadoop
    • rulare workload-uri pe Dataproc
    • folosirea Cloud Storage în loc de HDFS
    • optimizare Dataproc
    Lab: Running Spark Jobs on Dataproc

Module 12 – Serverless data processing with Dataflow

  • introducere în Dataflow
    • agregări, side inputs, windowing
    • Dataflow SQL & templates
    Labs:
    • Simple Dataflow Pipeline
    • MapReduce in Beam
    • Side Inputs

Module 13 – Manage pipelines with Cloud Data Fusion & Cloud Composer

  • creare pipeline-uri vizuale cu Data Fusion
    • Wrangler – explorare și transformare date
    • orchestrare cu Cloud Composer
    • Airflow: DAGs, operators, workflows
    Labs:
    • Build & Execute Pipeline in Data Fusion
    • Introduction to Cloud Composer

Module 14 – Introduction to streaming data processing

  • concepte de streaming
    • instrumente GCP pentru streaming

Module 15 – Serverless messaging with Pub/Sub

  • Pub/Sub push vs pull
    • publishing prin cod
    Lab: Publish Streaming Data into Pub/Sub

Module 16 – Dataflow streaming features

  • provocări ale streamingului
    • windowing, latență, triggers
    Lab: Streaming Data Pipelines

Module 17 – High-throughput BigQuery & Bigtable streaming

  • streaming în BigQuery + dashboards
    • ingestie high-throughput în Bigtable
    • optimizarea Bigtable
    Labs:
    • Streaming Analytics & Dashboards
    • Streaming into Bigtable

Module 18 – Advanced BigQuery functionality and performance

  • analytic window functions
    • GIS functions
    • optimizare BigQuery
    Lab: Optimizing BigQuery Queries

Notă: Agenda poate suferi ajustări în funcție de trainerul alocat. Pentru versiunea finală, vă rugăm să contactați echipa Bittnet Training.

Recomandăm să continui cu:

Aceste cursuri extind pregătirea unui Data Engineer către domeniile de machine learning și AI, relevante pentru proiecte avansate bazate pe BigQuery ML, Dataflow ML și modele personalizate.

Programe de certificare

Cursul este inclus în traseul oficial pentru certificarea Professional Data Engineer, reprezentând baza de învățare recomandată de Google Cloud pentru acest rol.

FAQ curs Data Engineering on Google Cloud

Cum contribuie un curs „Data Engineering on Google Cloud” la creșterea ROI într-o organizație?

Formarea inginerilor de date în Google Cloud optimizează gestionarea fluxurilor mari de date, automatizarea procesării și extragerea insight-urilor valoroase. Aceasta reduce costurile cu erori manuale, accelerează livrarea proiectelor de analytics și susține decizii de business bazate pe date, ceea ce se traduce într-un ROI semnificativ prin eficiență operațională și decizii strategice mai rapide.

De ce este esențială pregătirea în BigQuery pentru companiile orientate spre date?

BigQuery oferă stocare și analiză la scară petabyte cu costuri predictibile. Companiile care domină BigQuery pot transforma volume mari de date în insight-uri utile fără investiții masive în infrastructură, reducând TCO și maximizând rentabilitatea investițiilor în analytics.

Cum optimizează Google Cloud Pipeline-urile de date și ce impact are asupra costurilor?

Pipeline-urile de date gestionate în Google Cloud permit procesarea automatizată și scalabilă a datelor. Această automatizare elimină sarcini repetitive și erorile asociate, reducând costurile de operare și timpul de dezvoltare, ceea ce aduce beneficii financiare directe.

Ce rol joacă Dataflow în transformarea și integrarea datelor și cum influențează ROI?

Dataflow oferă procesare unificată atât pentru streaming, cât și pentru batch, cu scalare automată. Aceasta reduce complexitatea arhitecturală și necesarul de coordonare între instrumente disparate, ceea ce duce la costuri mai mici de operare și timpi de răspuns mai rapizi în proiectele de date.

Cum sprijină cursul adopția practică a ETL/ELT în Google Cloud?

Cursul pune accent pe tehnici de extragere, transformare și încărcare a datelor folosind instrumente native precum Dataflow și Dataprep, ceea ce permite echipelor să construiască pipeline-uri eficiente și scalabile din punct de vedere al costurilor, eliminând silozurile de date și sporind valoarea datelor pentru business.

În ce mod reduce Cloud Storage costurile de stocare a datelor la scară largă?

Cloud Storage oferă stocare durabilă, scalabilă și costuri bazate pe consum real. Această flexibilitate permite organizațiilor să optimizeze bugetele pentru date inactive sau rareori accesate prin politici de arhivare eficiente, reducând TCO și maximizând utilizarea resurselor.

Ce beneficii aduce integrarea Dataproc pentru procesarea Hadoop/Spark și cum influențează eficiența?

Dataproc permite rularea clusterelor Hadoop și Spark la cerere cu costuri reduse și scalare rapidă. Aceasta elimină nevoia de administrare continuă a clusterelor și minimizează costurile cu infrastructura tradițională, oferind economii semnificative și flexibilitate în activitățile de big data.

Cum ajută cunoștințele de securitate și guvernanță în cadrul ingineriei datelor pe Google Cloud?

Implementarea bunelor practici de securitate și guvernanță asigură protecția datelor sensibile și conformitatea cu reglementările. Aceasta reduce riscul amenzilor, al pierderii de reputație și al incidentelor costisitoare, protejând veniturile și asigurând continuitatea businessului într-un mod eficient din punct de vedere al investiției.

De ce este importantă capacitatea de a optimiza costurile de procesare și stocare în proiectele de date?

Optimizarea costurilor de procesare și stocare este esențială pentru managementul bugetelor IT. Echipele bine pregătite pot implementa politici de optimizare care reduc cheltuielile lunare fără a compromite performanța, ceea ce sporește profitabilitatea și ROI pe termen lung.

Cum poate formarea în Data Engineering pe Google Cloud să accelereze inovația în organizație?

Abilitățile în ingineria datelor permit organizațiilor să exploateze datele în mod strategic, generând analytics predictive, optimizări operaționale și produse digitale inovatoare. Această agilitate în generarea insight-urilor competitive se traduce în creșterea veniturilor și avantaj competitiv sustenabil.

De ce îmi este afișată această pagină?

Această pagină este returnată datorită căutărilor tale ce includ termeni precum: data engineering on google cloud, google certified professional data engineer, gcp data engineer, google cloud data engineer, google cloud professional data engineer, google cloud certified professional data engineer, google professional data engineer, google data engineer, google certified data engineer, professional data engineer, gcp professional data engineer, data engineer google, google cloud certified data engineer, professional data engineer google, data engineer gcp, google cloud database engineer, data engineering on google cloud platform, gcp cloud data engineer, certified professional data engineer, google cloud platform data engineer, data engineer at google, data engineering with google cloud, professional data engineer google cloud, gcp engineer, gcp certified data engineer, gcp for data engineer, data engineering with google cloud platform, professional data engineer gcp, data engineering on google cloud platform specialization, data engineer google cloud, cloud data engineer gcp, gcp certified professional data engineer, data engineering with gcp, google data machine learning engineer, google database engineer, professional data engineer on google cloud platform, data engineering in gcp, official google cloud certified professional data engineer, cloud data engineer google, engineer data in google cloud, data engineering google cloud platform, big data engineer google sau alții.

Data Engineering on Google Cloud

Oferte personalizate pentru grupuri de minim 2 persoane

Detalii curs

Durată:

4
zile

Preț:

La cerere

Livrare:

Predare în clasă, Clasă hibridă, Clasă virtuală

Nivel:

2. Intermediate

Roluri:

Analiști de date, Cloud Engineer, Data Engineer, Database Specialist

Echipă de 2+ persoane? Primești ofertă dedicată!