Ingegneria dei dati su Google Cloud

Questo corso di Data Engineering su Google Cloud Il corso di 4 giorni fornisce una formazione completa per la progettazione, la costruzione e il funzionamento di sistemi di elaborazione dati su Google Cloud Piattaforma (GCP)I partecipanti lavoreranno con i principali servizi di ingegneria dei dati come BigQuery, Dataflow, Dataproc, Pub/Sub, Dataplex e Cloud Storage, esplorazione dei concetti moderni di acquisizione, archiviazione, trasformazione, analisi e orchestrazione dei dati.

La formazione include dimostrazioni, laboratori pratici e scenari reali, guidando i partecipanti a creare pipeline scalabili, ottimizzare le prestazioni e implementare architetture dati robuste in cloud.

A chi è rivolto?

Corso di Data Engineering su Google Cloud È consigliato per:
• ingegneri dei dati che costruiscono o gestiscono pipeline in cloud
• specialisti Big Data migrazione all'ecosistema Google Cloud
• amministratori di database e specialisti ETL
• ingegneri analitici che lavorano con BigQuery
• professionisti che si preparano per la certificazione Ingegnere dei dati, all'interno del percorso ufficiale di Google Cloud

Cosa imparerai?

Alla fine del corso Data Engineering su Google Cloud, i partecipanti saranno in grado di:
• progettare sistemi di elaborazione dati scalabili in GCP
• creare pipeline batch e streaming utilizzando i servizi Google Cloud
• implementare modelli di dati e flussi end-to-end
• gestire sistemi di dati con particolare attenzione all'affidabilità, alla sicurezza e ai costi
• applicare le migliori pratiche per l'automazione, l'orchestrazione e l'ottimizzazione

Prerequisiti:

  • conoscenza di base di SQL
  • consigliato: esperienza in un linguaggio di programmazione (Python, Java, ecc.)
  • comprendere i concetti fondamentali di cloud

Orario del corso:

I materiali del corso sono in inglese. L'insegnamento si svolge in rumeno.

Modulo 01 – Attività e componenti di ingegneria dei dati

  • il ruolo di un ingegnere dei dati
    • fonti di dati vs. data sink
    • formati di dati
    • Opzioni di archiviazione di Google Cloud
    • gestione dei metadati
    • condivisione di set di dati con Analytics Hub
    Lab: Caricamento dei dati in BigQuery

Modulo 02 – Replicazione e migrazione dei dati

  • architettura di replicazione e migrazione
    • Gcloud CLI
    • spostamento di set di dati
    • Flusso di dati e casi d'uso
    Lab: PostgreSQL → Replicazione BigQuery con Datastream

Modulo 03 – Estrazione e caricamento del modello di pipeline (EL)

  • Architettura EL
    • bq CLI
    • Servizio di trasferimento dati BigQuery
    • BigLake come alternativa EL
    Lab: BigLake Qwik Start

Modulo 04 – Estrazione, caricamento e trasformazione del pattern (ELT)

  • Architettura ELT
    • Scripting e pianificazione SQL in BigQuery
    • Modulo dati
    Lab: Crea ed esegui un flusso di lavoro SQL in Dataform

Modulo 05 – Estrazione, trasformazione e caricamento del modello (ETL)

  • Architettura ETL
    • Strumenti GUI in Google Cloud
    • elaborazione batch con Dataproc
    • elaborazione streaming – opzioni
    • Bigtable nelle pipeline di dati
    Labs:
    • Dataproc Serverless per Spark → Carica BigQuery
    • Dashboard in tempo reale del flusso di dati Pipeline

Modulo 06 – Tecniche di automazione

  • modelli di automazione
    · XNUMX€ Cloud Pianificatore e flussi di lavoro
    · XNUMX€ Cloud Compositore
    · XNUMX€ Cloud Funzioni di esecuzione
    • Eventarc
    Lab: Cloud Esegui funzioni → Carica BigQuery

Modulo 07 – Introduzione all’ingegneria dei dati

  • il ruolo dell'ingegnere dei dati
    • sfide dell'ingegneria dei dati
    • introduzione a BigQuery
    • data lake vs. data warehouse
    • governance, accesso e collaborazione
    • studio di caso
    Lab: Utilizzo di BigQuery per l'analisi

Modulo 08 – Costruire un Data Lake

  • architettura del data lake
    • opzioni di archiviazione ed ETL
    · XNUMX€ Cloud Storage come data lake principale
    • sicurezza Cloud Archiviazione
    • utilizzo Cloud SQL
    Lab: Caricamento dei dati del taxi in Cloud SQL

Modulo 09 – Costruire un Data Warehouse

  • architettura moderna del data warehouse
    • BigQuery – concetti, caricamento dati
    • esplorare schemi
    • campi annidati e ripetuti
    • partizionamento e clustering
    Labs:
    • Gestione di JSON e array in BigQuery
    • Tabelle partizionate in BigQuery

Modulo 10 – Introduzione alla creazione di pipeline batch

  • EL / ELT / ETL
    • qualità dei dati
    • esecuzione di operazioni in BigQuery
    Demo: ELT per migliorare la qualità dei dati

Modulo 11 – Eseguire Spark su Dataproc

  • Ecosistema Hadoop
    • esecuzione di carichi di lavoro su Dataproc
    • utilizzo Cloud Archiviazione invece di HDFS
    • Ottimizzazione Dataproc
    Lab: Esecuzione di Spark Jobs su Dataproc

Modulo 12 – Elaborazione dati senza server con Dataflow

  • introduzione a Dataflow
    • aggregazioni, input laterali, windowing
    • Flusso di dati e modelli SQL
    Labs:
    • Flusso di dati semplice Pipeline
    • MapReduce in Beam
    • Ingressi laterali

Modulo 13 – Gestire le pipeline con Cloud Fusione dei dati e Cloud Compositore

  • creazione di pipeline visive con Data Fusion
    • Wrangler – esplorazione e trasformazione dei dati
    • orchestrazione con Cloud Compositore
    • Flusso d'aria: DAG, operatori, flussi di lavoro
    Labs:
    • Costruisci ed esegui Pipeline nella fusione dei dati
    • Introduzione a Cloud Compositore

Modulo 14 – Introduzione all’elaborazione dei dati in streaming

  • concetti di streaming
    • Strumenti GCP per lo streaming

Modulo 15 – Messaggistica senza server con Pub/Sub

  • Push vs pull di Pub/Sub
    • pubblicazione tramite codice
    Lab: Pubblica dati in streaming in Pub/Sub

Modulo 16 – Funzionalità di streaming del flusso di dati

  • sfide di streaming
    • windowing, latenza, trigger
    Lab: Flusso di dati Pipelines

Modulo 17 – Streaming BigQuery e Bigtable ad alta produttività

  • streaming in BigQuery + dashboard
    • inserimento ad alta produttività in Bigtable
    • Ottimizzazione di Bigtable
    Labs:
    • Analisi e dashboard di streaming
    • Streaming in Bigtable

Modulo 18 – Funzionalità e prestazioni avanzate di BigQuery

  • funzioni di finestra analitica
    • Funzioni GIS
    • Ottimizzazione BigQuery
    Lab: Ottimizzazione delle query BigQuery

Nota: L'agenda potrebbe subire modifiche in base al formatore assegnato. Per la versione definitiva, si prega di contattare il team. Bittnet Training.

Ti consigliamo di proseguire con:

Questi corsi estendono la formazione di un Data Engineer ai campi dell'apprendimento automatico e dell'intelligenza artificiale, rilevanti per progetti avanzati basati su BigQuery ML, Dataflow ML e modelli personalizzati.

Programmi di certificazione

Il corso è inserito nel percorso ufficiale per la certificazione Professional Data Engineer, rappresentando la base di apprendimento consigliata da Google. Cloud per questo ruolo.

Domande frequenti sul corso di Data Engineering su Google Cloud

In che modo contribuisce un corso "Data Engineering su Google" Cloud"per aumentare il ROI in un'organizzazione?

Formazione di ingegneri dei dati presso Google Cloud Ottimizza la gestione di grandi flussi di dati, automatizza l'elaborazione ed estrae informazioni preziose. Ciò riduce il costo degli errori manuali, accelera la consegna dei progetti di analisi e supporta le decisioni aziendali basate sui dati, che si traducono in un ROI significativo attraverso l'efficienza operativa e decisioni strategiche più rapide.

Perché la formazione su BigQuery è essenziale per le aziende basate sui dati?

BigQuery offre storage e analisi su scala petabyte a costi prevedibili. Le aziende che padroneggiano BigQuery possono trasformare grandi volumi di dati in informazioni fruibili senza ingenti investimenti infrastrutturali, riducendo il TCO e massimizzando il ritorno sugli investimenti in analisi.

Come ottimizza Google Cloud Pipelinedati e quale impatto hanno sui costi?

Pipeline-dati gestiti in Google Cloud consentire l'elaborazione automatizzata e scalabile dei dati. Questa automazione elimina le attività ripetitive e gli errori associati, riducendo i costi operativi e i tempi di sviluppo, con conseguenti benefici finanziari diretti.

Quale ruolo svolge Dataflow nella trasformazione e nell'integrazione dei dati e in che modo influisce sul ROI?

Dataflow offre un'elaborazione unificata sia per lo streaming che per il batch, con scalabilità automatica. Ciò riduce la complessità architetturale e la necessità di coordinamento tra strumenti diversi, con conseguente riduzione dei costi operativi e tempi di risposta più rapidi per i progetti di dati.

Come il corso supporta l'adozione pratica di ETL/ELT in Google Cloud?

Il corso si concentra sulle tecniche di estrazione, trasformazione e caricamento dei dati utilizzando strumenti nativi come Dataflow e Dataprep, che consentono ai team di creare pipeline convenienti e scalabili, eliminando i silos di dati e aumentando il valore dei dati per l'azienda.

Come si riduce Cloud Quali sono i costi di archiviazione dei dati su larga scala?

Cloud Storage offre storage durevole e scalabile con un ottimo rapporto costo-per-utilizzo. Questa flessibilità consente alle organizzazioni di ottimizzare i budget per i dati inattivi o a cui si accede raramente attraverso efficaci policy di archiviazione, riducendo il TCO e massimizzando l'utilizzo delle risorse.

Quali vantaggi apporta l'integrazione di Dataproc all'elaborazione Hadoop/Spark e in che modo influisce sull'efficienza?

Dataproc consente l'esecuzione on-demand di cluster Hadoop e Spark a costi contenuti e con una rapida scalabilità. Ciò elimina la necessità di una gestione continua dei cluster e riduce al minimo i costi infrastrutturali tradizionali, garantendo risparmi significativi e flessibilità operativa. big data.

Come la conoscenza della sicurezza e della governance aiuta nell'ingegneria dei dati in Google Cloud?

L'implementazione di buone pratiche di sicurezza e governance garantisce la protezione dei dati sensibili e la conformità alle normative. Ciò riduce il rischio di sanzioni, danni alla reputazione e incidenti costosi, proteggendo i ricavi e garantendo la continuità aziendale in modo economicamente vantaggioso.

Perché la capacità di ottimizzare i costi di elaborazione e archiviazione è importante nei progetti sui dati?

Ottimizzare i costi di elaborazione e archiviazione è essenziale per la gestione dei budget IT. Team ben preparati possono implementare politiche di ottimizzazione che riducono le spese mensili senza compromettere le prestazioni, aumentando la redditività e il ROI a lungo termine.

Come può la formazione in Data Engineering presso Google Cloud per accelerare l'innovazione nell'organizzazione?

Le competenze di data engineering consentono alle organizzazioni di sfruttare strategicamente i dati, generando analisi predittive, ottimizzazioni operative e prodotti digitali innovativi. Questa agilità nel generare insight competitivi si traduce in un aumento dei ricavi e in un vantaggio competitivo sostenibile.

Perché mi viene mostrata questa pagina?

Questa pagina viene restituita a causa delle tue ricerche che includono termini come: ingegneria dei dati su Google cloud, ingegnere dei dati professionista certificato da Google, ingegnere dei dati GCP, Google cloud ingegnere dei dati, Google cloud ingegnere dei dati professionista, Google cloud ingegnere dei dati professionista certificato, ingegnere dei dati professionista di Google, ingegnere dei dati di Google, ingegnere dei dati certificato di Google, ingegnere dei dati professionista, ingegnere dei dati professionista GCP, ingegnere dei dati Google, Google cloud ingegnere dei dati certificato, ingegnere dei dati professionista Google, ingegnere dei dati GCP, Google cloud database ingegnere, ingegneria dei dati su Google cloud piattaforma, gcp cloud ingegnere dei dati, ingegnere dei dati professionista certificato, Google cloud ingegnere dei dati di piattaforma, ingegnere dei dati presso Google, ingegneria dei dati con Google cloud, ingegnere dei dati professionista di Google cloud, ingegnere GCP, ingegnere dei dati certificato GCP, GCP per ingegnere dei dati, ingegneria dei dati con Google cloud piattaforma, ingegnere dei dati professionale gcp, ingegneria dei dati su google cloud specializzazione della piattaforma, ingegnere dei dati Google cloud, cloud ingegnere dei dati gcp, ingegnere dei dati professionista certificato gcp, ingegneria dei dati con gcp, ingegnere di apprendimento automatico dei dati di google, google database ingegnere, ingegnere dei dati professionista su Google cloud piattaforma, ingegneria dei dati in gcp, ufficiale google cloud ingegnere dei dati professionista certificato, cloud Ingegnere dei dati di Google, ingegnere dei dati di Google cloud, ingegneria dei dati Google cloud piattaforma, big data Ingegnere di Google o altri.

Ingegneria dei dati su Google Cloud

Offerte personalizzate per gruppi di almeno 2 persone

Dettagli del Corso

Durata:

4
Zile

Prezzo:

Su richiesta

Consegna:

Insegnamento in aula, aula ibrida, aula virtuale

livello:

2. intermedio

Ruoli:

Analisti di dati, Cloud Ingegnere, Ingegnere dei dati, Database Prodotto