Amazon Web Services – Big Data on AWS

În acest curs de 3 zile veți afla despre soluțiile de “big data” bazate pe cloud și Amazon Elastic MapReduce (EMR) și AWS Big Data Platform. Vei învăța cum să folosești Amazon EMR pentru a prelucra date folosind instrumente ecosistemice Hadoop precum Pig și Hive. Alte subiecte abordate în acest curs includ modalitatea de a crea medii de tip “big data” tilizând Amazon DynamoDB, Amazon Redshift și Amazon Kinesis.

Cui i se adresează?

Acest curs se adresează oamenilor de știință și analiștilor interesați să afle mai multe despre soluțiile “big data” pe AWS, precum și Solutions Architects și SysOps Administrators responsabili de proiectarea și implementarea soluțiilor “big data”.

Ce veți învăța?

După completare, veți ști cum să:

– Înțelegeți Apache Hadoop în contextul Amazon EMR
– Înțelegeți arhitectura unui cluster EMR Amazon
– Lansați un cluster Amazon EMR utilizând un tip de instanță Amazon Machine Image și Amazon EC2 adecvate
– Alegeți opțiunile corespunzătoare de stocare a datelor AWS pentru utilizare cu Amazon EMR
– Cunoașteți opțiunile dvs. de ingerare, transfer și comprimare a datelor pentru utilizare cu Amazon EMR
– Folosiți cadre comune de programare disponibile pentru Amazon EMR, inclusiv Hive, Pig și Streaming
– Lucrați cu Amazon Redshift pentru a implementa o soluție de “big data”
– Utilizați software de vizualizare a “big data”
– Alegeți opțiunile de securitate adecvate pentru Amazon EMR și datele dvs.
– Efectuați analize de date în memorie cu Spark și Shark pe Amazon EMR
– Alegeți opțiunile adecvate pentru a vă gestiona mediul Amazon EMR din punct de vedere al costurilor
– Înțelegeți avantajele utilizării Amazon Kinesis pentru “big data”

Cerințe preliminare:

– Sa fie familiarizați cu tehnologiile de “big data” inclusiv Apache Hadoop și HDFS
– Cunoștințe despre serviciile de bază AWS și implementarea publică a cloud-ului
– Cunoștințe de bază de depozitare a datelor, a sistemelor relaționale de baze de date și a proiectării bazelor de date.

Agenda cursului:

Materialele de curs sunt în limba Engleză. Predarea se face în limba Română.

Citește agenda cursului
Citește agenda cursului

1. Overview of Big Data
2. Data Ingestion, Transfer, and Compression
3. AWS Data Storage Options
4. Using DynamoDB with Amazon EMR
5. Using Kinesis for Near Real-Time Big Data Processing
6. Introduction to Apache Hadoop and Amazon EMR
7. Using Amazon Elastic MapReduce
8. The Hadoop Ecosystem
9. Using Hive for Advertising Analytics
10. Using Streaming for Life Sciences Analytics
11. Using Hue with Amazon EMR
12. Running Pig Scripts with Hue on Amazon EMR
13. Spark on Amazon EMR
14. Running Spark and Spark SQL Interactively on Amazon EMR
15. Using Spark and Spark SQL for In-Memory Analytics
16. Managing Amazon EMR Costs
17. Securing your Amazon EMR Deployments
18. Data Warehouses and Columnar Datastores
19. Introduction to Amazon Redshift
20. Optimizing Your Amazon Redshift Environment
21. The Big Data Ecosystem on AWS
22. Visualizing and Orchestrating Big Data
23. Using Tibco Spotfire to Visualize Big Data

Este recomandat să continui cu:

Nu există cursuri recomandate după finalizarea acestui curs.

Programe de certificare

Nu sunt programe de ceritifcare pentru acest curs.

Detalii curs

Durată
3
zile

Preț
1600
EUR

Modalități de livrare
Predare în clasă, Clasă hibridă, Clasă virtuală
Nivel de specializare
Într-o economie bazată pe cunoaștere, educarea și instruirea angajaților reprezintă o investiție în vederea obținerii unei performanțe îmbunătățite pe termen scurt, precum și a succesului pe termen lung al organizației.
DORESC SĂ MĂ ÎNSCRIU LA CURS

Vă rog să mă contactați:

Meniu