Cloudera Hadoop Administrator
obiettivi
destinatari
prerequisiti
argomenti
Modalità
Virtual classroom
Durata
Modalità
Virtual classroom
Durata
Obiettivi
Il corso si pone l’obiettivo di introdurre alla suite Cloudera Hadoop e alle sue componenti open source, dettagliando le modalità di archiviazione, elaborazione e analisi dei dati.
Destinatari
Professionisti IT, tecnici applicativi, architetti, capi progetto ed amministratori
prerequisiti
– Conoscenza di Linux
– Capacità di utilizzo della interfaccia da linea di comando
Argomenti Trattati
APACHE HADOOP
- Introduzione ad Apache Hadoop e concetti fondamentali
- Struttura e architettura di Hadoop
HADOOP CLUSTER INSTALLATION
- Cluster Management Solution
- Cloudera Manager: caratteristiche ed istallazione
- Hadoop (CDH) Installation
DISTRIBUTED FILE SYSTEM (HDFS)
- Caratteristiche principali di HDFS
- Leggere e scrivere dai files
- Web UIs per HDFS
- Hadoop File Shell
MAPREDUCE
- Scopi
- MapReduce Concetti fondamentali
- Apache Spark
- Computational Frameworks
- Application Logs
HADOOP CONFIGURATION AND DAEMON LOGS
- Cloudera Manager Constructs per Managing Configurations
- Gestire le Role Instances e I servizi
- Configurare il servizio HDFS
- Configurare i Logs
IMPORTARE I DATI NEL HDFS
- Importare dati da fonti esterne
- Importare dati da un DB relazionale
- Interfacce REST
- Best Practices
GESTIRE UN HADOOP CLUSTER
- Considerazioni generali
- Considerazioni sull’Hadware
- Considerazioni sulla rete
- Configurare i nodi
INSTALLING AND CONFIGURING HIVE HADOOP CLIENTS
- Scopi
- Installare e configurare Hadoop Clients
- Installare e configurare Hue
CLUSTER MAINTENANCE
- HDFS Status
- Copiare I dati tra i clusters
- Aggiungere e togliere Nodi
- Ribilanciare iCluster
CLUSTER MONITORING AND TROUBLESHOOTING
- Cloudera Manager Monitoring
- Monitoring Hadoop Clusters
- Troubleshooting