Cloudera Hadoop Administrator

Obiettivo
Il corso si pone l’obiettivo di introdurre alla suite Cloudera Hadoop e alle sue componenti open source, dettagliando le modalità di archiviazione, elaborazione e analisi dei dati.
Destinatari
Professionisti IT, tecnici applicativi, architetti, capi progetto ed amministratori
Prerequisiti
– Conoscenza di Linux
– Capacità di utilizzo della interfaccia da linea di comando
Durata
4 giornate
Argomenti trattati
- Introduzione ad Apache Hadoop e concetti fondamentale
- Struttura e architettura di Hadoop
- Cluster Management Solution
- Cloudera Manager: caratteristiche ed istallazione
- Hadoop (CDH) Installation
- Caratteristiche principali di HDFS
- Leggere e scrivere dai files
- Web UIs per HDFS
- Hadoop File Shell
- Scopi
- MapReduce Concetti fondamentali
- Apache Spark
- Computational Frameworks
- Application Logs
- Cloudera Manager Constructs per Managing Configurations
- Gestire le Role Instances e I servizi
- Configurare il servizio HDFS
- Configurare i Logs
- Importare dati da fonti esterne
- Importare dati da un DB relazionale
- Interfacce REST
- Best Practices
- Considerazioni generali
- Considerazioni sull’Hadware
- Considerazioni sulla rete
- Configurare i nodi
- Scopi
- Installare e configurare Hadoop Clients
- Installare e configurare Hue
- HDFS Status
- Copiare I dati tra i clusters
- Aggiungere e togliere Nodi
- Ribilanciare iCluster
- Cloudera Manager Monitoring
- Monitoring Hadoop Clusters
- Troubleshooting
Descrizione
Destinatari
Professionisti IT che vogliono approfondire i concetti di big data e machine learning
Prerequisiti
Nozioni di programmazione, nozioni di SQL, nozioni base di Linux.
Durata
5 giornate
Informazioni