Big Data & Machine Learning

Obiettivo
Al termine del corso i destinatari acquisiranno conoscenza della piattaforma Hadoop e del framework Spark. Acquisiranno un approccio strutturato, strumenti e tecniche di data analysis in base ai dati ed alle informazioni disponibili in progetti di Big Data e Machine Learning
Destinatari
Professionisti IT che vogliono approfondire i concetti di big data e machine learning
Prerequisiti
Nozioni di programmazione, nozioni di SQL, nozioni base di Linux.
Durata
5 giornate
Argomenti trattati
- Problematiche nei sistemi di grandi dati: dal Datawehouse ai BigData
- Panoramica ecosistema Hadoop
- Introduzione ad Hadoop Distribuited File Sistem
- Apache Hive
- Resource Management: Architettura YARN e utilizzi
- Cenni di NoSql
- Introduzione
- Utilizzo Spark Shell
- RDDs (Resilient Distributed Datasets)
- Programmazione funzionale in Spark
- Data Transformation
- Normalization
- Cleaning
- Datamining e metodologia Crisp
- La preparazione dei dati
- Algoritmi supervisionati
- Algoritmi non supervisionati
- Linguaggio Python
- Libreria PySpark per il Machine Learning
- Jupyter Notebook
- RapidMinerStudio – Knime
- Casi d’uso ed utilizzo ed applicazioni pratiche
Descrizione
Destinatari
Professionisti IT che vogliono approfondire i concetti di big data e machine learning
Prerequisiti
Nozioni di programmazione, nozioni di SQL, nozioni base di Linux.
Durata
5 giornate
Informazioni