Big Data & Machine Learning

Obiettivo

Al termine del corso i destinatari acquisiranno conoscenza della piattaforma Hadoop e del framework Spark. Acquisiranno un approccio strutturato, strumenti e tecniche di data analysis in base ai dati ed alle informazioni disponibili in progetti di Big Data e Machine Learning

Destinatari

Professionisti IT che vogliono approfondire i concetti di big data e machine learning

Prerequisiti

Nozioni di programmazione, nozioni di SQL, nozioni base di Linux. 

Durata

5 giornate

Argomenti trattati

  • Problematiche nei sistemi di grandi dati: dal Datawehouse ai BigData
  • Panoramica ecosistema Hadoop
  • Introduzione ad Hadoop Distribuited File Sistem
  • Apache Hive
  • Resource Management: Architettura YARN e utilizzi
  • Cenni di NoSql
  • Introduzione
  • Utilizzo Spark Shell
  • RDDs (Resilient Distributed Datasets)
  • Programmazione funzionale in Spark
  • Data Transformation
  • Normalization
  • Cleaning
  • Datamining e metodologia Crisp
  • La preparazione dei dati
  • Algoritmi supervisionati
  • Algoritmi non supervisionati
  • Linguaggio Python
  • Libreria PySpark per il Machine Learning
  • Jupyter Notebook
  • RapidMinerStudio – Knime
  • Casi d’uso ed utilizzo ed applicazioni pratiche

Big Data & Machine Learning

Questo corso è disponibile su richiesta

CLICCA QUI PER INFORMAZIONI

Descrizione

Destinatari

Professionisti IT che vogliono approfondire i concetti di big data e machine learning

Prerequisiti

Nozioni di programmazione, nozioni di SQL, nozioni base di Linux.

Durata

5 giornate

Informazioni

    Acconsento all'uso dei mie dati ai fini indicati dalla Privacy Policy

    Vorrei essere aggiornato sulle offerte e le novità dei vostri corsi.