Per assistenza: 06 9785 9222

Big Data & Machine Learning

Modalità

Virtual classroom

Durata

5 Giornate
Scarica scheda in PDF

Destinatari

Professionisti IT che vogliono approfondire i concetti di big data e machine learning

prerequisiti

Nozioni di programmazione, nozioni di SQL, nozioni base di Linux.

Obiettivi

Al termine del corso i destinatari acquisiranno conoscenza della piattaforma Hadoop e del framework Spark. Acquisiranno un approccio strutturato, strumenti e tecniche di data analysis in base ai dati ed alle informazioni disponibili in progetti di Big Data e Machine Learning

d

Argomenti Trattati

INTRODUZIONE BIG DATA ED ECOSISTEMA HADOOP

  • Problematiche nei sistemi di grandi dati: dal Data Warehouse ai Big Data
  • Panoramica sull’ecosistema Hadoop
  • Introduzione all’Hadoop Distributed File System
  • Apache Hive
  • Resource Management: Architettura YARN e utilizzi
  • Cenni di NoSQL

APACHE SPARK

  • Introduzione
  • Utilizzo Spark Shell
  • RDDs (Resilient Distributed Datasets)
  • Programmazione funzionale in Spark

SPARK SQL

  • Data Transformation
  • Normalization
  • Cleaning

SPARK ML – DATAMINING E MACHINE LEARNING CON PYSPARK

  • Datamining e metodologia Crisp
  • La preparazione dei dati
  • Algoritmi supervisionati
  • Algoritmi non supervisionati

STRUMENTI E TOOL UTILIZZATI

  • Linguaggio Python
  • Libreria PySpark per il Machine Learning
  • Jupyter Notebook
  • RapidMiner Studio – KNIME
  • Casi d’uso ed utilizzo ed applicazioni pratiche

Ti interessa questo corso?

Prenota il tuo posto oppure contattaci per avere maggiori info

    PRENOTAZIONE ON LINE

    • Scegli le date preferite

    • Invia la richiesta e riceverai le coordinate per effettuare il pagamento

    • Una volta ricevuto il pagamento confermeremo la partecipazione al corso

    • Puoi contattare la segreteria scrivendo a [email protected] per qualsiasi informazione relativa alla prenotazione