Logo de l'organisme de formation

ENTREZ DANS L'UNIVERS ESIC

Représentation de la formation : Spark Java - Développer des applications pour le Big Data

Spark Java - Développer des applications pour le Big Data

Formation mixte
Formation certifiante
CPF #
Accessible
Durée : 21 heures (3 jours)
Durée :21 heures (3 jours)
HT

Éligible CPF

Se préinscrire
Durée :21 heures (3 jours)
HT

Éligible CPF

Se préinscrire
Durée :21 heures (3 jours)
HT

Éligible CPF

Se préinscrire

Besoin d’adapter cette formation à vos besoins ?

N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure !

Formation créée le 21/11/2022. Dernière mise à jour le 23/08/2023.

Version du programme : 2

Programme de la formation

Souvent présenté comme le successeur de Hadoop, SPARK simplifie la programmation des traitements BigData permettant l'utilisation de scala, Python ou Java . Cette formation apprendra aux programmeurs à traiter un flux de données en temps réel et à effectuer des traitements batch (du SQL jusqu'au Machine Learning).

Objectifs de la formation

  • Maîtriser les concepts fondamentaux de Spark
  • Développer des applications avec Spark Streaming
  • Mettre en œuvre un cluster Spark
  • Exploiter des données avec Spark SQL
  • Avoir une première approche du Machine Learning

Profil des bénéficiaires

Pour qui
  • Chefs de projet, data scientists, développeurs, architectes.
Prérequis
  • Bonnes connaissances du langage Java.
  • Connaissances en Big Data.

Contenu de la formation

  • Présentation d'Apache Spark
    • Historique du Framework.
    • Les différentes versions de Spark (Scala, Python et Java).
    • Comparaison avec l'environnement Apache Hadoop.
    • Les différents modules de Spark.
  • Programmer avec les Resilient Distributed Dataset (RDD)
    • Présentation des RDD.
    • Créer, manipuler et réutiliser des RDD.
    • Accumulateurs et variables broadcastées.
    • Utiliser des partitions.
  • Manipuler des données structurées avec Spark SQL
    • SQL, DataFrames et Datasets.
    • Les différents types de sources de données.
    • Interopérabilité avec les RDD.
    • Performance de Spark SQL.
    • JDBC/ODBC server et Spark SQL CLI.
  • Spark sur un cluster
    • Les différents types d'architecture : Standalone, Apache Mesos ou Hadoop YARN.
    • Configurer un cluster en mode Standalone.
    • Packager une application avec ses dépendances.
    • Déployer des applications avec Spark-submit.
    • Dimensionner un cluster .
  • Analyser en temps réel avec Spark Streaming
    • Principe de fonctionnement.
    • Présentation des Discretized Streams (DStreams).
    • Les différents types de sources.
    • Manipulation de l'API.
    • Comparaison avec Apache Storm.
  • Manipuler des graphes avec GraphX
    • Présentation de GraphX.
    • Les différentes opérations.
    • Créer des graphes.
    • Vertex and Edge RDD.
    • Présentation de différents algorithmes.
  • Machine Learning avec Spark
    • Introduction au Machine Learning.
    • Les différentes classes d'algorithmes.
    • Présentation de SparkML et MLlib.
    • Implémentations des différents algorithmes dans MLlib.
Équipe pédagogique

Nos formations sont animées par des experts reconnus dans leur domaine possédant une expérience sur le terrain significative et des compétences pédagogiques reconnues.

Suivi de l'exécution et évaluation des résultats
  • Feuilles de présence.
  • Questions orales ou écrites (QCM).
  • Mises en situation.
  • Formulaires d'évaluation de la formation.
  • Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
  • Accueil des apprenants dans une salle dédiée à la formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Etude de cas concrets
  • Quiz en salle
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Qualité et satisfaction

Merci de consulter notre site internet.

Modalités de certification

Résultats attendus à l'issue de la formation
  • Attestation de fin de formation
Détails sur la certification
  • Voir le catalogue de certification

Délai d'accès

2 semaines

Accessibilité

Les personnes atteintes de handicap souhaitant suivre cette formation sont invitées à nous contacter directement, afin d’étudier ensemble les possibilités de suivre la formation.