Spark Java - Développer des applications pour le Big Data

Formation créée le 11/12/2025.
Version du programme : 1

Type de formation

Présentiel

Accessibilité

Oui
Besoin d’adapter cette formation à vos besoins ? N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure ! Nous contacter

Spark Java - Développer des applications pour le Big Data


Cette formation de 21 heures permet aux développeurs Java de maîtriser le développement de traitements distribués avec Apache Spark. Les participants apprendront à manipuler RDD, DataFrames et SQL, tout en optimisant les performances dans une logique de traitement Big Data.

Objectifs de la formation

  • Développer un traitement distribué avec Spark en Java
  • Manipuler RDD, DataFrames et SQL
  • Optimiser les traitements Spark (cache, persist, partitionnement)
  • Structurer une application Spark Java efficace et réutilisable

Profil des bénéficiaires

Pour qui
  • Développeurs Java, data engineers, analystes techniques ou architectes souhaitant travailler sur le traitement de données volumineuses avec Spark
Prérequis
  • Maîtrise de Java (POO, lambda, collections)
  • Connaissances de base en SQL et traitement de fichiers structurés

Contenu de la formation

Jour 1 – Introduction à Spark et RDD en Java
  • Architecture Spark : cluster, driver, worker
  • Concepts de DAG, exécution distribuée
  • Manipulation des RDD (map, filter, reduce)
  • Création de traitements Spark en Java avec fonctions lambda
Jour 2 – DataFrames et Spark SQL
  • Création de DataFrames avec SparkSession
  • Opérations tabulaires (select, join, groupBy, aggregation)
  • SQL dans Spark avec Java
  • Plan d’exécution, cache, persist, partitionnement
Jour 3 – Intégration, projet et bonnes pratiques
  • Chargement de gros fichiers (CSV, JSON, Parquet)
  • Dataset<Row> vs RDD : cas d’usage
  • Mini-projet : traitement Spark Java complet
  • Bilan et perspectives (exécution sur cluster, Spark Streaming, etc.)

Équipe pédagogique

Les formateurs intervenant dans cette formation sont des experts reconnus dans leur domaine. Sélectionnés avec soin, ils répondent à des critères stricts définis par nos équipes pédagogiques, tant sur le plan de l'expertise métier que sur celui des compétences pédagogiques. Chaque formateur : Possède au minimum 5 à 10 ans d'expérience professionnelle dans son domaine d'activité. A occupé ou occupe encore des postes à responsabilité en entreprise, apportant une vision concrète et actualisée des réalités du terrain. Est formé à des méthodes pédagogiques interactives pour garantir un apprentissage efficace et adapté aux besoins des participants.

Suivi de l'exécution et évaluation des résultats

  • Exercices pratiques et corrigés
  • Évaluation sur le mini-projet Spark Java
  • Feuille de présence
  • Questionnaire de satisfaction

Ressources techniques et pédagogiques

  • Support PDF
  • Code Java Spark structuré (TP et projet)
  • Données d'entraînement (fichiers logs/CSV)
  • Guide d’installation et de lancement Spark local

Qualité et satisfaction

Questionnaire de satisfaction à chaud. Questionnaire de satisfaction à froid

Capacité d'accueil

Entre 1 et 8 apprenants

Délai d'accès

2 semaines

Accessibilité

Nous accordons une attention particulière à l'accueil des personnes en situation de handicap. Si vous êtes concerné(e) et souhaitez suivre cette formation, nous vous invitons à nous contacter dès que possible. Ensemble, nous étudierons vos besoins spécifiques et mettrons en place les adaptations nécessaires pour garantir votre accès à la formation dans les meilleures conditions.