Hadoop - Développer des applications pour le Big Data

Formation créée le 11/12/2025.
Version du programme : 1

Type de formation

Présentiel

Durée de formation

28 heures (4 jours)

Accessibilité

Oui
Besoin d’adapter cette formation à vos besoins ? N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure ! Nous contacter

Hadoop - Développer des applications pour le Big Data


Cette formation de 28 heures permet de comprendre l’architecture Hadoop et de développer des applications pour le traitement distribué de données massives. Les participants manipulent HDFS, conçoivent des traitements MapReduce, et utilisent Hive et Pig pour exploiter les données avec efficacité.

Objectifs de la formation

  • Comprendre le fonctionnement du système de fichiers HDFS
  • Développer des traitements MapReduce (Java ou Python)
  • Exploiter les données via Hive et Pig
  • Structurer un pipeline Big Data sous Hadoop

Profil des bénéficiaires

Pour qui
  • Développeurs, data engineers, analystes ou profils IT souhaitant exploiter Hadoop pour des traitements distribués à grande échelle
Prérequis
  • Connaissance de Java ou Python
  • Maîtrise de SQL
  • Notions de base sur les architectures distribuées utiles

Contenu de la formation

Jour 1 – Architecture Hadoop et HDFS
  • Introduction au Big Data
  • Fonctionnement du cluster Hadoop
  • Principe et structure de HDFS
  • Chargement de données, commandes HDFS
Jour 2 – Développement MapReduce
  • Comprendre MapReduce (Mapper, Reducer, Combiner)
  • Implémentation Java et Hadoop Streaming (Python)
  • Tests de performances (partitions, shuffle)
  • TP : traitement de fichiers volumineux
Jour 3 – Hive et Pig
  • Hive : SQL sur HDFS, DDL, DML, UDF
  • Pig : langage de transformation déclaratif
  • Comparaison avec MapReduce classique
  • TP : requêtes sur jeux de données textuels
Jour 4 – Projet et cas concrets
  • Pipeline complet (stockage, traitement, analyse)
  • Traitement de logs, fichiers CSV, JSON
  • Audit du flux et mise en qualité
  • Perspectives vers Spark, HBase, YARN

Équipe pédagogique

Les formateurs intervenant dans cette formation sont des experts reconnus dans leur domaine. Sélectionnés avec soin, ils répondent à des critères stricts définis par nos équipes pédagogiques, tant sur le plan de l'expertise métier que sur celui des compétences pédagogiques. Chaque formateur : Possède au minimum 5 à 10 ans d'expérience professionnelle dans son domaine d'activité. A occupé ou occupe encore des postes à responsabilité en entreprise, apportant une vision concrète et actualisée des réalités du terrain. Est formé à des méthodes pédagogiques interactives pour garantir un apprentissage efficace et adapté aux besoins des participants.

Suivi de l'exécution et évaluation des résultats

  • QCM sur l’architecture Hadoop
  • Évaluation via le mini-projet
  • Feuille de présence
  • Questionnaire de satisfaction

Ressources techniques et pédagogiques

  • Support PDF
  • Scripts MapReduce (Java, Python)
  • Scripts Hive et Pig
  • Jeux de données et VM Hadoop si nécessaire

Qualité et satisfaction

Questionnaire de satisfaction à chaud. Questionnaire de satisfaction à froid.

Capacité d'accueil

Entre 1 et 8 apprenants

Délai d'accès

2 semaines

Accessibilité

Nous accordons une attention particulière à l'accueil des personnes en situation de handicap. Si vous êtes concerné(e) et souhaitez suivre cette formation, nous vous invitons à nous contacter dès que possible. Ensemble, nous étudierons vos besoins spécifiques et mettrons en place les adaptations nécessaires pour garantir votre accès à la formation dans les meilleures conditions.