Hadoop - Développer des applications pour le Big Data
Version du programme : 1
Type de formation
PrésentielDurée de formation
28 heures (4 jours)Accessibilité
OuiHadoop - Développer des applications pour le Big Data
Cette formation de 28 heures permet de comprendre l’architecture Hadoop et de développer des applications pour le traitement distribué de données massives. Les participants manipulent HDFS, conçoivent des traitements MapReduce, et utilisent Hive et Pig pour exploiter les données avec efficacité.
Objectifs de la formation
- Comprendre le fonctionnement du système de fichiers HDFS
- Développer des traitements MapReduce (Java ou Python)
- Exploiter les données via Hive et Pig
- Structurer un pipeline Big Data sous Hadoop
Profil des bénéficiaires
- Développeurs, data engineers, analystes ou profils IT souhaitant exploiter Hadoop pour des traitements distribués à grande échelle
- Connaissance de Java ou Python
- Maîtrise de SQL
- Notions de base sur les architectures distribuées utiles
Contenu de la formation
Jour 1 – Architecture Hadoop et HDFS
- Introduction au Big Data
- Fonctionnement du cluster Hadoop
- Principe et structure de HDFS
- Chargement de données, commandes HDFS
Jour 2 – Développement MapReduce
- Comprendre MapReduce (Mapper, Reducer, Combiner)
- Implémentation Java et Hadoop Streaming (Python)
- Tests de performances (partitions, shuffle)
- TP : traitement de fichiers volumineux
Jour 3 – Hive et Pig
- Hive : SQL sur HDFS, DDL, DML, UDF
- Pig : langage de transformation déclaratif
- Comparaison avec MapReduce classique
- TP : requêtes sur jeux de données textuels
Jour 4 – Projet et cas concrets
- Pipeline complet (stockage, traitement, analyse)
- Traitement de logs, fichiers CSV, JSON
- Audit du flux et mise en qualité
- Perspectives vers Spark, HBase, YARN
Équipe pédagogique
Suivi de l'exécution et évaluation des résultats
- QCM sur l’architecture Hadoop
- Évaluation via le mini-projet
- Feuille de présence
- Questionnaire de satisfaction
Ressources techniques et pédagogiques
- Support PDF
- Scripts MapReduce (Java, Python)
- Scripts Hive et Pig
- Jeux de données et VM Hadoop si nécessaire
Qualité et satisfaction
Capacité d'accueil
Délai d'accès
Accessibilité
Nous accordons une attention particulière à l'accueil des personnes en situation de handicap. Si vous êtes concerné(e) et souhaitez suivre cette formation, nous vous invitons à nous contacter dès que possible. Ensemble, nous étudierons vos besoins spécifiques et mettrons en place les adaptations nécessaires pour garantir votre accès à la formation dans les meilleures conditions.