IBM InfoSphere DataStage
Formation créée le 21/09/2022. Dernière mise à jour le 15/11/2025.
Version du programme : 1
Version du programme : 1
Type de formation
PrésentielDurée de formation
21 heures (3 jours)
Cette formation est gratuite.
S'inscrire
Cette formation est gratuite.
S'inscrire
Cette formation est gratuite.
S'inscrire
IBM InfoSphere DataStage
ETL (Extract-Transform-Load) proposé par IBM, InfoSphere DataStage est une solution d'importation, demanipulation et demappages de données complexes et hétérogènes. Sa mise en œuvre permet d'effectuer des synchronisations massives d'informations d'une base de données vers une autre et d'alimenter ainsi des DataWarehouse. Les participants à cette formation pratique apprendront à utiliser DataStage pour construire et exécuter des jobs d'extraction, de transformation et de chargements (ETL).
Objectifs de la formation
- Comprendre comment combiner les données en utilisant les instructions Lookup, Join et Merge
- Savoir transformer, combiner, filtrer et trier des données à l'aide de travaux (jobs)
- Être en mesure de construire des agrégats de données
- Maîtriser la création de rapports avec des travaux (jobs)
Profil des bénéficiaires
Pour qui
- Toutes personnes ayant des bases dans la data et ETL, souhaitant avoir des compétences de DataStage.
- Idéalementles chefs de projets et développeurs ETL.
Prérequis
- Bonne connaissance du monde informatique.
- Bonnes connaissances de l'utilisation du système d'exploitation Windows.
- Être familier avec les techniques d'accès aux bases de données.
Contenu de la formation
Introduction à DataStage
- Lister et décrire les utilisations de DataStage
- Lister et décrire les clients DataStage
- Décrire le Workflow DataStage
- Décrire les deux types de parallélisme possibles avec les tâches en parallèle dans DataStage
Déployer
- Identifier les composants Information Server qui doivent être installés
- Décrire en quoi consiste un déploiement
- Décrire les différentes options de déploiement du domaine
- Décrire le processus d'installation
- Démarrer Information Server
Administrer
- Ouvrir la console Web
- Créer des nouveaux utilisateurs et des groupes
- Assigner des rôles
- Suite et composant aux utilisateurs et aux groupes
- Donner les accès DataStage aux utilisateurs
- Connexion à DataStage en tant qu'administrateur
- Ajouter un utilisateur DataStage dans l'onglet Permission et spécifier le rôle de l'utilisateur
- Spécifier les projets par défaut
- Lister et décrire les variables d'environnement importantes
Travailler avec les métadonnées
- Connexion à DataStage
- Se déplacer dan sDataStage Designer
- Importer et exporter les objets DataStage dans un fichier
- Importer une définition de table pour un fichier séquentiel
Créer des tâches parallèles
- Concevoir des tâches parallèles dans DataStage
- Définir le paramètre de la tâche
- Utiliser RowGenerator, Peek et Annotation dans une tâche
- Compiler les tâches
- Activer les tâches
- Surveiller les journaux des tâches
- Créer un jeu de paramètres et l'utiliser dans une tâche
Accéder aux données séquentielles
- Comprendre les étapes pour accéder aux différents types de fichiers de données
- Lire et écrire des séquences de fichiers via Sequential File Stage
- Lire et écrire des fichiers d'ensemble de données via les étapes DataStage
- Créer des liens de rejet
- Travailler avec les valeurs NULL dans les fichiers séquentiels
- Lire des fichiers séquentiels multiples via des modèles de fichiers
- Utiliser des lecteurs multiples
Partitionner et collecter
- Décrire l'architecture du processus parallèle
- Décrire le pipeline et la partition du parallélisme
- Lister et décrire le partitionnement et les algorithmes de réassemblage
- Décrire les fichiers de configuration
- Décrire le processus de compilation des tâches parallèles
- Expliquer OSH
Combiner les données
- Combiner les données via les étapes Lookup
- Définir les "range lookups"
- Combiner les données via la fusion
- Combiner les données via la jointure
Étape de traitement de groupe
- Trier les données
- Combiner l'étape d'agrégation
- Combiner les données et supprimer les doublons
Étape de la transformation
- Utilise l'étape de transformation dans les tâches parallèles
- Définir les contraintes
- Définir les dérivations
- Utiliser les variables
- Créer un jeu de paramètres et utiliser ses paramètres dans les contraintes et les dérivations
Fonctions Repository
- Améliorer la recherche simple
- Améliorer la recherche avancée
- Améliorer l'analyse d'impact
- Comparer les différences entre deux définitions de table
- Comparer les différences entre deux tâches
Travailler avec des données relationnelles
- Importer les définitions de tables pour les tables relationnelles
- Créer les connexions de données
- UtiliserODBC et le connecteurDB2 dans une tâche
- Utiliser SQL Builder pour définir SQL SELECT et INSERT
- Utiliser les liens d'entrée multiples dans le connecteur pour mettre à jour les tables multiples dans une transaction simple
- Créer des liens de rejets à partir du Connecteur pour capturer les lignes avec les erreurs SQL
Contrôler les tâches
- Utiliser le séquenceur de tâches DataStage pour créer une tâche qui contrôle une séquence de tâches
- Utiliser les liens du séquenceur et les étapes pour contrôler la séquence d'un jeu de tâches
- Utiliser les déclencheurs et les étapes pour contrôler les conditions selon lesquelles les tâches sont activées
- Transmettre des informations dans les paramètres des tâches à partir du master de contrôle des tâches
- Prise en main des erreurs et des exceptions
Équipe pédagogique
Nos formations sont animées par des experts reconnus dans leur domaine possédant une expérience sur le terrain significative et des compétences pédagogiques reconnues,
Suivi de l'exécution et évaluation des résultats
- Feuilles de présence.
- Questions orales ou écrites (QCM).
- Mises en situation.
- Formulaires d'évaluation de la formation.
- Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
- Accueil des apprenants dans une salle dédiée à la formation.
- Documents supports de formation projetés.
- Exposés théoriques
- Etude de cas concrets
- Quiz en salle
- Mise à disposition en ligne de documents supports à la suite de la formation.