Web Scraping - Récolter des données sur le web avec Python

Formation créée le 09/12/2025. Dernière mise à jour le 11/12/2025.
Version du programme : 1

Type de formation

Présentiel

Durée de formation

28 heures (4 jours)

Accessibilité

Oui
Besoin d’adapter cette formation à vos besoins ? N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure ! Nous contacter

Web Scraping - Récolter des données sur le web avec Python


Cette formation de 28 heures permet d’apprendre à collecter automatiquement des données depuis le web en utilisant Python. Les participants apprendront à cibler, extraire, structurer et exploiter des données publiques, tout en respectant la législation en vigueur (RGPD, mentions légales, etc.).

Objectifs de la formation

  • Extraire des données structurées depuis des pages HTML avec Python
  • Naviguer sur des sites dynamiques ou paginés pour collecter de l’information
  • Utiliser `requests`, `BeautifulSoup` et `Selenium` pour automatiser la récupération de contenu
  • Structurer, stocker et exploiter les données collectées dans le respect de la réglementation

Profil des bénéficiaires

Pour qui
  • Développeurs Python, analystes, chargés de veille ou professionnels de la donnée souhaitant automatiser la collecte d’informations web.
Prérequis
  • Bases solides en Python (boucles, fonctions, dictionnaires, fichiers).
  • Notions HTML utiles mais non indispensables.

Contenu de la formation

Introduction & premiers scrapers
  • Notions essentielles du web : HTML, DOM, HTTP
  • Librairies Python : `requests`, `BeautifulSoup`
  • Scraping d’éléments simples (titres, paragraphes, liens, tableaux)
  • Structuration et stockage basique (CSV, JSON)
Scraping structuré et multipage
  • Utilisation des sélecteurs CSS et XPath
  • Gestion de la pagination (URLs dynamiques, liens « suivant »)
  • Scraping de données tabulaires
  • Stockage dans SQLite
Sites dynamiques et robustesse
  • Scraping de contenu dynamique avec `Selenium`
  • Gestion des délais, exceptions, cookies et headers
  • Navigation avec drivers headless, aléatoire, anti-bot
  • Authentification simple simulée (formulaire, session)
Projet final, éthique & RGPD
  • Projet fil rouge : extraction complète d’un site web
  • Structuration et nettoyage des données (finalisation CSV/SQLite)
  • Bonnes pratiques légales : robots.txt, CGU, RGPD
  • Présentation et documentation du projet

Équipe pédagogique

Les formateurs intervenant dans cette formation sont des experts reconnus dans leur domaine. Sélectionnés avec soin, ils répondent à des critères stricts définis par nos équipes pédagogiques, tant sur le plan de l'expertise métier que sur celui des compétences pédagogiques. Chaque formateur : Possède au minimum 5 à 10 ans d'expérience professionnelle dans son domaine d'activité. A occupé ou occupe encore des postes à responsabilité en entreprise, apportant une vision concrète et actualisée des réalités du terrain. Est formé à des méthodes pédagogiques interactives pour garantir un apprentissage efficace et adapté aux besoins des participants.

Suivi de l'exécution et évaluation des résultats

  • Exercices pratiques à chaque session
  • Évaluation du projet final (fonctionnalité + conformité)
  • Feuille de présence
  • Questionnaire de satisfaction

Ressources techniques et pédagogiques

  • Support de cours PDF
  • Scripts d’exemples annotés (scraping de base, avancé, dynamique)
  • Fiches mémo (requests, BeautifulSoup, Selenium)
  • Modèle de projet complet commenté

Qualité et satisfaction

Questionnaire de satisfaction à chaud. Administré immédiatement après la formation pour recueillir un retour sur la qualité des contenus et de l’animation.

Capacité d'accueil

Entre 1 et 8 apprenants

Délai d'accès

2 semaines

Accessibilité

Nous accordons une attention particulière à l'accueil des personnes en situation de handicap. Si vous êtes concerné(e) et souhaitez suivre cette formation, nous vous invitons à nous contacter dès que possible. Ensemble, nous étudierons vos besoins spécifiques et mettrons en place les adaptations nécessaires pour garantir votre accès à la formation dans les meilleures conditions.