Web Scraping - Récolter des données sur le web avec Python
Version du programme : 1
Type de formation
PrésentielDurée de formation
28 heures (4 jours)Accessibilité
OuiWeb Scraping - Récolter des données sur le web avec Python
Cette formation de 28 heures permet d’apprendre à collecter automatiquement des données depuis le web en utilisant Python. Les participants apprendront à cibler, extraire, structurer et exploiter des données publiques, tout en respectant la législation en vigueur (RGPD, mentions légales, etc.).
Objectifs de la formation
- Extraire des données structurées depuis des pages HTML avec Python
- Naviguer sur des sites dynamiques ou paginés pour collecter de l’information
- Utiliser `requests`, `BeautifulSoup` et `Selenium` pour automatiser la récupération de contenu
- Structurer, stocker et exploiter les données collectées dans le respect de la réglementation
Profil des bénéficiaires
- Développeurs Python, analystes, chargés de veille ou professionnels de la donnée souhaitant automatiser la collecte d’informations web.
- Bases solides en Python (boucles, fonctions, dictionnaires, fichiers).
- Notions HTML utiles mais non indispensables.
Contenu de la formation
Introduction & premiers scrapers
- Notions essentielles du web : HTML, DOM, HTTP
- Librairies Python : `requests`, `BeautifulSoup`
- Scraping d’éléments simples (titres, paragraphes, liens, tableaux)
- Structuration et stockage basique (CSV, JSON)
Scraping structuré et multipage
- Utilisation des sélecteurs CSS et XPath
- Gestion de la pagination (URLs dynamiques, liens « suivant »)
- Scraping de données tabulaires
- Stockage dans SQLite
Sites dynamiques et robustesse
- Scraping de contenu dynamique avec `Selenium`
- Gestion des délais, exceptions, cookies et headers
- Navigation avec drivers headless, aléatoire, anti-bot
- Authentification simple simulée (formulaire, session)
Projet final, éthique & RGPD
- Projet fil rouge : extraction complète d’un site web
- Structuration et nettoyage des données (finalisation CSV/SQLite)
- Bonnes pratiques légales : robots.txt, CGU, RGPD
- Présentation et documentation du projet
Équipe pédagogique
Suivi de l'exécution et évaluation des résultats
- Exercices pratiques à chaque session
- Évaluation du projet final (fonctionnalité + conformité)
- Feuille de présence
- Questionnaire de satisfaction
Ressources techniques et pédagogiques
- Support de cours PDF
- Scripts d’exemples annotés (scraping de base, avancé, dynamique)
- Fiches mémo (requests, BeautifulSoup, Selenium)
- Modèle de projet complet commenté
Qualité et satisfaction
Capacité d'accueil
Délai d'accès
Accessibilité
Nous accordons une attention particulière à l'accueil des personnes en situation de handicap. Si vous êtes concerné(e) et souhaitez suivre cette formation, nous vous invitons à nous contacter dès que possible. Ensemble, nous étudierons vos besoins spécifiques et mettrons en place les adaptations nécessaires pour garantir votre accès à la formation dans les meilleures conditions.