Big Data Analytics avec Python
Formation créée le 30/06/2021. Dernière mise à jour le 31/08/2023.
Version du programme : 3
Version du programme : 3
Type de formation
Formation mixteDurée de formation
28 heures (4 jours)Accessibilité
OuiFormation certifiante
OuiFinancement CPF
Formation finançable CPF
€
HT
S'inscrire
€
HT
S'inscrire
€
HT
S'inscrire
Besoin d’adapter cette formation à vos besoins ?
N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure !
Nous contacter
Big Data Analytics avec Python
Data Analytics est un terme pour exprimer les démarches d'analyse de données, afin d'être en mesure de prendre des décisions. Le langage Python dispose d'un écosystème permettant les traitements statistiques : de la construction de modèles d'analyse, à leur évaluation jusqu'à leur représentation.
Objectifs de la formation
- Comprendre le principe de la modélisation statistique
- Choisir entre la régression et la classification en fonction du type de données
- Évaluer les performances prédictives d'un algorithme
- Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances
Profil des bénéficiaires
Pour qui
- Responsables Infocentre (Datamining, Marketing, Qualité...), utilisateurs et gestionnaires métiers de bases de données.
Prérequis
- Connaissances de base en Python. Connaissances de base en statistiques.
Contenu de la formation
Introduction à la modélisation
- Introduction au langage Python.
- Introduction au logiciel Jupiter Notebook.
- Les étapes de construction d'un modèle.
- Les algorithmes supervisés et non supervisés.
- Le choix entre la régression et la classification.
Procédures d'évaluation de modèles
- Les techniques de ré-échantillonnage en jeu d'apprentissage, de validation et de test.
- Test de représentativité des données d'apprentissage.
- Mesures de performance des modèles prédictifs.
- Matrice de confusion, de coût et la courbe ROC et AUC.
Les algorithmes supervisés
- Le principe de régression linéaire univariée.
- La régression multivariée.
- La régression polynomiale.
- La régression régularisée.
- Le Naive Bayes.
- La régression logistique.
Les algorithmes non supervisés
- Le clustering hiérarchique.
- Le clustering non hiérarchique.
- Les approches mixtes.
Analyse en composantes
- Analyse en composantes principales.
- Analyse factorielle des correspondances.
- Analyse des correspondances multiples.
- Analyse factorielle pour données mixtes.
- Classification hiérarchique sur composantes principales.
Analyse de données textuelles
- Collecte et prétraitement des données textuelles.
- Extraction d'entités primaires, d'entités nommées et résolution référentielle.
- Étiquetage grammatical, analyse syntaxique, analyse sémantique.
- Lemmatisation.
- Représentation vectorielle des textes.
- Pondération TF-IDF.
- Word2Vec.
Équipe pédagogique
Nos formations dont animées par des experts reconnus dans leur domaine possédant une expérience sur le terrain significative et des compétences pédagogiques reconnues.
Suivi de l'exécution et évaluation des résultats
- Entretien permettant l’analyse des besoins des participants et/ou questionnaire de positionnement
- L’évaluation des compétences est réalisée : Par des exercices pratiques et/ou mises en situation, tout au long de la formation Par un exercice de synthèse et/ou un questionnaire d’auto-évaluation et/ou une certification, en fin de formation
- Questionnaire de satisfaction à chaud en fin de formation, et à froid à 3 mois
- Feuille de présence émargée par demi-journée par les stagiaires et le formateur
- Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
- Méthode participative
- Étude de cas / Mise en situation.
- Exposé et réflexion sur ses propres projets
- Exposés, aides visuelles, support de cours, exercices pratiques d’utilisation
- Questions/réponses entre les stagiaires et le formateur
Qualité et satisfaction
https://esic-online.com/qualite/
Modalités de certification
Résultats attendus à l'issue de la formation
- Attestation de réussite
Détails sur la certification
- Voir catalogue de la certification
Délai d'accès
2 semaines
Accessibilité
Les personnes atteintes de handicap souhaitant suivre cette formation sont invitées à nous contacter directement, afin d’étudier ensemble les possibilités de suivre la formation.