Volumes horaires
- CM 9.0
- Projet -
- TD 6.0
- Stage -
- TP -
- DS 1.0
Crédits ECTS
Crédits ECTS 1.5
Objectif(s)
Découvrir les méthodes de gestion et préparation de données dans le cadre de projets de data sciences.
Savoir gérer leurs données, les charger, les trier, les organiser efficacement. Savoir présenter des visualisations pertinentes des données et résultats. Comprendre les enjeux d'une ingénierie de la donnée responsable et éthique.
Contenu(s)
B0 Introduction : Gestion de Projet de Data Sciences
Pilotage de projets sciences de données, en se basant sur CRISP-DM
B1 Manipulation de la donnée & Responsabilités du Data Engineer (éthique, sécurité, etc.)
B1.1 Gestion technique des données
Format de données, formats de variables ; opérations de base (lectures, écritures ; tris ; sélections, projections, filtres ; fusions)
B1.2 Gestion technique des résultats (visualisation)
Types de graphiques, principes d’une bonne visualisation
Faire techniquement et discuter les choix et les représentations
B1.3 Gestion sociétale
Aspects légaux (RGPD), durables (risques sur les personnes [client et personnel] comme coûts environnementaux), sécurité (qui détient les données, espionnage…).
B1.4 Mise en oeuvre : Micro-projet
Les étudiants auront suivi et validé les cours : Probabilités et Statistiques; base de la programmation en R (ou bases de la programmation avec un autre langage, par exemple python)
Note de contrôle continu (TP/Mini-projet) : TP
Une note d'examen individuelle : EX
Note = 0.4*TP + 0.6*EX
Cette pondération est compatible avec une organisation des enseignements et des examens en distanciel
L'examen existe uniquement en anglais
Le cours est programmé dans ces filières :
- Cursus ingénieur - Ingénieur ICL - Semestre 7
- Cursus ingénieur - Ingénieur IdP - Semestre 7
Code de l'enseignement : 4GMC1411
Langue(s) d'enseignement :
Vous pouvez retrouver ce cours dans la liste de tous les cours.
Elff, (2020), Data Management in R , SAGE publication
Nicholas J. Horton and Ken Kleinman , (2016), Using R and RStudio for Data Management, Statistical Analysis, and Graphics (second edition)
Programme pédagogique 2025-2026
Parcours ingénieur statut étudiant
- Tronc commun 1ère année
Présentation
Semestre 5 | Semestre 6
- Filière ICL
Présentation
Semestre 7 | Semestre 8 | Semestre 9 | Semestre 10
- Filière IDP
Présentation
Semestre 7 | Semestre 8 | Semestre 9 | Semestre 10
Parcours ingénieur statut apprenti
- Filière IPID
Présentation
Semestre 5 | Semestre 6 | Semestre 7 | Semestre 8 | Semestre 9 | Semestre 10
Contacts
Equipe académique
- Directeur des études
Pierre Lemaire - Responsable 1ère année
Abdourahim Sylla - Responsable filière ICL
Irène Gannaz - Responsable filière IDP
Guillaume Thomann - Responsables filière IPID
Olivier Boissin
Nicolas Catusse
Equipe administrative
- Responsable scolarité
Laure Jouffray - Gestionnaire 1ère année
Valérie Demicheli - Gestionnaire 2ème année
Sylvie Malandrino - Gestionnaire 3ème année et parcours spéciaux
Vincente Odier - Gestionnaire Apprentis
Carina Cataldi