Aller au menu Aller au contenu
Une formation ambitieuse
Ecole de référence pour la formation d'ingénieurs en génie industriel
Une formation ambitieuse

> Formation > Cursus ingénieur

Manipulation de la donnée & Responsabilités du Data Engineer - 4GMC1411

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In

Objectifs

Les étudiants découvriront les méthodes de préparation de données pour le machine learning, l’ingénierie de la connaissance et le text mining, et apprendront à les intégrer dans les projets de data sciences.
Les étudiants sauront gérer leurs données, les trier, les organiser efficacement. Ils sauront présenter des visualisations pertinentes de leurs données et résultats. Ils auront acquis un comportement d’ingénieur de la donnée, responsable et éthique.

Contenu

B0 Introduction : Gestion de Projet de Data Sciences
Pilotage de projets sciences de données, en se basant sur CRISP-DM
B1 Manipulation de la donnée & Responsabilités du Data Engineer (éthique, sécurité, etc.)
B1.1 Gestion technique des données
Format de données, formats de variables ; opérations de base (lectures, écritures ; tris ; sélections, projections, filtres ; fusions)
B1.2 Gestion technique des résultats (visualisation)
Types de graphiques, principes d’une bonne visualisation
Faire techniquement et discuter les choix et les représentations
B1.3 Gestion sociétale
Aspects légaux (RGPD), durables (risques sur les personnes [client et personnel] comme coûts environnementaux), sécurité (qui détient les données, espionnage…).
B1.4 Mise en oeuvre : Micro-projet

Prérequis

Les étudiants auront suivi et validé les cours : Probabilités et Statistiques; programmation avec R, programmation avec Python

Contrôles des connaissances

Cette pondération est compatible avec une organisation des enseignements et des examens en distanciel

Notes de contrôle continu (au moins 2 notes de TP: TP1 et TP2)
Une note d'examen individuelle: E1

Note = 0.4*((TP1+TP2)/2) + 0.6*E1

Cette pondération est compatible avec une organisation des enseignements et des examens en distanciel

Notes de contrôle continu (au moins 2 notes de TP: TP1 et TP2)
Une note d'examen individuelle: E1

Note = 0.4*((TP1+TP2)/2) + 0.6*E1

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Ingénieur ICL - Semestre 7
  • Cursus ingénieur - Ingénieur IdP - Semestre 7
cf. l'emploi du temps 2021/2022

Informations complémentaires

Code de l'enseignement : 4GMC1411
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

Elff, (2020), Data Management in R , SAGE publication
Nicholas J. Horton and Ken Kleinman , (2016), Using R and RStudio for Data Management, Statistical Analysis, and Graphics (second edition)

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In

mise à jour le 14 juin 2021

Diplôme d'ingénieur contrôlé par l'Etat

Programmes pédagogiques

2021-2022 Cursus ingénieur
1ère année présentation
Semestre 5 - Semestre 6
Filière ICL présentation
Semestre 7 - Semestre 8
Semestre 9 - Semestre 10
Filière IdP présentation
Semestre 7 - Semestre 8
Semestre 9 - Semestre 10

2021-2022 Cursus ingénieur par apprentissage
Filière IPID présentation
Semestre 5 - Semestre 6
Semestre 7 - Semestre 8
Semestre 9 - Semestre 10

Contacts

Responsables pédagogiques
Directeur des études Thomas Reverdy
Responsable année 1 Pierre David
Responsable filière ICL Iragaël Joly
Responsable filière IdP Philippe Marin
Responsables apprentissage filière IPID
Nicolas Catusse
Olivier Boissin


Service scolarité
Responsable Laure Jouffray
Gestionnaire 1ère année
Valérie Demicheli
Gestionnaire 2ème année
Sylvie Malandrino
Gestionnaire Apprentissage 2ème année
Valérie Demicheli 
Gestionnaire 3ème année
Hélène Lemaire
Relations Entreprises / Apprentissage
Christine Ancey


Echanges internationaux
Nadia Dehemchi
Université Grenoble Alpes