Aller au menu Aller au contenu
Une formation ambitieuse
Ecole de référence pour la formation d'ingénieurs en génie industriel
Une formation ambitieuse

> Formation > Cursus ingénieur

UE Analyse de données pour les métiers du génie industriel - 4GUL10A5

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail Partagez cet article Facebook Twitter Linked In Google+ Viadeo
  • Volumes horaires

    • CM : 18.0
    • TD : 18.0
    • TP : -
    • Projet : -
    • Stage : -
    • DS : -
    Crédits ECTS : 3.0
  • Responsables : Iragael JOLY

Objectifs

Comprendre les enjeux d'une analyse des données.
Synthétiser, structurer l’information contenue dans des données multidimensionnelles (n individus, p variables, t périodes).
Interpréter, comprendre et produire des résultats statistiques
Connaître quelques méthodes standards pour faire des analyses professionnelles. En particulier : les méthodes d'exploration (l'analyse de données non-paramétrique), les méthodes statistiques (tests et ajustement de modèle et de forme fonctionnelle en vue de prédiction).
Comprendre les limites de ces approches, et envisager des alternatives, extensions, etc.
Appliquer tout ceci à des données issues des métiers du GI (calcul de coût, de temps, test qualité, enquête satisfaction, tests de fiabilités, etc.)

Contenu

Le cours propose d’analyser les données de façon systématique selon la démarche suivante : Description, Segmentation, Modélisation, Prédiction, Validation.
Après un rappel de statistique descriptive on s’attachera à faire une analyse de données univariées, bivariées, multivariées. L’enjeu est de mobiliser les méthodes les plus adaptées selon le type de données (qualitatives / quantitatives) et les questions qui se posent. Pour citer quelques outils standards :

  • Méthode d’exploration des données : d'analyse de variance (ANOVA), Analyse de correspondances ou factorielle (ACP AFC), "Clusterisation", Data Envelopment Analysis, génération de règles, réseau de neurones
  • Méthode de la statistique décisionnelle : Tests statistiques paramétriques et non paramétriques (tests sur des espérances et proportions, tests d’indépendance entre variables quantitatives et qualitatives, etc)
  • Méthodes de modélisation par régression linéaire (variables continues) et régression logistique (variables discrètes).

Une attention sera portée à la question du traitement des données manquantes et aberrantes, à la détection des erreurs, au choix des variables et de leurs transformations, ainsi qu’à la validation et aux mesures de la qualité des modèles et de leurs prédictions.

Une partie du cours se fera en TP et/ou étude de cas.
Possibilité d'utiliser différents logiciels de statistiques, programmation linéaire, et fouille de données.

Prérequis

Statistique (statistique descriptive ; estimation par la méthode des moments et du maximum de vraisemblance; interval de confiance ; test d'espérance et de proportion)

Contrôles des connaissances

Contrôle continu sous forme de compte rendu et étude de cas à faire seul ou en groupe.

Le jury peut décider le passage en année supérieure sous réserve de validation différée de cette UE. Cette décision reste exceptionnelle ; le jury est souverain pour chaque étudiant.

Deux notes de TP: TP1 et TP2
Une note de soutenance : S1
Une note d'examen : E1

Note = 0.4*((TP1+TP2)/2) + 0.1*S1 + 0.5*E1

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Ingénieur ICL - Semestre 8
  • Cursus ingénieur - Master 1 GI - Semestre 8
  • Cursus ingénieur - Master 1 GI - Semestre 8
  • Cursus ingénieur - Ingénieur IdP - Semestre 8
cf. l'emploi du temps 2019/2020

Informations complémentaires

Code de l'enseignement : 4GUL10A5
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

J.H. McDonald, (2009), Handbook of Biological Statistics, Sparky House Publishing.
I.H. Witten et E. Frank, (2005), DataMining – Practical machine learning tools and technics, Elsevier.
Stéphane Tufféry, (2005), Datamining et statistique Décisionnelle – L’intelligence dans les bases de données, Ed. Technip.
Cornillon et al., (2008), Statistiques avec R, Presses Universitaires de Rennes.
Gaël Millot, (2011), Comprendre et réaliser les tests statistiques à l'aide de R, 2ème édition, Editions De Boeck, 767 pages
Hill, Griffiths and Lim, (2011), Principles of Econometrics, Fourth Edition

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail Partagez cet article Facebook Twitter Linked In Google+ Viadeo

mise à jour le 5 juin 2015

Programmes pédagogiques

2019-2020 Cursus ingénieur
1ère année présentation
Semestre 5 - Semestre 6
Filière ICL présentation
Semestre 7 - Semestre 8
Semestre 9 - Semestre 10
Filière IdP présentation
Semestre 7 - Semestre 8
Semestre 9 - Semestre 10

2019-2020 Cursus ingénieur par apprentissage
Filière IPID présentation
Semestre 5 - Semestre 6
Semestre 7 - Semestre 8
Semestre 9 - Semestre 10

Contacts

Responsables pédagogiques
Directeur des études Yannick Frein
Responsable année 1 Pierre David
Responsable filière ICL
Hadrien Cambazard
Responsable filière IdP Guillaume Thomann
Responsables apprentissage filière IPID
Nicolas Catusse
Olivier Boissin


Service scolarité
Responsable Laure Jouffray
Gestionnaire 1ère année
Valérie Demicheli
Gestionnaire 2ème année
Myriam Reinbold
Gestionnaire 3ème année
Hélène Lemaire
Relations entreprises / apprentissage
Christine Ancey
Gestionnaire apprentissage 2ème année
Sylvie Malandrino

Echanges internationaux
Nadia Dehemchi
Grenoble INP Institut d'ingénierie Univ. Grenoble Alpes