Aller au menu Aller au contenu
Une formation ambitieuse
Ecole de référence pour la formation d'ingénieurs en génie industriel
Une formation ambitieuse

> Formation

UE Analyse de données pour les métiers du génie industriel - 4GUL10A5

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In
  • Volumes horaires

    • CM : 18.0
    • TD : 18.0
    • TP : -
    • Projet : -
    • Stage : -
    • DS : -
    Crédits ECTS : 3.0
  • Responsables : Iragael JOLY

Objectifs

Comprendre les enjeux d'une analyse des données.
Synthétiser, structurer l’information contenue dans des données multidimensionnelles (n individus, p variables, t périodes).
Interpréter, comprendre et produire des résultats statistiques
Connaître quelques méthodes standards pour faire des analyses professionnelles. En particulier : les méthodes d'exploration (l'analyse de données non-paramétrique), les méthodes statistiques (tests et ajustement de modèle et de forme fonctionnelle en vue de prédiction).
Comprendre les limites de ces approches, et envisager des alternatives, extensions, etc.
Appliquer tout ceci à des données issues des métiers du GI (calcul de coût, de temps, test qualité, enquête satisfaction, tests de fiabilités, etc.)

Contenu

Le cours propose d’analyser les données de façon systématique selon la démarche suivante : Description, Segmentation, Modélisation, Prédiction, Validation.
Après un rappel de statistique descriptive on s’attachera à faire une analyse de données univariées, bivariées, multivariées. L’enjeu est de mobiliser les méthodes les plus adaptées selon le type de données (qualitatives / quantitatives) et les questions qui se posent. Pour citer quelques outils standards :

  • Méthode d’exploration des données : d'analyse de variance (ANOVA), Analyse de correspondances ou factorielle (ACP AFC), "Clusterisation", Data Envelopment Analysis, génération de règles, réseau de neurones
  • Méthode de la statistique décisionnelle : Tests statistiques paramétriques et non paramétriques (tests sur des espérances et proportions, tests d’indépendance entre variables quantitatives et qualitatives, etc)
  • Méthodes de modélisation par régression linéaire (variables continues) et régression logistique (variables discrètes).

Une attention sera portée à la question du traitement des données manquantes et aberrantes, à la détection des erreurs, au choix des variables et de leurs transformations, ainsi qu’à la validation et aux mesures de la qualité des modèles et de leurs prédictions.

Une partie du cours se fera en TP et/ou étude de cas.
Possibilité d'utiliser différents logiciels de statistiques, programmation linéaire, et fouille de données.

Prérequis

Statistique (statistique descriptive ; estimation par la méthode des moments et du maximum de vraisemblance; interval de confiance ; test d'espérance et de proportion)

Contrôles des connaissances

Contrôle continu sous forme de compte rendu et étude de cas à faire seul ou en groupe.

Le jury peut décider le passage en année supérieure sous réserve de validation différée de cette UE. Cette décision reste exceptionnelle ; le jury est souverain pour chaque étudiant.

Deux notes de TP: TP1 et TP2
Une note de soutenance : S1
Une note d'examen : E1

Note = 0.4*((TP1+TP2)/2) + 0.1*S1 + 0.5*E1

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Ingénieur IdP - Semestre 8
  • Cursus ingénieur - Master 1 GI - Semestre 8
  • Cursus ingénieur - Master 1 GI - Semestre 8
  • Cursus ingénieur - Ingénieur ICL - Semestre 8
cf. l'emploi du temps 2020/2021

Informations complémentaires

Code de l'enseignement : 4GUL10A5
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

J.H. McDonald, (2009), Handbook of Biological Statistics, Sparky House Publishing.
I.H. Witten et E. Frank, (2005), DataMining – Practical machine learning tools and technics, Elsevier.
Stéphane Tufféry, (2005), Datamining et statistique Décisionnelle – L’intelligence dans les bases de données, Ed. Technip.
Cornillon et al., (2008), Statistiques avec R, Presses Universitaires de Rennes.
Gaël Millot, (2011), Comprendre et réaliser les tests statistiques à l'aide de R, 2ème édition, Editions De Boeck, 767 pages
Hill, Griffiths and Lim, (2011), Principles of Econometrics, Fourth Edition

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In

mise à jour le 5 juin 2015

Université Grenoble Alpes