Génie industriel - Rubrique Formation - 2022

UE Analyse de données pour les métiers du génie industriel - 4GUL10A5

  • Volumes horaires

    • CM 15.0
    • Projet -
    • TD 15.0
    • Stage -
    • TP -
    • DS 2.0

    Crédits ECTS

    Crédits ECTS 3.0

Objectif(s)

Comprendre les enjeux d'une analyse des données
Être capable de structurer l’information en vue d'une analyse adaptée
Être capable de choisir une méthodologie d'analyse adaptée au cas d'étude
Être capable de mettre en oeuvre une analyse professionnelle sur des jeux de données concrets
Être capable d'interpréter, comprendre et produire des résultats statistiques
Comprendre les limites de ces approches, et envisager des alternatives, extensions, etc.

Responsable(s)

Pierre LEMAIRE, Irene GANNAZ

Contenu(s)

Le cours s'articule autours d'études de cas à traiter selon une démarche scientifique rigoureuse et permettant de découvrir différentes facettes de l'analyse de données dans un contexte de génie industriel.

Le cours aborde différentes formes de l'analyse de données :

  • Exploration de données (par exemple : analyse de la variance, analyse en composantes principales...)
  • Segmentation de données (par exemple : clusterisation, règles de décision...)
  • Apprentissage supervisé (par exemple : régression, classification, analyse de survie...)

    Se faisant, nous développerons différents aspects indispensables à une bonne analyse :
  • La structuration et la manipulation de l’information contenue dans des données multidimensionnelles en vue d'une analyse adaptée, y compris la gestion des erreurs et autres données manquantes.
  • La validation des résultats obtenus : méthode de validation, indicateurs utilisés, interprétation des résultats
  • La compréhension des limites de ces approches et leurs alternatives


    L'essentiel de ce cours se fera à travers des TP et autres études de cas en utilisant le logiciel R/Rstudio.

Prérequis

  • Statistique (statistique descriptive ; estimation par la méthode des moments et du maximum de vraisemblance; intervalle de confiance ; test d'espérance et de proportion)
  • Manipulation de la donnée
  • Connaissance basique du langage R

Contrôle des connaissances

CC : contrôle continu (études de cas en groupe ou individuelles)
EX : examen final individuel
UE : note final

Le jury peut décider le passage en année supérieure sous réserve de validation différée de cette UE. Cette décision reste exceptionnelle ; le jury est souverain pour chaque étudiant.

UE = 0.5*CC + 0.5*EX

Cette pondération est compatible avec une organisation des enseignements et des examens en distanciel

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Ingénieur ICL - Semestre 8
  • Cursus ingénieur - Ingénieur IdP - Semestre 8
cf. l'emploi du temps 2023/2024

Informations complémentaires

Code de l'enseignement : 4GUL10A5
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

I.H. Witten et E. Frank, (2005), DataMining – Practical machine learning tools and technics, Elsevier.
Stéphane Tufféry, (2005), Datamining et statistique Décisionnelle – L’intelligence dans les bases de données, Ed. Technip.
Cornillon et al., (2008), Statistiques avec R, Presses Universitaires de Rennes.
Gaël Millot, (2011), Comprendre et réaliser les tests statistiques à l'aide de R, 2ème édition, Editions De Boeck, 767 pages
J.H. McDonald, (2009), Handbook of Biological Statistics, Sparky House Publishing.