Volumes horaires
- CM 15.0
- Projet -
- TD 15.0
- Stage -
- TP -
- DS 2.0
Crédits ECTS
Crédits ECTS 3.0
Objectif(s)
Comprendre les enjeux d'une analyse des données
Être capable de structurer l’information en vue d'une analyse adaptée
Être capable de choisir une méthodologie d'analyse adaptée au cas d'étude
Être capable de mettre en oeuvre une analyse professionnelle sur des jeux de données concrets
Être capable d'interpréter, comprendre et produire des résultats statistiques
Comprendre les limites de ces approches, et envisager des alternatives, extensions, etc.
Contenu(s)
Le cours s'articule autours d'études de cas à traiter selon une démarche scientifique rigoureuse et permettant de découvrir différentes facettes de l'analyse de données dans un contexte de génie industriel.
Le cours aborde différentes formes de l'analyse de données :
- Exploration de données (par exemple : analyse de la variance, analyse en composantes principales...)
- Segmentation de données (par exemple : clusterisation, règles de décision...)
- Apprentissage supervisé (par exemple : régression, classification, analyse de survie...)
Se faisant, nous développerons différents aspects indispensables à une bonne analyse : - La structuration et la manipulation de l’information contenue dans des données multidimensionnelles en vue d'une analyse adaptée, y compris la gestion des erreurs et autres données manquantes.
- La validation des résultats obtenus : méthode de validation, indicateurs utilisés, interprétation des résultats
- La compréhension des limites de ces approches et leurs alternatives
L'essentiel de ce cours se fera à travers des TP et autres études de cas en utilisant le logiciel R/Rstudio.
- Statistique (statistique descriptive ; estimation par la méthode des moments et du maximum de vraisemblance; intervalle de confiance ; test d'espérance et de proportion)
- Manipulation de la donnée
- Connaissance basique du langage R
CC : contrôle continu (études de cas en groupe avec notes individualisées)
EX : examen final individuel
UE : note finale
Le jury peut décider le passage en année supérieure sous réserve de validation différée de cette UE. Cette décision reste exceptionnelle ; le jury est souverain pour chaque étudiant.
UE = 0.5*CC + 0.5*EX
Cette pondération est compatible avec une organisation des enseignements et des examens en distanciel
Le cours est programmé dans ces filières :
- Cursus ingénieur - Ingénieur ICL - Semestre 8
- Cursus ingénieur - Ingénieur IdP - Semestre 8
Code de l'enseignement : 4GUL10A5
Langue(s) d'enseignement :
Vous pouvez retrouver ce cours dans la liste de tous les cours.
I.H. Witten et E. Frank, (2005), DataMining – Practical machine learning tools and technics, Elsevier.
Stéphane Tufféry, (2005), Datamining et statistique Décisionnelle – L’intelligence dans les bases de données, Ed. Technip.
Cornillon et al., (2008), Statistiques avec R, Presses Universitaires de Rennes.
Gaël Millot, (2011), Comprendre et réaliser les tests statistiques à l'aide de R, 2ème édition, Editions De Boeck, 767 pages
J.H. McDonald, (2009), Handbook of Biological Statistics, Sparky House Publishing.
Programme pédagogique 2024-2025
Tronc commun 1ère année
Présentation
Semestre 5 | Semestre 6
Filière ICL
Présentation
Semestre 7 | Semestre 8 | Semestre 9 | Semestre 10
Filière IDP
Présentation
Semestre 7 | Semestre 8 | Semestre 9 | Semestre 10
Parcours ingénieur statut apprenti
Filière IPID
Présentation
Semestre 5 | Semestre 6 | Semestre 7 | Semestre 8 | Semestre 9 | Semestre 10
Contacts
- Directeur des études
Pierre Lemaire - Responsable 1ère année
Abdourahim Sylla - Responsable filière ICL
Irène Gannaz - Responsable filière IDP
Guillaume Thomann - Responsables filière IPID
Olivier Boissin
Nicolas Catusse
Equipe administrative
- Responsable scolarité
Laure Jouffray - Gestionnaire 1ère année
Valérie Demicheli - Gestionnaire 2ème année
Sylvie Malandrino - Gestionnaire 3ème année et parcours spéciaux
Léa Decombe - Gestionnaire Apprentis
Carina Cataldi