Volumes horaires
- CM 9.0
- Projet -
- TD 6.0
- Stage -
- TP -
- DS 1.5
Crédits ECTS
Crédits ECTS 1.5
Objectif(s)
Le cours présente les premiers outils de traitement des données quantitatives et qualitatives par apprentissage automatique.
Les méthodes d'analyse qui seront apprises permettent la classification automatique ; la construction de modèles prédictifs ; l'évaluation des performances des méthodes ; le diagnostic des limites des applications de ces méthodes.
Contenu(s)
.1 Enjeux de l'apprentissage automatique, apprentissage automatique supervisé (régression, classification)
méthodes supervisées vs méthodes non supervisées (présentation rapide de quelques méthodes non supervisées (k-means, dendrogrammes)).
.2 Méthode de régression et méthode de classification : Régression linéaire et régression logistique ; modèles, algorithmes et résolutions
.3 Évaluation interne de la régression et de la classification: Erreurs, résidus et évaluation des prédictions
.4 Évaluation externe : Hypothèses statistiques et évaluation des modèles
.5 Mise en oeuvre sur différentes bases de données
Les étudiants auront suivi et validé les cours suivants : Probabilité et statistiques ; Programmation avec R, Programmation avec Python.
Cette pondération est compatible avec une organisation des enseignements et des examens en distanciel
Note de contrôle continu : TP (basée sur au moins 2 notes TP1 et TP2)
Note d'examen individuelle : EX
Note = 0.4*TP + 0.6*EX
Cette pondération est compatible avec une organisation des enseignements et des examens en distanciel
Note de contrôle continu : TP (basée sur au moins 2 notes TP1 et TP2)
Note d'examen individuelle : EX
Note = 0.4*TP + 0.6*EX
Le cours est programmé dans ces filières :
- Cursus ingénieur - Ingénieur ICL - Semestre 7
- Cursus ingénieur - Ingénieur IdP - Semestre 7
Code de l'enseignement : 4GMC14B1
Langue(s) d'enseignement :
Vous pouvez retrouver ce cours dans la liste de tous les cours.
J.H. McDonald, (2009), Handbook of Biological Statistics, Sparky House Publishing.
I.H. Witten et E. Frank, (2005), DataMining – Practical machine learning tools and technics, Elsevier.
Stéphane Tufféry, (2005), Datamining et statistique Décisionnelle – L’intelligence dans les bases de données, Ed. Technip.
Cornillon et al., (2008), Statistiques avec R, Presses Universitaires de Rennes.
Gaël Millot, (2011), Comprendre et réaliser les tests statistiques à l'aide de R, 2ème édition, Editions De Boeck, 767 pages
Hill, Griffiths and Lim, (2011), Principles of Econometrics, Fourth Edition
Programme pédagogique 2024-2025
Tronc commun 1ère année
Présentation
Semestre 5 | Semestre 6
Filière ICL
Présentation
Semestre 7 | Semestre 8 | Semestre 9 | Semestre 10
Filière IDP
Présentation
Semestre 7 | Semestre 8 | Semestre 9 | Semestre 10
Parcours ingénieur statut apprenti
Filière IPID
Présentation
Semestre 5 | Semestre 6 | Semestre 7 | Semestre 8 | Semestre 9 | Semestre 10
Contacts
- Directeur des études
Pierre Lemaire - Responsable 1ère année
Abdourahim Sylla - Responsable filière ICL
Irène Gannaz - Responsable filière IDP
Yann Ledoux - Responsables filière IPID
Olivier Boissin
Nicolas Catusse
Equipe administrative
- Responsable scolarité
Laure Jouffray - Gestionnaire 1ère année
Valérie Demicheli - Gestionnaire 2ème année
Sylvie Malandrino - Gestionnaire 3ème année et parcours spéciaux
Léa Decombe - Gestionnaire Apprentis
Carina Cataldi