Aller au menu Aller au contenu
Une formation ambitieuse
Ecole de référence pour la formation d'ingénieurs en génie industriel
Une formation ambitieuse

> Formation > Cursus ingénieur

Traitement automatique du langage naturel et text-mining - 4GMC14C1

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In
  • Volumes horaires

    • CM : 7.5
    • TD : -
    • TP : 7.5
    • Projet : -
    • Stage : -
    • DS : 1.0
    Crédits ECTS : 1.5

Objectifs

Le cours présente les premiers outils de traitement de données textuelles.
Les étudiants sauront manipuler les données textuelles dans le but de les préparer à l'analyse.
Les méthodes d'analyse qui seront apprises permettent de faire des rapprochements entre chaines de caractères et vocabulaire; d'explorer des textes et d'identifier leurs caractéristiques (information mutuelle, information similaire ou complémentaire); de classifier les textes et d’identifier des typologies.

Contenu

.1 Introduction au NLP (Natural Language Processing) et TM (Text-Mining) (1CM, 1TP)
.2 Pré-traitement (1CM, 1TP)
Parsing, tokenization, case folding, lemmatisation, stemming, POS-tagging, sentence splitting, stop words removal…
.3 Intégration de mots (1CM, 1TP)
Vector Space Model, Bag-of-words model, TF, TF-IDF, Word2vec, GLOVE…
.3 Sélection des caractéristiques (1CM, 1TP)
X², mutual information, information gain…
.4 Classification de texte (1CM, 1TP)
One VS. Multi class, Bias VS. Variance, Kappa test, training set, validation set, testing set, accuracy, validation set, leave-one-out cross-validation, K-fold cross validation, precision, recall, F-Measure, confusion matrix…

Prérequis

Les étudiants auront suivi et validé les cours : Probabilités et Statistiques; programmation avec R, programmation avec Python

Contrôles des connaissances

Cette pondération est compatible avec une organisation des enseignements et des examens en distanciel

Notes de contrôle continu (au moins 2 notes de TP: TP1 et TP2)
Une note d'examen individuelle: E1

Note = 0.4*((TP1+TP2)/2) + 0.6*E1

Cette pondération est compatible avec une organisation des enseignements et des examens en distanciel

Notes de contrôle continu (au moins 2 notes de TP: TP1 et TP2)
Une note d'examen individuelle: E1

Note = 0.4*((TP1+TP2)/2) + 0.6*E1

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Ingénieur ICL - Semestre 7
  • Cursus ingénieur - Ingénieur IdP - Semestre 7
cf. l'emploi du temps 2021/2022

Informations complémentaires

Code de l'enseignement : 4GMC14C1
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

Silge and Robinson (2017), Text Mining with R, O'Reilly
Stéphane Tufféry, (2005), Datamining et statistique Décisionnelle – L’intelligence dans les bases de données, Ed. Technip.
Cornillon et al., (2008), Statistiques avec R, Presses Universitaires de Rennes.
Gaël Millot, (2011), Comprendre et réaliser les tests statistiques à l'aide de R, 2ème édition, Editions De Boeck, 767 pages

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In

mise à jour le 14 juin 2021

Diplôme d'ingénieur contrôlé par l'Etat

Programmes pédagogiques

2021-2022 Cursus ingénieur
1ère année présentation
Semestre 5 - Semestre 6
Filière ICL présentation
Semestre 7 - Semestre 8
Semestre 9 - Semestre 10
Filière IdP présentation
Semestre 7 - Semestre 8
Semestre 9 - Semestre 10

2021-2022 Cursus ingénieur par apprentissage
Filière IPID présentation
Semestre 5 - Semestre 6
Semestre 7 - Semestre 8
Semestre 9 - Semestre 10

Contacts

Responsables pédagogiques
Directeur des études Thomas Reverdy
Responsable année 1 Pierre David
Responsable filière ICL Iragaël Joly
Responsable filière IdP Philippe Marin
Responsables apprentissage filière IPID
Nicolas Catusse
Olivier Boissin


Service scolarité
Responsable Laure Jouffray
Gestionnaire 1ère année
Valérie Demicheli
Gestionnaire 2ème année
Sylvie Malandrino
Gestionnaire Apprentissage 2ème année
Valérie Demicheli 
Gestionnaire 3ème année
Hélène Lemaire
Relations Entreprises / Apprentissage
Christine Ancey


Echanges internationaux
Nadia Dehemchi
Université Grenoble Alpes