TALN - Traitement Automatique du Langage Naturel
Thématiques de l'équipe
Les travaux de l'équipe s'organisent autour de trois thématiques :
Analyse sémantique et discursive
Nous nous intéressons aux problématiques de modélisation et d’analyse d’informations discursives sur plusieurs plans d’organisation : thématique, intentionnel, attentionnel, subjectif (opinion, sentiment, émotion).
Apprentissage & fouille de textes
Nous utilisons l'apprentissage automatique dans de nombreuses applications : recherche d’interactions entre organismes biologiques, à partir d’articles scientifiques, détection d’éléments implicites dans les textes littéraires, ou construction de modèles permettant l’alignement de lexiques bilingues.
Alignement multilingue et multimodal
Nous nous intéressons aux méthodes de rapprochement de diverses sources de données pour pouvoir bénéficier d’informations complémentaires.
Quatre principaux domaines applicatifs sont visés par les travaux de l'équipe : le multilinguisme avec l'extraction de lexiques bilingues, l'indexation documentaire avec la génération de mots-clés, l'ingénierie des ressources éducatives avec la structuration automatique intra- et inter-ressources et leur caractérisation (e.g. indice de difficulté, degré d'engagement d'un apprenant), et le médical et la santé avec le résumé automatique de dossiers patients.