Soutenance HDR de Florian Boudin
20 juin 2023 @ 9 h 30 min - 12 h 00 min
Florian Boudin, de l’équipe TALN, présentera sa soutenance HDR intitulée :
« Analyse et indexation de textes scientifiques »
Le 20.06.23 à 09h30 dans l’amphithéâtre du bâtiment 34 de l’UFR S&T
Composition du jury :
Rapporteurs : Antoine DOUCET PU, La Rochelle Université
Aurélie NÉVÉOLDR CNRS, LISN Paris-Saclay
Jacques SAVOY PU, Université de Neuchâtel
Jacques SAVOY PU, Université de Neuchâtel
Examinateurs : Béatrice DAILLEPU, Nantes Université
Richard DUFOURPU, Nantes Université
Résumé : Les travaux présentés dans cette habilitation à diriger des recherches (HDR) ont pour objet l’analyse et l’indexation des textes scientifiques, et se situent à la croisée de deux thématiques de recherche : celle du Traitement Automatique des Langues (TAL) qui concerne l’analyse, la compréhension et la production de langage naturel, et celle de la Recherche d’Information (RI) qui étudie la manière de retrouver des informations dans une collection de documents. Nous nous intéressons à la problématique de la recherche bibliographique, c’est-à-dire la recherche de documents dans la littérature scientifique (e.g. articles, ouvrages, thèses) en rapport avec un sujet d’étude, et plus particulièrement à l’enrichissement des métadonnées associées aux documents pour en améliorer l’accessibilité et la diffusion.
Nos travaux concernent le développement de méthodes automatisées de génération de mots-clés dont la singularité réside dans l’utilisation de méthodes de graphes et d’algorithmes d’ordonnancement de sommets. Nous nous penchons sur la problématique de l’évaluation indirecte des mots-clés générés au travers de tâches applicatives et de leur exploitation dans les moteurs de recherche et de recommandation académique. Nous présentons les travaux que nous avons menés dans la construction de ressources langagières, le développement d’outils logiciels et leur valorisation dans la communauté scientifique. Nous terminons par quelques réflexions prospectives sur l’indexation par mots-clés et plus généralement sur les travaux de recherche émergeant de l’intersection des thématiques du TAL et de la RI.