Proposition de stage - 2025
Approche d’agrégation de graphe basée sur les GNN et les connaissances à priori pour la construction de cartographies d'expertises à partir de données textuelles
Niveau : Stage de Master 2 ou Projet de Fin d'Études de 5ᵉ année
Période : de février à juillet 2025
Laboratoire de recherche : DUKe, LS2N (www.ls2n.fr), Nantes
Encadrants : Mounira Harzallah, Fabrice Guillet, Othmane Kabal
Durée du stage : entre 5 et 6 mois
Rémunération : environ 600 € par mois
Mots clés : Deep Learning, GNN (Graph Neural Network), Graphe de connaissances, Visualisation de graphe, Cartographie d’expertises, Pôle Universitaire de l’Innovation
Contexte du stage
Le Pôle Universitaire de l’Innovation (PUI) de Nantes Université est un projet de 4 ans, lauréat de l’Appel à Projets national, réunissant les acteurs majeurs de l’innovation en Loire-Atlantique/Vendée. Il est structuré autour de cinq filières: Santé du Futur, Entreprise du Futur, Sciences Humaines et Sociales, Énergie, Mer et Environnement, et Numérique. L’objectif principal est de créer un écosystème d’innovation solide autour des Domaines Stratégiques d’Innovation (DSI). Une première action du PUI consiste à établir une cartographie des expertises des membres fondateurs et partenaires. Celle-ci permettra d’analyser les complémentarités de leurs expertises, d’identifier les expertises communes, rares ou spécifiques, et de favoriser les collaborations internes et avec les entreprises.
L’équipe DUKe du LS2N a conçu l’outil GT2KG, utilisant le deep learning et des modèles de langage pour générer des graphes de connaissances à partir de textes. Bien que l’outil ait montré des résultats prometteurs dans le domaine de l’informatique, les graphes produits demeurent difficiles à exploiter dans une perspective de cartographie des expertises, en raison de la présence de nœuds non pertinents et de la taille importante des graphes, rendant leur visualisation complexe et limitant l’identification de nœuds ou clusters clés, et des interactions fortes entre eux.
Objectif du stage
Ce stage de master (ou projet de fin d’études) a pour objectif de proposer une méthode d’épuration et d’agrégation de graphes pour révéler des regroupements saillants ainsi que les relations qui les relient, offrant ainsi des perspectives variées sur les expertises : vues agrégées et détaillées. Pour cela, une approche d’agrégation hiérarchique basée sur les GNN et des connaissances a priori sera explorée. Le graphe initial sera automatiquement construit par GT2KG à partir de résumés et de mots-clés d’articles scientifiques.
L’approche développée sera appliquée à la construction, visualisation et exploitation d’une cartographie des expertises des équipes de recherche, en lien avec la filière « Industrie du Futur ». L’outil associé devra permettre l’agrégation et la présentation des expertises sous plusieurs perspectives (théoriques, domaines d’application, DSI) tout en maintenant les liens avec les chercheurs et équipes. Il devra également identifier les complémentarités entre expertises et repérer de nouveaux Domaines Stratégiques d’Innovation (DSI).
Prérequis : Machine Learning (clustering et classification), Deep Learning, des connaissances en techniques de visualisation de graphes sont souhaitées, Python et Git.
Pour candidater : Envoyez votre CV, une lettre de motivation et les bulletins des trois dernières années à mounira.harzallah@univ-nantes.fr
Référence
Kabal O., M. Harzallah, F. Guillet, R. Ichise. Enhancing Domain-Independent Knowledge Graph Construction through OpenIE Cleaning and LLMs Validation. In Proceedings of the 28th International Conference KES2024, 2024.
Wu, C., Wang, C., Xu, J., Liu, Z., Zheng, K., Wang, X., … & Gai, K. (2023, August). Graph contrastive learning with generative adversarial network. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (pp. 2721-2730).
Wu, Z., Pan, S., Chen, F., Long, G., Zhang, C., & Philip, S. Y. (2020). « A Comprehensive Survey on Graph Neural Networks. » IEEE Transactions on Neural Networks and Learning Systems.
Zhang, M., Cui, Z., Neumann, M., & Chen, Y. (2019). « Hierarchical Graph Pooling with Structure Learning. » arXiv preprint arXiv:1911.05954.
Schlichtkrull, M., Kipf, T. N., Bloem, P., Van Den Berg, R., Titov, I., & Welling, M. (2018). Modeling relational data with graph convolutional networks. In The semantic web: 15th international conference, ESWC 2018, Heraklion, Crete, Greece, June 3–7, 2018, proceedings 15 (pp. 593-607). Springer International Publishing.
https://www.10h11.com/article/outils-open-source-visualisation-donnees
Cartographies d’expertise : https://expertises-fgse.unil.ch/vivo/vis/capabilitymap
Cartographie d’expertise avec ARDANS https://www.ardans.fr/management-connaissances/cartographie-des-expertises.html