Soutenance de thèse de Benjamin CHURCHEWARD
13 décembre 2022 @ 9 h 30 min
Benjamin Churcheward, équipe ComBi, soutiendra sa thèse intitulée :
« Models and methods for genome-resolved metagenomics »
Le 13 décembre 2022 à 9h30 dans l’amphithéâtre du bâtiment 34 sur le site de la Faculté des Sciences et Techniques (FST) de Nantes Université.
Jury :
Directeur de thèse: Guillaume FERTIN, Professeur, Nantes Université, Nantes, France
Encadrant de thèse: Samuel CHAFFRON, Chargé de recherche CNRS, LS2N, Nantes, France
Rapporteurs :
– Lucie BITTNER, Maîtresse de conférences, Sorbonne Université, Paris, France
– Éric PELLETIER, Directeur de recherche CEA, Genoscope, Évry, France
Examinateurs :
– Silvia G. ACINAS, Associate Professor, Institut del Ciencès del Mar, ICM-CSIC, Barcelone, Espagne
– Mathieu ALMEIDA, Chargé de recherche INRAE, MetaGenoPolis, Paris, France
– Dominique LAVENIER, Directeur de recherche CNRS, IRISA, Rennes, France
Résumé :
La reconstruction de génomes à partir de données métagénomiques, aussi appelés MAG) représente une étape majeure dans l’étude des communautés microbiennes. La reconstruction de MAGs souffre néanmoins de limitations, telles que la nature fragmentée de ces MAGs, les difficultés inhérentes à la reconstruction du pangénome, ou la capture des variations entre souches d’une même espèce.
Dans cette thèse, le problème du binning a été appréhendé à travers un modèle de clustering suivant le paradigme de la logique déclarative, l’objectif étant de maximiser l’information sur les génomes présents grâce à l’exploration de l’ensemble des solutions de binning possible. Ce modèle de binning incluant métrique compositionnelle, mesure d’abondance et occurrence de gènes marqueurs a été implémenté en langage ASP. Nous nous sommes ensuite concentrés sur l’optimisation du processus d’assemblage, étape préliminaire clé de la classification de contigs, avec pour objectif d’encore améliorer la reconstruction de MAGs. Nous avons développé une approche automatique pour guider le processus de co-assemblage, couplant des distances métagénomiques avec une méthode d’optimisation du clustering. Cette approche a été intégrée dans un nouveau workflow de reconstruction de MAGs, MAGNETO, qui intègre également des stratégies assemblage-binning complémentaires.
La soutenance sera suivie d’un pot dans le hall du bâtiment 34, auquel vous êtes tou.te.s convié.e.s.
Abstract :
The reconstruction of individual genomes from metagenomic data, also called MAGs, has constituted a major milestone in the study of microbial communities. However, the recovery of MAGs still suffers several limitations, including the mosaic and population nature of these MAGs, the inherent difficulties to assemble pangenomes, and the recovery of strain-level variations for a given species.
In this thesis, a declarative programming framework was designed and used to resolve the genome binning problem through a constrained clustering approach, with the goal to explore several optimal binning solutions, informing us about the organization dynamics of naturally occurring genomes. A novel genome binning model integrating compositional and abundance information as well as constraints on single-copy core genes was designed and implemented using the ASP language. With the goal to further enhance the recovery of MAGs, we focused on optimizing the assembly process, a key genome binning pre-processing step. We developed an automated approach to guide the co-assembly process, combining metagenomic compositional distances with an optimal clustering method. These developments were implemented into a novel genome-resolved metagenomics workflow called MAGNETO, integrating complementary assembly-binning strategies.
The defence will be followed with a drink in the hall of building 34. You are all kindly invited.