Recherche de séquences environnementales inconnues d’intérêt médical/biologique par l’utilisation de grands réseaux de similarité de séquences - Université des Antilles Access content directly
Theses Year : 2019

Search for unknown environmental sequences of medical/biological interest using large sequence similarity networks

Recherche de séquences environnementales inconnues d’intérêt médical/biologique par l’utilisation de grands réseaux de similarité de séquences

Abstract

The objective of this thesis was to identify as yet unknown microorganisms present in various environments and to characterize some of their metabolisms. This unidentified diversity, both taxonomic and functional, is commonly referred to as microbial dark matter. I have used and developed new network methods, including sequence similarity networks, to exploit very large sequence datasets from metagenomic projects. In particular, my work has highlighted the ecological role of ultra-small micro-organisms in some autotrophic metabolic pathways in the oceans. It also shows that CPR and DPANN, recently discovered ultra-small bacteria and archaea, participate in the dynamics of microbial communities through quorum sensing systems similar to those of better characterized organisms. An application of sequence similarity networks to meta-barcoding data also revealed a previously unknown diversity of Holozoans, which could allow us to better understand the transition to multicellularity of Metazoans. Finally, I have developed a method and software for searching for remote homologs of proteins of interest in very large datasets, such as those from metagenomics. This method, now validated, should make it possible to search for sequences belonging to still unknown and very divergent organisms, in the hope of discovering new deep branching phyla, or even new domains of life.
L’objectif de cette thèse a été d’identifier des micro-organismes encore inconnus présents dans divers environnements et de caractériser certains de leurs métabolismes. Cette diversité non identifiée, à la fois taxonomique et fonctionnelle, est communément appelée matière noire microbienne. J’ai utilisé et développé de nouvelles méthodes de réseaux, et notamment des réseaux de similarité de séquences, afin d’exploiter de très grands jeux de données de séquences, issus de projets de métagénomique. En particulier, mon travail a mis en évidence le rôle écologique de micro-organismes ultra-petits dans certaines voies métaboliques autotrophes des océans. Il montre également que les CPR et DPANN, bactéries et archées ultra-petites récemment découvertes, participent à la dynamique des communautés microbiennes via des systèmes de quorum sensing homologues à ceux d’organismes mieux caractérisés. Une application des réseaux de similarité de séquences à des données de métabarcoding a également révélé une diversité jusque là inconnue d’Holozoa, qui pourrait nous permettre de mieux comprendre la transition vers la multicellularité des Metazoa. Enfin, j’ai développé une méthode et un logiciel destiné à la recherche d’homologues distants de protéines d’intérêt dans de très grands jeux de données, tels que ceux issus de la métagénomique. Cette méthode, maintenant validée, devrait permettre de rechercher des séquences appartenant à des organismes encore inconnus et très divergents, dans l’espoir de découvrir de nouveaux phylums profonds, voire même de nouveaux domaines du vivant.
Fichier principal
Vignette du fichier
LANNES_Romain_2019.pdf (36.43 Mo) Télécharger le fichier
Origin Version validated by the jury (STAR)
Loading...

Dates and versions

tel-02954131 , version 1 (30-09-2020)

Identifiers

  • HAL Id : tel-02954131 , version 1

Cite

Romain Lannes. Recherche de séquences environnementales inconnues d’intérêt médical/biologique par l’utilisation de grands réseaux de similarité de séquences. Microbiologie et Parasitologie. Sorbonne Université, 2019. Français. ⟨NNT : 2019SORUS232⟩. ⟨tel-02954131⟩
149 View
15 Download

Share

Gmail Mastodon Facebook X LinkedIn More