Etude exploratoire de la répartition des repliements de protéines au sein du vivant - Université des Antilles
Thèse Année : 2021

Exploratory study of the distribution of protein folding in living organisms

Etude exploratoire de la répartition des repliements de protéines au sein du vivant

Résumé

Structural domains of proteins are classified according to the connectivity and organisation in three dimensions of their secondary structures : the “fold”. The total number of folds is quite stable over the last decade, about 1200, which is surprisingly low. It is possible that folds are extremely reliable characters, thus possibly allowing robust phylogenetic hypotheses, complementary to traditional phylogenetic signals. Moreover, their slower dynamic of change, compared to sequences, could allow the resolution of deep nodes of the phylogeny of organisms. In this thesis, we have explored the distribution of folds within the tree of life to evaluate their potential as phylogenetic markers. We also tried to answer the question of structural convergence by measuring the consistency of their repartition across a reference phylogeny. We have then extracted folds specific to some clades within eukaryota and analysed their structures and functions. We have developed and explored a methodology to analyse the repartition of folds relying on a seriated heatmap and several clusterings. We have highlighted that folds are reliable synapomorphies. They are witnesses of ancient events like primary and secondary endosymbiosis, but they can be specific of more recent clades like metazoa or vertebrates. We have analysed some functions of folds inherited from archaea and bacteria that reveal in both cases an over-representation of informational function. Study of specific eukaryota folds reveal an overrepresentation of regulation functions linked to extra-cellular mechanism matching with the rise of multicellularity. This thesis illustrates the capacity of folds to bring information to reconstruct the history of life, i.e. as synapomorphies, or as witnesses of major evolutionary events or as witnesses of the appearance of new fonction through evolutionary time.
Les domaines structuraux des protéines sont caractérisés par la succession et l’organisation en 3 dimensions de leurs structures secondaires : le repliement ou « fold ». Le nombre total de repliements est seulement d’environ 1200 et varie peu depuis une décennie,ce qui est étonnant. Il est alors possible que les repliements représentent des caractères extrêmement stables, et donc des témoignages phylogénétiques fiables, complémentaires des signaux phylogénétiques traditionnels. Leur dynamique de changement plus lente pourrait permettre de mettre en évidence des échelles historiques profondes de l'évolution des organismes. Dans cette thèse, nous avons exploré la répartition des repliements au sein du vivant pour évaluer leur potentiel en tant que marqueurs phylogénétiques et tenter de répondre à la question de la convergence structurale en mesurant la cohérence de leur répartition avec une phylogénie du vivant de référence. Nous avons ensuite analysé les repliements spécifiques à certains clades, en particulier chez les eucaryotes, quant à leur structure et leur fonction. Nous avons aussi exploré et développé une méthodologie permettant d'analyser cette répartition des repliements reposant sur une représentation sous forme de carte (heatmap) sériée et des classifications (clustering). Nous avons mis en évidence que les repliements sont de bons caractères phylogénétiques. Ils sont les témoins d'événement très anciens comme l'endosymbiose primaire ou secondaire, mais ils peuvent être aussi spécifiques de clades dont l'émergence est beaucoup plus récente comme les métazoaires ou les vertébrés. Nous avons aussi analysé les fonctions des repliements hérités à la fois des bactéries et des archées, qui révèlent dans les deux cas une surreprésentation des folds ayant un rôle dans la machinerie informationnelle ainsi que les fonctions des repliements spécifiques eukaryotes. Ces repliements révèlent une surreprésentation de fonctions de régulation et liées aux mécanismes extra-cellulaires concordant avec le développement de la multicellularité. Cette thèse illustre la capacité des repliements à apporter des informations pour la reconstruction de l’histoire du vivant que ce soit comme marqueur phylogénétique, témoins d'événements évolutifs majeurs ou encore témoins de l’apparition de différentes fonctions au cours de l'évolution.
Fichier non déposé

Dates et versions

tel-04038899 , version 1 (21-03-2023)

Identifiants

  • HAL Id : tel-04038899 , version 1

Citer

Martin Romei. Etude exploratoire de la répartition des repliements de protéines au sein du vivant. Bio-informatique [q-bio.QM]. Sorbone Université, 2021. Français. ⟨NNT : ⟩. ⟨tel-04038899⟩
63 Consultations
0 Téléchargements

Partager

More