• Aucun résultat trouvé

Conclusions

Dans le document Disponible à / Available at permalink : (Page 138-144)

23 Méthodes d’identification des différents facteurs

4.3 Conclusions

Notre analyse préliminaire sur la dépendance en la température de quatre types d’interactions protéiques révèle pour deux d’entre elles des variations particulières (section 4.1). En effet, cette analyse préliminaire a clairement mis en évidence que lorsque la température augmente, la contribution stabilisante d’une interaction effective entre deux résidus hydrophobes reste en général inchangée relativement aux autres interactions, alors que celles des ponts salins formés avec l’arginine deviennent relativement plus favorables. Ce résultat peut être considéré coimne statistiquement significatif puisque la probabilité d’observer cette influence de la température aléatoirement n’est que d’une chance sur mille. L’influence de la température sur les interactions aromatiques et cation-7i reste cependant qualitative et informative.

De plus, nous avons mis en évidence deux géométries d’interactions distinctes des ponts salins formés avec l’arginine : la géométrie fork-stick, dans laquelle l’atome N^de l’arginine fait partie de l’interaction, et la géométrie fork-fork où les chaînes latérales des deux résidus formant le pont salin se font face. Ces deux géométries ont des contributions favorables au repliement des protéines. Plus précisément, elles sont plus favorables au sein de protéines thermostables que mésostables et dans des proportions légèrement différentes. En effet, de manière générale les différentes géométries ainsi que les ponts salins formés avec l’arginine et la lysine n’ont pas le même poids vis-à-vis de la thermostabilité des protéines. Il est important dès lors de les distinguer afin de mieux analyser et prédire la résistance thermique des protéines. L’importance de dissocier les rôles de l’arginine et de la lysine dans un pont salin s’explique par le fait que la charge positive de la lysine est localisée alors que celle de l’arginine est délocalisée sur son groupement guanidinium. Cette dissemblance implique des contributions énergétiques différentes qui peuvent avoir une dépendance en la température distincte (à savoir : l’empilement %—% et les forces électrostatiques). Leurs partenaires de pont salin chargés négativement (D et E), peuvent être considérés comme étant fort similaires. En effet, bien que l’acide glutamique ait une entropie conformationnelle légèrement supérieure (liée à sa plus longue chaîne latérale), la distribution de la charge négative est identique au sein des acides aspartiques et glutamiques.

Par ciilleurs, les minima des profils énergétiques décrivant les ponts salins formés avec l’arginine sont déplacés vers de plus petites distances d’interaction au sein des protéines thermostables. Cette tendance est plus fortement marquée en ce qui concerne la géométrie d’interaction fork-fork. De tels déplacements ne sont pas observés pour les interactions entre résidus hydrophobes suggérant la présence de ponts salins plus compacts et le maintien d’un empilement hydrophobe similaire au sein de protéines thermostables.

De manière générale, nos résultats sont en accord et complémentaires aux analyses statistiques menées sur la thermostabilité au sein de familles de protéines homologues. En effet, ils sont en accord avec leurs résultats puisque deux des facteurs conférant une thermostabilité accrue souvent mis en avant sont : un plus grand nombre de ponts salins et une

structure plus compacte [10.44,84,87,88.91.94-96.99,100,10r.l03,l?2,lll-130.13

l’approche par mécanique statistique des potentiels de force moyenne apporte un nouveau point de vue qui nous permet de fournir de nouvelles caractéristiques plus spécifiques. A savoir, le fait que les différents ponts salins ainsi que la compacité des diverses interactions protéiques sont affectés de manière distincte par la température

Chapitre 4 — Dépendance en la température d’interactions protéiques

Afin d’étudier la dépendance en la température des contributions de toutes les paires d’acides aminés au repliement des protéines, nous avons mené une analyse automatique et systématique à partir d’un échantillon de données plus grand (section 4.2). Bien que nous soyons entretemps parvenus à augmenter la taille de notre échantillon de protéines, la teneur en protéines issues d’archaea hyperthermophiles reste très faible. L’adaptation thermique de ces protéines semble être différente leur conférant une plus grande compacité et une taille plus petite Compte tenu de leur faible nombre dans notre base de données, nous avons adapté nos potentiels de force moyenne en les normalisant par rapport à la taille des protéines.

Pour mener à bien cette analyse automatique et systématique de grande envergure, nous avons défini deux plus grands groupes de protéines de structure connue et de thermostabilité distincte, un potentiel de distance statistique spécialement conçu pour contrôler la dépendance en la température ainsi qu’une méthode automatique permettant d’analyser la significativité statistique des dépendances observées. Nous avons également introduit un nouveau potentiel où les distances inter-résidus sont calculées entre les atomes virtuels Cv, représentant plus précisément la localisation des groupements fonctionnels des chaînes latérales de certains résidus {e.g. cycles aromatiques, groupements carboxyliques, alcools et amines). Ce potentiel donne des informations complémentaires à celles fournies par le potentiel utilisant l’atome virtuel C^, défini comme étant le centre géométrique de la chaîne latérale. La représentation utilisant les Cv apparaît légèrement supérieure dans la description des profils énergétiques des ponts salins (fig. 4.22). Les conclusions qui découlent de cette vaste analyse systématique peuvent être résumées comme suit :

a. Les ponts salins, les interactions cation-7i et les ponts H entre un résidu aromatique et un résidu négativement chargé, sont plus stabilisants aux températures élevées relativement aux autres interactions. Un des points communs entre ces différentes interactions est qu’elles ont toutes une composante électrostatique. De manière similaire, les interactions répulsives entre résidus chargés positivement semblent être relativement plus favorables (moins défavorables) à haute température.

b. Les ponts H entre acides aminés polaires non-chargés uniquement ou entre résidus polaires non-chargés et résidus chargés négativement sont relativement moins stabilisants à haute température. Cette propriété peut être liée à l’absence de caractère électrostatique qui les définit et indirectement liée à la plus forte tendance de déamidation des résidus N et Q à haute température facilitée par les résidus S et T.

c. Les interactions entre acides aminés aromatiques faisant intervenir différents types de contributions en fonction de leur géométrie d’interaction (empilement 7i—7C, empilement hydrophobe) sont relativement plus stabilisantes à haute température. De même, les cation-7t formés avec l’arginine sont relativement plus stabilisants à haute température que ceux formés avec la lysine. La première interaction a une composante électrostatique et également une composante liée à la délocalisation électronique du groupement guanidinium de l’arginine alors que la deuxième interaction est essentiellement de nature électrostatique.

d. Les empilements de résidus hydrophobes et aliphatiques semblent ne pas dépendre de la température si la valine est incluse, semblent être thermostabilisants avec l’isoleucine et mésostabilisants avec la leucine. Il semblerait que la résistance aux températures élevées soit favorisée par les résidus fortement hydrophobes (comme l’isoleucine) pour lesquels la solvatation dans l’état déplié est très défavorable.

e. Bien que la faible teneur en cystéine ne permette pas de tirer de conclusions définitives, les ponts disulfures semblent être thermiquement stabilisants.

f. Les empilements de résidus hydrophobes et aliphatiques semblent ne pas dépendre de la température si la valine est incluse, semblent être thermostabilisants avec l’isoleucine et mésostabilisants avec la leucine. H semblerait que la résistance aux températures élevées soit favorisée par les résidus fortement hydrophobes (comme l’isoleucine) pour lesquels la solvatation dans l’état déplié est très défavorable.

g. Certaines interactions entre paires de résidus semblent être non stabilisantes (ou très peu), mais moins néfastes à la stabilité des protéines thermostables qu’à celle des protéines mésostables (ou inversément). Dans certains cas, cet effet semble être lié aux propriétés d’un seul des partenaires interagissant. Plus précisément, l’effet thermostabilisant des interactions entre résidus chargés et résidus de petite taille peut probablement être lié à la plus grande occurrence de résidus chargés au sein de protéines thermostables. A l’inverse, l’effet mésostabilisant des interactions entre résidus aliphatiques ou petits et résidus polaires non-chargés peut probablement être lié à la plus grande occurrence de résidus polaires non-chargés au sein de protéines mésostables. Par ailleurs, le fait que les interactions entre petits résidus apparaissent comme étant mésostabilisantes est probablement lié à leur taille et à l’incapacité de former des interactions spécifiques à cause de leurs petites chaînes latérales.

Certaines de ces conclusions sont à considérer comme provisoires et nécessitent d’être confirmées lorsqu’un échantillon de données plus grand sera disponible. Par ailleurs, notre base de données ne comportant que trop peu de protéines issues d’archaea nos résultats ne peuvent ni confirmer ni infirmer l’hypothèse selon laquelle différents groupes d’organismes utilisent différentes stratégies d’adaptation thermique^*

Nous aimerions mettre l’accent sur le fait qu’il y a plusieurs stratégies permettant d’augmenter la résistance thermique des protéines (fig. 1.11). Celles-ci peuvent se résumer en deux combinaisons : en stabilisant la structure thermodynamiquement et thermiquement de manière simultanée ou en la stabilisant thermiquement tout en conservant une stabilité thermodynamique similaire. L’augmentation du nombre d’interactions stabilisantes améliore les deux types de stabilité alors que le remplacement de certaines interactions par d’autres permet de moduler plus spécifiquement la stabilité thermique. Notre approche a pour objectif d’identifier les facteurs dont l’effet est le plus spécifiquement lié à la stabilité thermique. En effet, nous ne nous contentons pas d’analyser le moyen d’atteindre une stabilité thermodynamique plus grande, nous cherchons à décrypter ceux procurant une plus grande stabilité thermique. Cependant, de par la nature même de notre approche il nous est impossible de distinguer parfaitement ces deux stratégies menant à une thermostabilité plus élevée. En effet, les potentiels de force moyenne que nous utilisons mélangent clairement ces deux stabilités qui sont par ailleurs fortement liées. Pour s’en rapprocher le plus possible, de grands groupes de protéines de stabilité thermodynamique équivalente mais de différente stabilité thermique seraient nécessaires.

Une autre observation intéressante qui découle de cette vaste analyse systématique est qu’au lieu de se focaliser uniquement sur les interactions stabilisantes, il est nécessaire de prendre en compte les interactions répulsives. En effet, celles-ci peuvent être plus ou moins répulsives en fonction de la température et contribuer ainsi à la stabilité thermique globale des

Chapitre 4 - Dépendance en la température d’interactions protéiques

protéines. Ceci est particulièrement vrai étant donné que nos potentiels sont des potentiels de force moyenne mêlant les contributions enthalpiques et entropiques liées aux charges, charges partielles, dipôles et/ou quadrupoles permanents et/ou induits, à l’effet hydrophobe, à l’empilement aromatique, à l’entropie conformationnelle, ... Beaucoup de données supplémentaires seront nécessaires pour décrypter l’importance de toutes ces contributions et les effets précis de l’environnement des protéines.

Tout au long de ce travail nous avons considéré que l’unique pression d’adaptation évolutive de la composition en acides aminés des protéines est la stabilité thermique. Ceci est clairement une simplification puisque toutes les molécules présentes dans la cellule doivent être résistantes à la température de leur environnement (telles les molécules d’ARN et ADN). Ces conditions supplémentaires peuvent imposer de nouvelles contraintes sur la composition en acides aminés des protéines qui pourraient expliquer certaines observations étonnantes.

Les nouveaux potentiels que nous avons développés permettent de décrire non seulement la corrélation entre la séquence et la structure des protéines mais également leur rapport avec la température de fusion. Ce travail ouvre dès lors la voie à une analyse générale et systématique de l’adaptation de séquence et de structure des protéines aux divers environnements colonisés par les organismes extrêmophiles {e.g. acidophiles, halophiles, barophiles...).

Finalement, un des avantages importants de notre approche est que les profils énergétiques dérivés dans ce travail donnent la possibilité d’évaluer quantativement l’impact effectif de la température sur les différentes interactions protéiques. De tels résultats quantitatifs seront nécessaires pour toute application visant à prédire la thermostabilité des protéines. Deux des applications directement envisageables de nos potentiels statistiques dérivés à partir de groupes de protéines thermostables et mésostables sont : la prédiction de la température de fusion de protéines homologues ainsi que la prédiction des changements de stabilité thermique des protéines lors de l’introduction d’une mutation. Le développement de ces deux approches prédictives fait l’objet du chapitre 6 de cette thèse de doctorat.

Chapitre 5

Analyse de la corrélation entre la thermostabilité et la

thermophilicité des protéines

Ce chapitre a pour objectif de mettre en évidence l’importance du choix du descripteur de la thermostabilité des protéines lors d’une étude bioinformatique. En effet, bien que la température de fusion (Jm) d’une protéine soit considérée comme le meilleur descripteur de sa stabilité thermique, une des approximations souvent réalisées dans ce domaine consiste à utiliser la température de l’environnement dans lequel se développe l’organisme duquel provient la protéine {Tenv)- Nous définissons la thermophilicité d’une protéine par sa Tem qui désigne la classe d’organismes à laquelle appartient son hôte. Cette approximation entre Tm et

Tenv est généralement réalisée car le nombre de protéines dont la est connue est très faible et permet donc d’agrandir considérablement l’échantillon de protéines étudié. Afin de visualiser l’impact de cette approximation, nous avons dans un premier temps calculé la corrélation entre ces deux descripteurs parmi les 127 protéines de notre base de données BD^.

Dans un deuxième temps, nous avons évalué l’influence de cette approximation lors de la dérivation de potentiels statistiques définis à l’équation 3.12 à partir de groupes de protéines de Tm élevée et faible ainsi que de groupes de Tenv élevée et faible. En comparant les profils énergétiques décrivant les ponts salins formés avec l’arginine ainsi obtenus, la contribution plus favorable des ponts salins (relativement aux autres interactions) à haute température apparaît beaucoup plus clairement en utilisant la Tm pour décrire la thermostabilité des protéines.

5.1 Corrélation entre la thermophilicité et la thermostabilité des

Dans le document Disponible à / Available at permalink : (Page 138-144)