• Aucun résultat trouvé

Corrélation entre la thermophilicité et la thermostabilité des protéines

Dans le document Disponible à / Available at permalink : (Page 144-148)

23 Méthodes d’identification des différents facteurs

5.1 Corrélation entre la thermophilicité et la thermostabilité des protéines

La thermostabilité des protéines repose sur une combinaison subtile de plusieurs facteurs et l’adaptation thermique peut être fort différente d’une protéine à l’autre. Bien que dans ce travail nous énoncions des pistes permettant de mieux appréhender cette grandeur thermodynamique, il reste encore un bout de chemin à parcourir. L’une des contraintes majeures dans ce domaine est sans conteste la petite taille de l’échantillon de protéines dont la structure et la température de fusion ont été déterminées expérimentalement. Tout au long de cette thèse de doctorat, nous nous sommes efforcés de l’agrandir à l’aide de nouvelles données disponibles dans la littérature caractérisant la thermostabilité de nouvelles protéines. Comme le montre la section 3.1.1, nous avons commencé par une base de données comportant 87 entrées puis 127 et au final 166. Cependant, afin de contourner cet obstacle lié au manque de données, l’une des approximations couramment réalisée dans ce domaine est d’évaluer la résistance thermique des protéines par le biais de la température de l’environnement de l’organisme dont elle provient Tenv Plus précisément, la Tem d’une protéine correspond à la température de l’habitat de son hôte lorsqu’il s’agit d’un micro-organisme ou un organisme pluricellulaire à sang froid. Lorsqu’il s’agit d’un organisme pluricellulaire à sang chaud, la Tem correspond à la température corporelle de l’organisme.

La différence entre Tm et Tem peut dans certains cas être assez importante. Que les organismes thermophiles nécessitent des protéines thermostables pour accomplir les fonctions biologiques nécessaires à leur survie est un fait certain. L’inverse n’est pas forcément vrai, d’ailleurs certains organismes mésophiles disposent de protéines capables de maintenir leur structure et leur activité à des températures très élevées. Cependant, cette approximation a longtemps été réalisée et justifiée par une très forte corrélation entre Tm et Tem observée par Gromiha et al. (1999) sur un petit nombre de familles de protéines homologues Ce groupe de recherche a en effet rapporté un coefficient de corrélation moyen de 0,91 entre ces deux grandeurs parmi les différentes familles de protéines homologues considérées (la droite de régression qu’ils ont obtenue est donnée à l’équation 5.1). Les auteurs de cet article scientifique restent très vagues quant au nombre exact de protéines et de familles mis en œuvre pour obtenir une telle corrélation. Leur échantillon contient seulement 56 protéines dont ils connaissent la Tem- Après vérification dans la littérature il semblerait que seulement 10 d’entre elles possèdent une Tm déterminée expérimentalement. Le grand coefficient de corrélation moyen qu’ils ont obtenu a vraisemblablement été calculé tenant compte de régressions linéaires effectuées au sein de familles ne comportant que deux ou trois homologues.

~ 24,4°C-I-0,93T;„v (5.1)

Actuellement, l’échantillon de protéines dont la température de fusion est déterminée expérimentalement est bien plus grand. Nous avons dès lors calculé à nouveau cette corrélation à partir de notre base de données de 127 protéines monomériques sauvages BD4

(section 3.1.1). Nos résultats montrent que ces deux grandeurs sont en effet corrélées (fig.5.1).

Cependant le coefficient de régression n’étant que de 0,59 il est difficile de considérer que ces deux valeurs sont équivalentes. La droite de régression que nous avons dérivée s’écrit :

Chapitre 5 — Corrélation entre Te„y et T„

Figure 5.1 - Corrélation entre la Tm et la Tgnv de 127 protéines sauvages. La droite en pointillés correspond à une équivalence parfaite entre T„ et celle en trait continu correspond à la régression linéaire entre ces deux grandeurs parmi les 127 protéines sauvages de la BD4 (eq. 5.2). Figure réalisée avec le logiciel XMgrace

Parmi les 127 protéines de notre base de données, toutes les températures de fusion ont été mesurées par des expériences de dénaturation. Cependant, certaines expériences ne spécifient pas si cette dénaturation est réversible ou non, dès lors la température de fusion mesurée pourrait être une température de fusion apparente Tm(app), généralement proche mais plus faible que la température de fusion réelle (section 3.1.1). En ne considérant que les 68 protéines pour lesquelles la Tm a été déterminée lors d’une dénaturation thermique réversible, le coefficient de corrélation diminue encore légèrement (0,56). La droite de régression qui en découle reste cependant quasiment identique :

T;„~42,2°C + 0,65r^„v (5.3)

La divergence entre ces deux températures Tm et Tgnv est clairement illustrée par la présence de nombreuses protéines ayant une Tg„v proche de 37°C au sein de notre base de données. Ces protéines proviennent essentiellement de mammifères ou de bactéries avec lesquelles ils vivent en symbiose (e.g. Escherichia colï). Ces protéines ont des températures de fusion couvrant un très large intervalle, allant de 39,45°C à 90°C pour l’ubiquitine humaine. La protéine la plus thermostable de notre base de données BD^ provenant d’un organisme mésophile possède une Tm au-delà de 120°C. L’hôte de cette protéine est la bactérie Desulfovibrio vulgaris capable de survivre dans des environnements contaminés Cet exemple suggère qu’en plus de la Tg„v, d’autres caractéristiques de l’organisme, tels que leur caractère acidophile ou halophile, peuvent influencer la Tm de ses protéines. Qui plus est, les différentes fonctions et localisations des protéines dans un organisme vivant ainsi que le fait que certaines protéines sont stabihsées in vivo par la formation de complexes intermoléculaires sont autant de causes participant à cette faible corrélation. D’autre part, il est parfaitement concevable que la thermostabilité élevée de certaines protéines appartenant à des organismes mésophiles soit simplement le finit du hasard. En effet, il existe clairement une pression évolutive liée à la température pour les protéines appartenant à des organismes thermophiles. Une telle pression évolutive n’existe pas pour les protéines issues d’organismes mésophiles et donc lors de leur évolution, les mutations introduites au hasard conférant une plus grande stabilité thermique n’ont pas de raison d’être rejetées. Une autre hypothèse encore pourrait être la conservation de protéines ayant appartenu aux premiers organismes qui vraisemblablement seraient apparus alors que le climat terrestre était extrêmement chaud

Cette corrélation, faible mais néanmoins significative (p-valeur ~ 10' ), entre Tm et Tenv,

provient partiellement du fait que la Tm d’une protéine doit nécessairement être plus grande que sa Tenv De manière à analyser l’impact de cette contrainte, nous avons construit 10^ permutations aléatoires entre les couples \Tm, Tenv} respectant la condition Tm > Tenv Le coefficient de corrélation entre ces couples formés aléatoirement équivaut en moyenne à 0,40 et ne dépasse 0,59 que dans 0,07% des cas. La condition Tm > Tenv n’est donc pas suffisante pour expliquer la relation que nous observons. Il est en effet possible de considérer que les valeurs des Tm soient en moyenne relativement proches des Tenv puisqu’il n’y a probablement pas de pression évolutive pour qu’une protéine dispose d’une Tm beaucoup plus grande que sa

Tenv Ceci s’avère être généralement le cas pour les protéines ayant une Tenv particulièrement grande ou particulièrement basse alors qu’une plus grande variabilité de la Tm est observée pour les protéines dont la Tenv oscille entre 20°C et 40°C. Il est impossible de tirer une conclusion de cette observation puisque notre base de données ne comporte que très peu de protéines issues d’organismes hyperthermophiles et psychrophiles. Cependant, cette observation suggère que les organismes supérieurs, multicellulaires, qui sont pour la plupart mésophiles, auraient besoin de protéines couvrant une large gamme de températures de fusion puisqu’ils contiennent différents tissus. Ceux-ci constituent un grand nombre d’environnements différenciés possédant leurs propres caractéristiques de pH et de salinité. En effet, parmi les protéines de notre base de données figurent notamment l’ubiquitine humaine (7;„=90,0°C) localisée dans de nombreux compartiments subcellulaires ainsi qu’une protéase humaine (rm=77,0°C), une ribonucléase de grenouille (T'm=87,8°C) et une hydrolase de porc (r;„=88,5°C) toutes trois extraites de leur pancréas où les conditions de pH sont légèrement basiques.

La corrélation que nous avons calculée ici ne tient pas compte du type de protéines sur lesquelles ces températures ont été mesurées. Une plus forte corrélation entre Tm et Tenv peut être attendue en la dérivant au sein d’une famille de protéines homologues puisque l’intervalle de (thermo-)stabilité optimal d’une protéine dépend de sa fonction et de l’environnement spécifique dans lequel elle est active. Cependant, même s’il est possible d’observer de meilleures corrélations en utilisant cette approche, le nombre restreint de protéines d’une même famille ne permet pas d’en dériver une corrélation statistiquement significative. Par exemple, notre base de données contient 5 adénylate kinases issues d’organismes différents dont l’intervalle de la Tenv s’étend de 15°C à SUC. Le coefficient de corrélation entre Tm et

Tenv au sein de cette famille s’élève à 0,71 mais possède une p-valeur relativement grande (0,179). Le tableau 5.1 reprend les valeurs de ces deux paramètres lors de la régression linéaire entre Tm et Tenv pour les 8 familles de protéines homologues définies au chapitre 2.

19 Famille Nombre de représentants Coefficient de corrélation p-valeur Acylphosphatase 3 1,00 0,003 Adénylate kinase 5 0,71 0,179 a-Amylase 5 0,80 0,101

« Cold shock protein » 3 0,99 0,074 Cytochrome P450 5 0,99 0,002

Glycoside hydrolase 4 0,51 0,487

Lysozyme 4 0,77 0,233

Myoglobine 3 0,99 0,093

Moyenne 0,85 0,146

Tableau 5.1 - Coefficients de corrélation etp-valeurs des régressions linéaires entre Tm et Tenv OU sein de 8 familles de protéines homologues.

Chapitre 5 - Corrélation entre et T„

Nous observons que de manière générale, les corrélations entre ces deux températures sont effectivement meilleures au sein de familles de protéines. L’approximation réalisée en considérant que Tem et Tm sont parfaitement corrélées aurait dès lors un impact moins néfaste lors de travaux effectués sur des familles de protéines homologues que lors d’analyses englobant un grand nombre de protéines différentes. Même si la corrélation globale entre ces deux températures est relativement faible, cette approximation peut s’avérer utile lors de l’étude des facteurs déterminant la stabilité thermique des protéines.

5.2 Impact de l’approximation de la thermostabilité par la

Dans le document Disponible à / Available at permalink : (Page 144-148)