Texte intégral

(1)

Chapitre 7 – Conclusions et perspectives

7Chapitre 7

Conclusions générales et perspectives

7.1 Conclusions générales

La thermostabilité d’une protéine est une grandeur thermodynamique clairement identifiée par sa température de fusion Tm. Cependant, la littérature scientifique regorge de travaux assimilant la thermostabilité des protéines à d’autres grandeurs telles l’activité enzymatique, la stabilité thermodynamique ∆G0, la thermophilicité (Tenv, températurede l’environnement de l’hôte d’une protéine) … Cette confusion trop souvent réalisée donne une image floue de cette grandeur conduisant à des méprises fort ennuyeuses. Une certaine corrélation existe bel et bien entre ces différentes grandeurs et la stabilité thermique des protéines (section 1.3).

Cependant les approximations sous lesquelles ces grandeurs sont proportionnelles peuvent dans certains cas être très importantes. Ainsi, que ce soit en assimilant la Tm à la Tenv ou sa variation ∆Tm à la variation stabilité thermodynamique ∆∆G0, ces approximations sont généralement délétères à la dérivation de lois régissant la stabilité thermique des protéines (sections 5.2 et 6.3).

Au cours de nos recherches nous avons pu observer les limitations auxquelles peuvent conduire l’examen approfondi de différents facteurs de séquence et de structure qui permettent de moduler la stabilité thermique au sein de familles de protéines homologues. Les travaux que nous avons réalisés dans ce domaine montrent qu’il n’y a pas de manière unique d’atteindre une stabilité thermique plus élevée. Ils ont néanmoins mis en évidence la multitude de voies empruntées par les protéines pour s’adapter aux températures extrêmes (chapitre 2).

La dérivation de potentiels de force moyenne à partir de groupes de protéines de thermostabilité distincte constitue une voie de recherche nouvelle et originale qui nous a permis de contourner ces limitations et de pousser nos travaux jusqu’à la conception de méthodes visant à prédire la stabilité thermique de protéines homologues et les changements de thermostabilités encourus lors de mutations ponctuelles.

Les profils énergétiques que nous avons dérivés d’échantillons de protéines de thermostabilité distincte permettent de se rendre compte des différences intrinsèques entre les interactions présentes au sein de chacun de ces environnements protéiques. Ils tendent à décrire l’impact de l’adaptation thermique des protéines tant au niveau de leur séquence que de leur structure. Les protéines thermostables disposant en moyenne d’un plus grand nombre d’interactions résistantes à la température (e.g. ponts salins), les potentiels statistiques qui en découlent présentent ces interactions comme étant plus favorables à haute température.

A l’aide d’un potentiel de distance standard dérivé de groupes de protéines de thermostabilité distincte, nous avons tout d’abord observé l’influence de la température sur les contributions énergétiques de quatre types d’interactions (section 4.1). Ainsi, certaines d’entre

(2)

repliement des protéines. Il s’avère que la contribution des ponts salins est plus favorable à haute température relativement aux autres interactions. A l’inverse, nous avons pu constater que les contributions d’interactions effectives entre acides aminés hydrophobes aliphatiques ne varient presque pas avec la température. En ce qui concerne l’étude des interactions aromatiques et cation-π nous avons été confrontés au faible échantillon de protéines dont nous disposions et nous n’avons pas pu en tirer de réelles conclusions.

Ensuite, nous avons développé un potentiel de distance qui tient compte de l’adaptation de composition des protéines thermostables au cours de l’évolution (section 3.2.2). En dérivant celui-ci, nous avons pu quantifier l’impact significatif de la température sur la contribution des ponts salins relativement aux autres interactions et plus précisément ceux formés avec l’arginine (section 4.1.3). Le caractère thermostabilisant plus marqué de ces ponts salins relativement à ceux formés avec la lysine peut être lié au groupement guanidinium sur lequel les électrons sont délocalisés. Ce faisant, nous avons également mis en évidence deux géométries d’interaction distinctes de ponts salins formés avec l’arginine. L’une d’entre elles est énergétiquement beaucoup plus favorable que l’autre, mais toutes deux présentent une contribution plus favorable au sein de protéines thermostables. Par ailleurs, les interactions effectives entre acides aminés hydrophobes apparaissent aussi stabilisantes dans des protéines thermostables que mésostables relativement aux autres interactions sauf lorsqu’elles concernent deux isoleucines (section 4.1.2). Ce résidu est le plus hydrophobe des résidus aliphatiques et est plus abondant dans les protéines thermostables de notre échantillon. De par sa plus grande hydrophobicité, sa contribution à l’énergie libre de repliement est plus favorable et pourrait être un avantage vis-à-vis de la résistance à la température.

Finalement, nous avons généralisé notre approche à une analyse systématique et exhaustive portant sur toutes les interactions possibles entre paires de résidus et non plus restreinte à quatre types d’interactions (section 4.2). Cette nouvelle approche est basée sur un plus grand échantillon de protéines et met en œuvre un nouveau potentiel statistique. Celui-ci permet d’éviter les effets relatifs à la taille des protéines influençant les profils énergétiques dérivés tout en tenant compte de l’adaptation de composition des protéines thermostables.

Bien que notre échantillon de protéines ait été élargi, nous avons également dérivé des potentiels effectifs entre regroupements d’acides aminés similaires. Ceux-ci apportent une information complémentaire et plus globale sur la dépendance en la température des différents profils énergétiques liés à différents types d’interactions. Cette analyse systématique a mis en évidence l’effet favorable vis-à-vis de la thermostabilité d’autres interactions telles que les interactions cation-π, aromatiques, les ponts H formés entre résidus chargés et à nouveau les empilements hydrophobes formés avec l’isoleucine ainsi que les ponts salins de manière générale. Elle a également montré l’effet moins favorable d’interactions telles que les ponts H formés entre paires de résidus polaires non-chargés ou encore les empilements hydrophobes formés avec la lysine. Par ailleurs cette nouvelle approche a clairement mis le doigt sur

(3)

Chapitre 7 – Conclusions et perspectives

homologues. Ces premiers résultats sont prometteurs mais il est nécessaire de le confronter à d’autres familles de protéines afin de valider son pouvoir prédictif.

Nous avons également développé un outil de prédiction des changements de thermostabilité encourus lors de l’introduction d’une mutation ponctuelle dans une protéine sauvage (mutants, section 6.2). Cette nouvelle démarche a nécessité la collecte d’un grand échantillon de mutants dont le changement de température de fusion a été mesuré expérimentalement et dont la structure de la protéine sauvage est résolue. A cet effet, nous avons conçu une grande base de données regroupant plus de 23.500 expériences de dénaturation sur plus de 1.400 protéines (section 3.1.5). Parmi celles-ci, 1.601 mutants ont été sélectionnés comme échantillon d’apprentissage et de validation d’un réseau de neurones pour identifier la pondération de divers potentiels statistiques décrivant l’adéquation entre séquence et structure des protéines. Au final, ces pondérations couplées aux différents potentiels statistiques permettent d’évaluer les changements de stabilité thermique encourus lors de l’introduction d’une mutation ponctuelle. Les performances de ce logiciel bioinformatique sont prometteuses mais devraient pouvoir être encore améliorées (section 7.2).

Il existe une autre approche permettant de prédire les changements de thermostabilités engendrés par l’introduction d’une mutation. Cette approche est basée sur l’approximation que les changements de stabilité thermodynamique sont proportionnels aux changements de stabilité thermique. Nous avons comparé les performances de notre approche prédictive avec l’un des meilleurs outils bioinformatiques disponibles aujourd’hui capable d’estimer les changements de stabilité thermodynamique liés à l’introduction d’une mutation (PoPMuSiC-2.0). Les performances de notre logiciel plus spécifiquement conçu pour la détermination des changements de thermostabilité sont supérieures à celles que l’on peut obtenir à l’aide de PoPMuSiC-2.0 (section 6.2.3).

Cette thèse de doctorat propose une nouvelle voie de recherche permettant d’étudier la stabilité thermique des protéines. La dérivation de potentiels statistiques à partir de différents ensembles de protéines de thermostabilité moyenne distincte, permet d’observer et de quantifier leurs dissemblances. Cette approche originale a des qualités tant au niveau de la recherche fondamentale qu’appliquée. En effet, d’une part elle a permis de mettre en évidence et d’interpréter la dépendance en la température de diverses interactions protéiques. D’autre part, cette démarche apporte une quantification de cet effet permettant la mise au point de méthodes prédictives dont les performances sont très encourageantes. A notre connaissance aucune quantification de cette influence de la température sur les contributions des interactions protéiques n’a été réalisée jusqu’à aujourd’hui. En effet, que ce soit par le biais d’études systématiques de dissemblances entre protéines homologues de thermostabilité distincte ou par des approches semi-empiriques ou de chimie quantique, aucune quantification de cet effet n’a été proposée. La démarche originale que nous avons suivie ouvre une nouvelle voie pour comprendre et prédire la thermostabilité des protéines.

(4)

Il reste encore beaucoup de chemin à parcourir pour arriver à contrôler de façon fiable la thermostabilité des protéines. Les outils de prédiction que nous avons développés peuvent en effet encore être améliorés. Les perspectives de ce travail sont nombreuses et interviennent dans différents aspects tels : la collecte de plus grands échantillons de protéines de structure et de température de fusion connues, l’amélioration de nos potentiels de force moyenne afin de mieux prendre en compte l’adaptation aux températures extrêmes de protéines au cours de l’évolution ainsi que la restructuration de nos outils de prédiction afin de prendre en compte ces nouvelles fonctions d’énergie qui dépendent de la température pour en améliorer leur pouvoir prédictif.

La base de données que nous avons conçue peut d’une part être encore agrandie et d’autre part être corrigée, améliorée et automatisée. En effet, le nombre de nouvelles protéines sauvages et mutantes caractérisées augmente de jour en jour. La thermostabilité des protéines ayant un intérêt fondamental et industriel très important, la détermination des températures de fusion et de sa variation lors de l’introduction d’une mutation est de plus en plus méthodique.

Afin de prendre en compte toutes ces nouvelles données, il serait important de concevoir une méthode de collecte automatique ou semi-automatique permettant de les rassembler. Ainsi, il serait très utile de développer un algorithme capable d’extraire les informations relatives aux températures de fusion et sa variation (Tm et ∆Tm) présentes dans la littérature scientifique disponible sur Internet. L’analyse automatique d’un grand nombre d’articles reprenant ces expériences de dénaturation mesurant ces Tm et ∆Tm nous laisse cependant sceptiques. En effet, une méthode semi-automatique semble d’une part plus réalisable et plus judicieuse puisqu’il est parfois très difficile de retrouver dans un article l’information pertinente concernant les conditions expérimentales exactes de dénaturation. La présence de divers dénaturants, solvants, ions, ainsi que certaines fautes d’encodage des données (tant au niveau des signes attribués qu’aux valeurs des grandeurs mesurées elles mêmes) sont autant de sources d’erreurs qui nécessitent une vérification aux dépens de leur introduction dans notre base de données. Cette méfiance s’explique par le relativement faible échantillon de données encore disponible dans ce domaine. Par ailleurs, il serait intéressant de développer une interface Web autorisant une consultation aisée de notre base de données et permettant éventuellement l’encodage de nouveaux résultats expérimentaux par les expérimentateurs eux-mêmes à l’aide d’un formulaire interactif.

Le développement de nouveaux potentiels statistiques capables de mieux décrire les interactions aromatiques permettrait de mieux appréhender leur dépendance en la température par rapport aux autres interactions (e.g. potentiels statistiques adaptés aux interactions cation-π, section 3.2.5). Bien que notre échantillon soit certainement trop petit encore pour mesurer convenablement son impact, ceux-ci seront certainement utiles lorsque de plus grands ensembles de protéines seront disponibles.

(5)

Chapitre 7 – Conclusions et perspectives

la prédiction de la thermostabilité entre protéines homologues que de la prédiction des changements de stabilité thermique engendrés par des mutations ponctuelles.

Il est certain que la prochaine étape visant à améliorer notre outil bioinformatique capable de prédire les changements de thermostabilité des protéines liés à des mutations ponctuelles consistera en l’introduction de notre potentiel de distance dépendant de la température. Cette démarche devrait permettre de dépasser les performances actuelles de notre logiciel. Par ailleurs, une fois les autres types de potentiels statistiques dérivés (de torsion et d’accessibilité) une place de choix leur est également destinée dans notre méthode de prédiction.

Ce logiciel que nous avons développé et ses améliorations futures ont pour but de limiter le nombre de mutations à tester expérimentalement sur une protéine donnée et de guider le choix vers les mutations présentant le changement de stabilité thermique escompté. Un tel avancement offre une alternative aux techniques de criblage, qui procèdent essentiellement par essais et erreurs, et qui sont fort coûteuses à la fois en temps et en argent. En outre, la mise au point de ce logiciel au sein de notre laboratoire a permis de développer une méthodologie qui pourra être adaptée à l’étude et à la prédiction d’autres propriétés physico-chimiques des protéines comme leur solubilité, leur stabilité vis-à-vis de l’acidité, de la pression, de la salinité … lorsque suffisamment de données expérimentales seront disponibles.

Notre recherche est à considérer comme une première brique dans l’édifice théorique pluridisciplinaire conduisant à la conception rationnelle de protéines aux propriétés physico-chimiques modifiées. Il serait dès lors possible d’imaginer que dans le futur, notre logiciel constitue un module d’un logiciel plus large combinant d’autres modules basés sur d’autres propriétés physico-chimiques des protéines et développés suivant cette même méthodologie. Ce programme serait capable de gérer ces différents modules de manière à prédire les différentes mutations à effectuer pour qu’une protéine (enzyme) soit fonctionnelle et stable dans des conditions particulières de température, de pression, de pH, de salinité…

Un tel outil serait à la base de la conception de protéines modifiées dont les propriétés répondent à des critères spécifiques prédéfinis.

Figure

Updating...

Références

Updating...

Sujets connexes :