• Aucun résultat trouvé

Optimisation du placement des chaînes latérales sur un squelette fixe

Chapitre 1 : Introduction Générale

1.5 Optimisation du placement des chaînes latérales sur un squelette fixe

Le problème, connu sous le nom de SCP pour Side-Chain Positionning est le suivant : ne connaissant que le positionnement du squelette peptidique et la séquence protéique correspondante, comment déduire le positionnement optimal des chaînes latérales ?

Il est communément admis que pour chaque acide aminé, il existe un nombre fini de conformations représentatives (figure 16) appelées rotamères par contraction de « rotational

isomers ». En considérant que le repliement d’une protéine correspond à l’état dans lequel

l’énergie libre est minimale, SCP consiste donc à rechercher la combinaison de rotamères qui minimise l’énergie libre.

figure 16 : Illustration de la notion de rotamère avec l’exemple de la phénylalanine. A gauche, une phénylalanine dans un rotamère donné. A droite, les 4 rotamères les plus abondants de la phénylalanine.

1.5.2 Définition des angles dièdres caractérisant le squelette peptidique et les chaînes latérales.

Dans l’espace tridimensionnel, on définit un angle dièdre χ (ou angle de torsion) entre 4 points a, b, c et d par la formule suivante :

La conformation d’un acide aminé au sein d’une protéine peut être décrite par un ensemble d’angles dièdres : les angles φ, ψ et ω positionnent squelette peptidique et les angles χ1, χ2 … χ5 positionnent la chaîne latérale (figure 17-A-B). Pour le squelette peptidique, l’angle φ

caractérise plus précisément la torsion autour de l’axe N-Cα et l’angle ψ la torsion autour de l’axe Cα-C. L’angle ω de la torsion autour de l’axe C-N tend à être planaire car le caractère partiellement double de la liaison peptidique empêche la rotation autour de la liaison C-N (figure 17-C). Les angles χ1, χ2 … χk caractérisent les angles de torsion le long de la chaîne latérale. Le nombre d’angles χnécessaires pour décrire la conformation d’une chaîne latérale dépend du résidu étudié : il varie de cinq pour l’arginine à zéro pour l’alanine et la glycine.

figure 17 : Illustration des angles dièdres définissant la conformation d’un résidu sur un court peptide GKT (glycine – lysine – thréonine). (a) Les angles φ et ψ caractérisent la position du squelette peptidique. (b) Les angles χ1, χ2, χ3 et χ4 caractérisent la

position de la chaîne latérale (de la lysine dans l’exemple). (c) La liaison du carbone carbonyle C avec l'azote N dans la liaison peptidique est plus courte que la liaison simple C-N mais plus longue qu'une liaison double C=N classique. Le caractère partiellement double de la liaison peptidique empêche la rotation autour de la liaison C-N : le groupe peptidique est confiné dans un plan.

1.5.3 Approches heuristiques existantes.

Le premier programme développé pour prédire la conformation des chaînes latérales sur un squelette fixe a été présenté par Roland Dunbrack et Martin Karplus en 1993 (Dunbrack and Karplus, 1993). Depuis, de nombreux autres programmes ont été développés. Ces programmes diffèrent les uns des autres principalement par trois facteurs : (i) la bibliothèque de rotamères, (ii) l’algorithme d’optimisation, (iii) la fonction d’énergie.

Facteur lié à la bibliothèque de rotamères. De nombreuses bibliothèques de rotamères ont

été introduites au cours des 20 dernières années. On distingue trois catégories de bibliothèques de rotamères : les bibliothèques de rotamères dépendantes du squelette peptidique (BBDEP), les bibliothèques de rotamères dépendantes des structures secondaires

(BBIND). Dans les bibliothèques de rotamères dépendantes du squelette peptidique, les rotamères testés pour un résidu sont fonction des angles φ et ψ du résidu. Dans les bibliothèques de rotamères dépendantes des structures secondaires, les rotamères testés ne sont pas les mêmes selon que l’on se trouve dans une hélice α, un feuillet β ou dans une région non structurée. A l’opposé, avec les bibliothèques de rotamères indépendantes du squelette peptidique, les rotamères testés ne dépendent pas de la conformation locale du squelette. La granulosité des différentes bibliothèques et le nombre total de rotamères varient également beaucoup d’une bibliothèque à l’autre.

Facteur Algorithmique. SCP est un problème combinatoire particulièrement difficile. En

effet, Niles Pierce et Erik Winfree ont démontré en 2002 que SCP appartient à la classe des problèmes NP-complets (Pierce and Winfree, 2002).

La classe des problèmes NP-complets rassemble les problèmes tels que :

• Le problème appartient à la classe NP, ce qui signifie qu’on ne sait pas le résoudre au moyen d’un algorithme efficace (cad. polynomial en temps). Plus intuitivement, les problèmes dans NP sont tous les problèmes qui ne peuvent être résolus qu’en énumérant l'ensemble des solutions possibles.

• S’il existait un algorithme efficace pour l’un d’entre eux, alors on pourrait en déduire un algorithme efficace pour l’ensemble des problèmes de la classe. Néanmoins les mathématiciens s’accordent à penser qu’un tel algorithme n’existe pas.

Devant la complexité du problème SCP global, différentes stratégies ont été adoptées. Certains groupes ont choisi de ne pas chercher le minimum d’énergie libre global et de se contenter d’un minimum local (Mendes et al., 2001; Peterson et al., 2004; Tuffery et al., 1997; Xiang and Honig, 2001). D’autres groupes ont préféré ne pas optimiser l’ensemble des résidus de la protéine en une seule étape mais plutôt optimiser indépendamment des sous- ensembles de résidus (Canutescu et al., 2003).

Facteur lié à la fonction d’énergie. Pour chaque combinaison de rotamères générée, il faut

tester si celle-ci est énergétiquement plus favorable que les combinaisons précédentes. Il s’agit d’approximer l’énergie libre associée à cette combinaison de façon précise mais très rapide car le nombre total de combinaisons à tester est très important. Les équipes ont choisi des stratégies différentes en privilégiant soit la rapidité, comme c’est la cas dans certains

programmes pour lesquels la fonction d’énergie est réduite à une estimation du terme de Van der Waals (Canutescu et al., 2003; Xiang and Honig, 2001), soit la précision en utilisant des fonctions d’énergie issues de champs de force et souvent couplées à des termes statistiques (Mendes et al., 2001; Peterson et al., 2004).

1.6 Fonctions de score développées pour le design automatique et semi-