• Aucun résultat trouvé

Tessellation de Voronoï non pondérée

3 Volume des cellules : influence des points et de la pondération

3.1 Tessellation de Voronoï non pondérée

Figure 53 : Influence des points de TdV sur le volume des cellules A gauche : Cα et CGL

A droite : Cα et CG

La Figure 53 représente les volumes moyens des cellules pour chaque type d’AA en fonction des volumes calculés atome par atome par Pontius22, pour une TdV non pondérée. Le cas des tessellations sur les Cα est représenté sur les deux graphes et on constate que le volume des cellules ne varie pas beaucoup en fonction des AA. Pour ces cellules, la moyenne est de 142.6 Å3 avec un minimum de 132.9 Å3 pour la cystéine (C) et un maximum de 150.4 Å3 pour la leucine (L). Si l’on compare l’écart entre ces deux extrêmes (7.8 Å3) et l’écart entre les deux extrêmes des volumes de Pontius (169.7 Å3 entre le tryptophane (W) et la glycine (G)) on constate bien que ces cellules ne sont pas très représentatives des volumes réels occupés par les résidus. Ceci s’explique simplement par la méthode de construction des cellules, en effet les faces qui définissent les polyèdres sont incluses dans les plans médians entre les points sur lesquels s’effectue la TdV. Dans le cas présent, les faces sont donc à mi- chemin entre Cα voisins quelle que soit la taille des AA en présence. Avec cette méthode, un résidu de taille importante peut donc être représenté par une cellule de volume moindre que son volume réel. C’est l’inverse qui se produit pour les petits AA dont les cellules seront artificiellement dilatées. Ceci se retrouve, sur les graphes sur lesquels j’ai représenté la droite

Chapitre 4 : Les cellules

d’équation y = x afin de mieux apprécier cette propriété. Entre 140 et 150 Å3 existe une limite sous laquelle les moyennes se situent au-dessus de cette droite ; pour ces résidus, les volumes moyens des cellules sont supérieurs aux volumes réels des AA. Au-dessus de cette limite, les moyennes se situent sous la droite, les volumes moyens des cellules sont donc inférieurs aux volumes des AA. Il y a ainsi neuf AA dont le volume moyen est plus grand que celui de leur cellules (G, A, S, C, P, T, D, N et V) et onze AA dont le volume moyen est plus petit (E, Q, K, H, M, L, I, F, R, Y et W). En fait, avec une TdV non pondérée sur les Cα, du point de vue du volume, tout se passe à peu près comme si tous les AA étaient de même nature. Sur le graphe de gauche de la Figure 53 sont également représentées les moyennes des volumes pour les TdV non pondérées sur les CGL. Ces moyennes sont supérieures à celles obtenues avec les Cα (moyenne générale de 185.4 Å3) ce qui implique nécessairement qu’avec ce type de

représentation la protéine a un volume plus important ! Ceci s’explique par les positions des centres des sphères de l’environnement. En effet, ces positions varient avec les points sur lesquels on décide d’effectuer la TdV. Dans le cas présent, pour éviter une superposition avec les CGL, les sphères de l’environnement sont éloignées des protéines par rapport aux positions qu’elles auraient occupées si l’on avait conservé les Cα. Les protéines se retrouvent ainsi dilatées ; plus exactement, c’est lors de la TdV sur les Cα que l’on rapetisse artificiellement les molécules. Le volume moyen des protéines avec une TdV sur les Cα est de 24 961 Å3 alors qu’il est de 32 465 Å3 avec les CGL, soit une différence proche de 23% ! Ceci se manifeste donc pour le volume moyen des cellules par une augmentation qui va bien sûr dépendre de la position des résidus dans les protéines. Plus un AA sera exposé à l’environnement plus le volume de sa cellule aura tendance à augmenter (toujours si on le compare à ce qu’il serait avec les Cα). Ceci explique pourquoi cette augmentation n’est pas uniforme. Avec les AA hydrophobes69, 70, elle est à peu près constante (V, L, I, F, M, Y et W) mais avec les non hydrophobes, elle est plus dépendante du volume (S, P, T, D, N, E, Q, K, H et R). La cystéine (C) reste un cas particulier puisque l’augmentation qui lui est associée est plus faible que pour les autres AA. Il est intéressant de remarquer que les résidus dont le volume est supérieur au volume moyen de leurs cellules sont les trois AA hydrophobes contenant des cycles W, F, et Y.

Sur le graphe de droite de la Figure 53 sont aussi représentés les volumes moyens des cellules obtenues avec une TdV non pondérée sur les CG. La moyenne générale est de 160.8 Å3 avec un maximum pour l’arginine (R) à 183.9 Å3 et un minimum pour la glycine (G) de 135.4 Å3 soit un écart de 48.5 Å3, légèrement supérieur à celui obtenu avec les CGL (45 Å3

Chapitre 4 : Les cellules

entre la lysine (K) et la glycine (G)). Comme l’on pouvait s’y attendre, les CG sont un intermédiaire entre les Cα et les CGL. Par exemple, le volume moyen pour la glycine (G) est d’à peu près 135 Å3 pour les CG. Pour les petits AA, la TdV sur les CG se comporte comme pour les Cα, ce qui est logique puisque pour ces résidus, le CG est très proche du Cα (Figure 50). Pour le tryptophane (W), le volume moyen est d’à peu près 181 Å3 pour les CG et les CGL, ce qui s’explique par le fait que pour les plus gros résidus, ces deux points se rapprochent (Figure 50). L’augmentation par rapport aux volumes obtenus avec les Cα est proportionnelle au volume réel des AA, et la distinction entre hydrophiles et hydrophobes est moins marquée, même si elle existe toujours puisque l’arginine (R), la lysine (K) ou l’acide glutamique (E) qui sont hydrophiles sont au-dessus des hydrophobes. Ce plus faible écart entre les deux catégories d’AA s’explique encore par le fait que pour ces résidus aussi, le CG est moins éloigné du squelette que ne l’est le CGL, surtout pour l’arginine (R) et la lysine (K) qui ont des chaînes latérales relativement longues.

On voit donc déjà que le choix des points sur lesquels on effectue la TdV non pondérée a une importance sur les résultats que l’on obtient. Avec les Cα, l’influence de la taille des AA est très limitée, ceci n’est plus vrai avec les CG avec lesquels cette influence se fait nettement sentir, même si les volumes moyens des cellules ne sont pas toujours représentatifs des volumes réels des résidus. Enfin, les CGL permettent de rendre compte à la fois du volume mais également de certaines propriétés physico-chimiques.