• Aucun résultat trouvé

6.2 Modéliser la comparaison de deux protéines : couplage de graphes de

6.2.4 Application des modèles

Le couple S hinobi N injas est destiné à une comparaison approfondie de deux structures protéiques, pour une analyse plus générale se référer à 4. Les heuristiques de comparaison de structures ont fait leurs preuves à travers la littérature, traitant cha- cune un type de cas spécifique,S hinobi N injas permet de pousser plus loin l’analyse en retournant des alignements alternatifs, des combinaisons d’alignement mais surtout s’éloigne du squelette des protéines pour une analyse plus basée sur les propriétés physico- chimiques.

Le modèle atomique s’adresse à la comparaison de surfaces en règle générale, no- tamment à la recherche de sites de liaison.S hinobi ne détecte pas automatiquement la surface des protéines, il est nécessaire d’effectuer cette étape en amont. Nous utilisons vorlume [23], un outil développé par l’équipe ABS2 pour sélectionner les atomes de la surface d’une protéine. Nous l’avons testé sur une instance issue de l’Affinity Benchmark3 suggérée par F. Cazals : 1VFB_AB :C. Cette instance est composée de deux "patchs" correspondants aux sites de liaisons dont il faut mesurer la similarité. Le premier est

2. INRIA Sophia Antipolis

composé de 220 atomes (19 résidus), le second de deux cent atomes (25 résidus). Nous avons obtenu un alignement de longueur 101 pour un RMSDc = 1.4579Å et un RMSDd = 1.20148. Ces résultats étaient concordants avec ceux de nos confrères par conséquent nous conservons ce modèle d’étude dans la liste des pistes d’exploitation.

6.3

Discussion

La représentation de la comparaison de structures en graphe permet de simplement modéliser les différents appariements des structures. Nous avons créé quatre modèles opérationnels, du modèle résiduel standard au modèle atomique en passant par un mo- dèle en F GS. La difficulté ici fut de rajouter des informations physico-chimiques : en effet, si des informations comme le critère d’appartenance à une structure secondaire est assez simple à choisir (les deux éléments appartenant ou non au même type de structure), cela est plus délicat pour d’autres critères comme l’hydrophobicité. Plus exactement la pondération d’un critère par rapport à un autre qui est délicate. Nous avons essayé une méthode binaire où un seul manquement parmi la liste de critère invalidait l’appariement des éléments mais cela s’est avéré trop restrictif. De même nous avions étudié le problème en nous basant sur les matrices de BLOSUM 62 et 80, en choisissant une valeur qui va- lidait ou non une paire mais lorsque nous avions confronté ce critère aux alignements de référence issus de SISY, nous avions observé que soit le seuil était très peu spécifique, soit pas assez et élaguait une partie des paires de référence. Ces résultats tendraient à dire qu’il vaut mieux se concentrer sur des critères de structures mais je les pondère en précisant que le nombre d’alignements de référence était faible, une trentaine, et que le seuil posé est fixe alors qu’il faudrait plutôt passer par un système de probabilités et de pondération au sein du graphe.

Les propriétés physico-chimiques et les fonctions de comparaison de base sont déjà implémentées, elles ne nécessitent que des expériences pour déterminer la meilleure pon- dération possible. C’est pour cela que nous avons prévu des analyses à plus grande échelle, en nous basant sur plusieurs jeux de données comme MALIDUP, MALISAM, pour lesquels nous avons les alignements de référence, mais aussi en nous basant sur des alignements consensuels que nous créerons à partir des résultats d’un ensemble d’outils de comparaison dont entre autres TMalign, MICAN, Dalilite, et SANA.

L’un des moyens de contourner ce problème fut de passer au niveau des F GS, cela augmente la taille du graphe d’alignement mais enlève des contraintes d’appariements liées à la nature des résidus considérés.

L’autre grande force deS hinobi est la génération des arêtes en fonction de critères de distances, ces critères contraignent l’alignement final tant en distance absolue dans l’espace (ce qui permet de travailler sur de la similarité globale ou locale suivant les besoins) qu’au niveau de la déviation globale entre les éléments alignés (RMSDd).

6.4

Résumé du chapitre

S hinobi est un outil polyvalent de modélisation de comparaison de structures. Il permet de comparer des squelettes de protéines, en tenant compte ou non de la position des chaînes latérales mais aussi de comparer les protéines au niveau de leurs fonctions chimiques ou atomique. De plus, la possibilité de choisir la dispersion autorisée des élé- ments, sur toute la protéine ou de manière plus locale, permet d’affiner la recherche. Ainsi cela peut être une comparaison globale des squelettes ou la recherche de sites de liaisons. L’outil, utilisé de manière conjointe avec N injas permet la recherche et la détection de sous-structures communes renvoyées sous forme d’un ou plusieurs aligne- ments. Ces alignements peuvent être composés de paires d’éléments uniques ou bien un élément peut être appareillé plusieurs fois. Ce dernier cas de figure a une application dans les perspectives de recherche de zones complémentaires entre surfaces protéiques.

Recherche de similarités au sein

de structures : Etude de cas

7.1

Introduction

S hinobi N injas (SN) est un couple d’outils pensé pour rechercher des sous-structures similaires au sein de deux protéines. Pour le tester et vérifier sa qualité, nous avons com- mencé par l’utiliser sur une instance composée d’une protéine face à elle-même. Ce simple test a pour but de vérifier que l’outil détecte bien le meilleur alignement. Les résultats ont permis de vérifier que l’alignement optimal était bien trouvé et ont mené en plus à une étude sur les répétitions internes au sein des structures protéiques, décrite dans le chapitre 8. Nous avons ensuite testé notre outil sur des cas d’alignements non linéaires de structures : les cas de permutations circulaires et les cas de charnières. Les deux cas nécessite un choix différent des paramètres d’entrée, car le premier cas sera directement inclus dans un alignement global, mais le second nécessite d’assembler des alignements puisque N injas n’est pas flexible. Enfin, nous avons observé la différence entre nos différents modèles (Cα , Cα Cβ et F GS) et nous nous sommes également intéressés aux résultats potentiels dans le cadre de la comparaison de surfaces.

7.2

Utilisation de

S hinobi N injas : modélisation d’une