• Aucun résultat trouvé

Chapitre II Analyse des interactions protéine-protéine

II.1 Description générale des interfaces

II.1.3 Composition des interfaces

La composition des interfaces peut être analysée de diverses façons, selon son caractère physico-chimique, les types de résidu présents ou conservés au niveau de celle-ci.

II.1.3-A Composition chimique de l’interface

La composition chimique globale de l’interface est très variable d’un type de complexe à l’autre, et même d’un complexe à l’autre [52, 131], comme indiqué figure II-8.

Figure II-8 : Représentation en histogramme de la composition chimique de l’interface, en % de surface, pour différents types de complexes : antigène-anticorps, enzyme-inhibiteur ou autres. Les fonctions chimiques apolaires, polaires neutres et chargées sont différenciées [52].

La surface de l’interface est majoritairement apolaire (en moyenne, ≈55%, de 45 à 70%) et faiblement chargée (en moyenne, ≈15%, de 5 à 25%). En outre, des disparités sont observées concernant les complexes antigène-anticorps, pour lesquels la fraction de résidus chargés est augmentée [52]. De part une variabilité importante, ce critère ne permet pas de caractériser, d’un point de vue général, l’interface formée par deux protéines en contact, quelle que soit leur nature.

II.1.3-B Composition en résidus

Plusieurs méthodes ont été proposées pour estimer la composition en résidus de l’interface. Deux d’entres elles sont fréquemment employées, chacune ayant pour but d’évaluer la propension de chaque type de résidus à être présent à l’interface.

Comparaison « composition interface » / « composition surface ». La première méthode est basée sur le calcul de la surface accessible. Pour chaque résidu, la propension est calculée par le logarithme népérien du ratio de la contribution de chaque résidu à l’ASA totale de l’interface sur

la contribution du même résidu à l’ASA de la surface [52, 139, 138]. Les résultats obtenus pour ces différents travaux sont très homogènes, comme le montre le tableau II-9.

[52] [139] [138] [52] Hétéro- complexes Hétéro- complexes Cœur / Couronne Protéase- inhibiteur Antigène- anticorps Complexes divers ALA - - - / - -- -- - ALA ARG + + + / + + + ± ARG ASN - + - / ± -- + ± ASN ASP - - - / ± -- + - ASP

CYS ++ + +++ / ++ +++ n.a. ++ CYS

GLN - - - / - - - - GLN GLU - - -- / ± - -- -- GLU GLY ± ± ± / + + + - GLY HIS ++ + ++ / + ++ 0 ++ HIS ILE ++ + ++ / + ++ + + ILE LEU + + + / + + - + LEU LYS -- - -- / - -- -- - LYS MET ++ ++ +++ / ++ +++ + ++ MET PHE ++ ++ +++ / -- ++ ++ ++ PHE PRO - - - / - ± -- - PRO SER - - -- / - - -- - SER THR - - - / - - - - THR TRP ++ ++ +++ / + +++ +++ +++ TRP TYR ++ ++ +++ / ++ + +++ ++ TYR VAL ± + ± / + ± -- + VAL

Tableau II-9 : Tableau récapitulatif des propensions, pour chaque résidu, à être préférentiellement à l’interface. Cette propension est calculée par le logarithme népérien du rapport des valeurs de surface accessible au solvant entre l’interface et la surface des protéines. Les valeurs de propension calculées sont simplifiées par un signe en fonction de leur valeur : pour p<-1 → --- ; de -1<p<-0,5 → - - ; de -0,5<p<-0,1 → - ; de -0,1<p<0,1 → ± ; de 0,1<p<0,5 → + ; de 0,5<p<1 →

++ ; et pour p>1 → +++. Les variations notables sont colorées en orange, et en rouge lorsque celles-ci sont importantes. L’analyse des complexes, indifféremment de leur nature (colonnes 2, 3, et 4), montre peu de différences notables. Les différences observées sont notamment dues à la distinction du cœur et de la couronne de l’interface [138] et ne concernent qu’un faible nombre de résidus : Asp, Glu, Gly et surtout Phe. En revanche, la prise en considération du type de complexe, antigène- anticorps, enzyme-inhibiteur ou complexes divers (colonnes 5, 6 et 7 respectivement), donne des résultats plus divergents concernant les résidus Asn, Asp, Gly, His, Leu, Pro et Val dans une large mesure, ainsi que les résidus Arg, Met et Tyr dans une moindre mesure [52].

Comparaison composition interface/composition globale. La seconde méthode rapporte la fréquence (f) de chaque résidu à l’interface à l’abondance moyenne du même résidu, calculée à

partir des protéines contenues dans la Swiss-Prot [133, 145, 146]. La propension par résidu est estimée par l’équation (1) dans le premier travail, et par l’équation (2) dans le second.

(1) P = log [f(interface) / f(Swiss-Prot)]

(2) P’ = [f(interface) / f(Swiss-Prot)] – <f> (fréquence moyenne par résidus, égale à 5%) Contrairement aux travaux précédents, les résultats sont inhomogènes voir opposés, comme en témoignent les figures II-10 et II-11. Ces différences sont importantes pour les résidus Ala, Arg, Asn, Asp, Gln, Gly, His, Phe, Ser, Thr, Tyr et Trp, d’importance moyenne pour les résidus Ile, Met, Pro et Val. Seuls quatre résidus Cys, Glu, Leu et Lys ne montrent pas de différences de propension dans les deux études. Bien que le principe du calcul soit le même dans ces deux travaux, la méthode de calcul diffère. Il n’est de ce fait pas possible de comparer les valeurs absolues des propensions par résidu observées. Cependant, leur signe ne devrait pas différer. Bien qu’une partie des variations observées puisse être expliquée par la méthode calcul, elle ne peut, à elle, seule rendre compte de l’ensemble des différences. La prise en compte globale de divers complexes, indifféremment de leur type [145], pourrait être à l’origine de ces résultats contradictoires, d’autant plus que les résultats du travail effectué par Ofran et Rost sont concordants avec les résultats précédemment décrits [52, 139, 138].

L’ensemble de ces travaux démontre néanmoins que la composition moyenne de l’interface diffère du reste de la surface [138], schématisée sur la figure II-12.

Figure II-12 : Différences de composition selon la localisation des résidus. La composition globale du cœur diffère nettement de celle de la surface des protéines. [138].

La caractérisation de l’interface par la composition en résidus, s’avère néanmoins difficile car le type de complexe et la localisation précise des résidus (cœur ou couronne) sont des paramètres à prendre en compte, comme les résultats, présentés dans le tableau II-9, le démontre.

Figure II-10 : Propension des résidus à l’interface, selon le type d’interface considéré. La fréquence de chaque type de résidu à l’interface (équation 1) est rapportée à la fréquence de celui-ci mesurée à partir de la Swiss-Prot [146]. La figure est extraite de l’article [133].

Figure II-11 : Propension des résidus à l’interface. La fréquence de chaque type de résidu à l’interface (équation 2) est rapportée à la fréquence de celui-ci mesurée à partir de la Swiss-Prot [146]. La figure est extraite de l’article [145].

II.1.3-C Conservation des résidus

La conservation de résidus, au niveau de sites actifs, permet de définir de nombreuses familles de protéines, partageant une même fonction [147, 148,149]. Le maintien d’une fonction semble lié à un ensemble restreint de résidus. Des travaux similaires ont été réalisés, afin d’estimer le degré de conservation de résidus au niveau de sites de liaisons, dans plusieurs familles de protéines identifiées par alignement de leurs séquences primaires [150, 151, 152, 153]. Il a été mis en évidence que ce critère de conservation permettait de distinguer les contacts protéiques, biologiquement relevant, des contacts cristallins, introduis par la méthode de résolution de structure [150]. D’autre part, il semble que les résidus conservés soient regroupés dans l’espace. En revanche, il n’y a pas d’indices quant à leur localisation précise : certains sont proches des sites de liaison, tandis que d’autres participent à la formation du cœur hydrophobe [151]. La conservation de résidus semble participer au maintien de la fonction mais aussi du repliement. Enfin, la conservation de résidus a été comparée, selon leur position à l’interface et à la surface de protéines [152, 153]. Ces deux travaux s’accordent sur le fait que l’interface est plus conservée que le reste de la surface, rejoignant ainsi les observations faites lors de l’analyse de la composition en résidus [138]. Cependant, les résultats diffèrent quant à la possibilité d’utiliser ce critère afin de définir précisément la localisation de sites de liaison. Il apparaît que plusieurs types de résidus sont particulièrement conservés, notamment les résidus polaires ainsi que certains résidus hydrophobe/aromatique tels que Trp, Met et Phe [152, 154]. D’après les auteurs, ces observations permettraient d’améliorer l’identification de sites de liaison. Toutefois, une autre étude estime approximativement à 25%, la probabilité de prédire correctement 50% des résidus de l’interface par ce critère [153].

Ces différentes conclusions peuvent être attribuées à la nature des échantillons utilisés dans ces deux travaux. Les premiers travaux ne prennent en compte que les hétéro-complexes, dont 50% correspondent à des complexes antigène-anticorps. Dans le second, divers complexes sont pris en compte, homo-dimère (65%) et hétéro-dimère (35%), permanent (16%) ou transitoire (19%). L’analyse des résultats de ces travaux suggère que l’on ne peut pas, à l’heure actuelle, compte- tenu de problèmes d’échantillonnage, utiliser ce critère pour identifier et caractériser les interfaces.

II.1.4 Conclusion

L’analyse des hétéro-complexes protéiques permet désormais d’avoir une représentation schématique de l’interface. Leur caractéristique géométrique est standard dans un grand nombre de cas : l’interface est pseudo-circulaire, de taille égale à 1600±400 Ų, et les surfaces mises en contact sont très complémentaires comme en témoigne leur forte compacité. Il s’avère que la complémentarité de forme est un critère général, applicable à toute interface, que nous utiliserons dans notre approche afin de sélectionner les protéines pouvant interagir avec une cible déterminée. Néanmoins, les critères de composition, présentant une grande variabilité, ne peuvent être utilisés afin de discriminer les protéines aptes à interagir avec une cible donnée. Ceux-ci ne peuvent être utilisés dans une approche de conception de ligands, la plus générale possible.