• Aucun résultat trouvé

6.3 Résultats

6.3.6 Application des cartes IPOPS rouges à la prédiction de sites d’interaction

Bien que nous n’ayons pas développé les cartes IPOPS pour la prédiction de sites d’interaction, le recouvrement que nous avons observé entre les îlots rouges extraits des cartes IPOPS et les sites d’interaction montrent que ces cartes peuvent être utilisées pour prédire la localisation des sites d’interaction d’une protéine. Afin de pouvoir évaluer les performances de ces cartes pour la prédiction de sites d’interaction, j’ai comparé les performances des cartes IPOPS en tant que prédicteur de localisation de sites d’interaction avec les performances du logiciel JET (200), ainsi que celles obtenues en utilisant la NIP (Normalized Interaction Propensity présentée en section 5.4.6) (166). Pour rappel, la NIP est une méthode utilisée pour prédire les résidus appartenant à un site d’interaction qui repose sur l’estimation de la propension d’un résidu à interagir à partir de calculs de docking arbitraires (voir section 5.4.6) (153,156,159,160,165,166). La philosophie sur laquelle reposent les cartes IPOPS et la NIP est très similaire. La différence principale réside dans le fait que la NIP est centrée sur les résidus de surface où l’on compte pour chaque résidu, le nombre de fois où il a été observé dans une interface d’une solution de docking de basse énergie tandis que les cartes IPOPS sont définies à partir de la projection des centres de masses des solutions de docking. Pour comparer les performances des trois approches, j’ai calculé différentes mesures de performance telles que la PPV (positive predictive value), la spécificité, la sensibilité et l’efficacité (voir section 5.5) pour leur capacité à prédire les résidus des sites d’interaction expérimentaux. Pour cela, j’ai utilisé comme précédemment le calcul du recouvrement entre les résidus des sites d’interaction expérimentaux et ceux prédits respectivement par JET, la NIP ou ceux associés aux îlots rouges des cartes IPOPS (voir section 5.5).

Le tableau 6.2 présente les résultats des trois approches pour la prédiction de sites d’interaction. Nous voyons que la prédiction reposant sur les cartes IPOPS présente une PPV nettement plus élevée que les deux autres approches (tableau 6.2) : 0.55 contre 0.45 et 0.41 pour l’approche fondée sur la NIP et JET respectivement. La spécificité de notre méthode est très élevée (0.92), là aussi clairement supérieure à celles utilisant le calcul de la NIP ou JET (0.73 et 0.63 respectivement). En revanche, la sensibilité de notre approche est bien plus faible avec une valeur de 0.24 contre 0.52 pour la prédiction fondée sur la NIP et 0.59 pour JET. Néanmoins, je rappelle que notre approche repose sur la projection des centres de masse des solutions de docking. Elle est plus adaptée à prédire la localisation d’un site d’interaction que l’ensemble des résidus qui le

composent. Enfin notre méthode possède la meilleure efficacité parmi les trois méthodes comparées : 0.69 contre 0.68 pour la prédiction fondée sur la NIP et 0.62 pour JET.

Ces résultats montrent que JET est la méthode présentant la sensibilité la plus élevée mais au prix d’une spécificité et d’une PPV plus faibles. JET prédit en effet un plus grand nombre de résidus (62 résidus en moyenne par protéine), au prix d’un plus fort taux de faux positifs. La prédiction fondée sur la NIP présente des performances similaires à celles de JET, bien que moins sensible et plus spécifique (49 résidus prédits en moyenne). Notre méthode prédit en moyenne 17 résidus par protéine, un nombre bien plus faible qu’avec les deux autres approches et la sensibilité s’en trouve évidemment affectée. Néanmoins, les points forts de notre méthode résident clairement dans la PPV et la spécificité. Le taux de faux positifs est plus faible avec notre approche.

La spécificité de notre méthode est excellente, cependant il convient de noter que c’est aussi le cas pour de nombreux prédicteurs de sites d’interaction. En effet, il existe un fort déséquilibre entre les classes positives (résidus appartenant à un site d’interaction) et négatives (résidus de surface n’appartenant pas à un site d’interaction) en faveur de la deuxième catégorie. Ce déséquilibre a pour résultat que les prédicteurs de sites d’interaction présentent souvent une spécificité élevée et une bonne sensibilité malgré une faible PPV. Nous pensons qu’avoir une bonne PPV est déterminant pour la prédiction de sites d’interaction dans la perspective d’expériences de mutagénèse dirigée, de docking sous contraintes ou de design de nouvelles interactions. En effet, avoir une fraction de faux positifs la plus faible possible permet d’augmenter les chances de réussite de l’expérience qui en découlera. Selon le type d’application envisagé, avoir une bonne PPV peut se révéler plus intéressante qu’avoir une très bonne sensibilité. Dans le cas du docking sous contraintes (les contraintes sont généralement utilisées pour réduire l’espace conformationnel de recherche, voir introduction section 2.2.3.1), avoir une liste de quelques résidus prédits avec confiance pour guider la procédure de docking est plus avantageux qu’une grande liste de résidus mais comprenant un fort taux de faux positifs.

Tableau 6.2: comparaison des performances de IPOPS, JET et la NIP (voir sections 5.4.6, 5.4.7 et 5.5 pour les méthodologies employées)

PPV sens spe ACC

Tout îlots rouges 0.53 0.24 0.9 0.69 Îlots rouges

ubiquitaires

0.55 0.22 0.92 0.69

NIP 0.45 0.52 0.73 0.67

JET 0.41 0.59 0.63 0.62

- Tout îlots rouges : prédiction de sites d’interaction faisant usage des îlots rouges ubiquitaires et spécifiques

- Ilots rouges ubiquitaires : prédiction de sites d’interaction faisant usage des îlots rouges ubiquitaires

- NIP : normalized interaction propensity. Les scores ont été calculés avec la définition des résidus de surface et d’interface aboutissant à la plus haute efficacité (Δrsa > 0, rsa = 5), seuil NIP = 0.1 - JET : les scores sont calculés avec les paramètres suivants : seuil JET = 0

J’ai montré que notre approche peut être utilisée pour la prédiction de résidus de sites d’interaction protéiques. Pour aller plus loin, il conviendrait de comparer notre méthode avec plus de méthodes de prédiction de sites d’interaction, tel que dans (215). Il faut aussi tenir compte du temps de calcul de notre méthode. En effet, tout comme la méthode reposant sur le calcul de la NIP, notre méthode repose sur des calculs de docking arbitraire. Ici, nous avons défini les cartes IPOPS de chaque protéine à partir du docking de cette protéine et 100 protéines arbitraires. Ainsi, le temps de calcul nécessaire pour obtenir une carte IPOPS est conséquent (plusieurs dizaines d’heures avec un jeu de 100 ligands). Dans la perspective de proposer une utilisation en routine de notre méthode, j’ai analysé l’influence de la taille du jeu de ligands sur la variabilité des cartes IPOPS.

6.3.7 Influence de la taille du jeu de ligands sur la variabilité des