• Aucun résultat trouvé

B ATPome Promastigote (945)

3.4. Analyses bio-informatiques

Aujourd’hui, l’enjeu principal de cette méthode, développée pour la déconvolution de cible de nos composés, est de déterminer quelles sont les protéines qui ont été capturées via une interaction directe avec l’ATP-Agarose de celles qui ont été co-purifiées via une protéine partenaire capable de lier l’ATP. Il est donc crucial de discriminer ces deux classes de protéines afin de pouvoir valider les cibles de nos composés. A cet effet, j’ai utilisé différents outils bio-informatiques. Parmi les 927 protéines non annotées comme liant l’ATP, 2 groupes de protéines se distinguent : les protéines ayant une fonction connues mais pas de domaine de liaison à l’ATP référencé (567 protéines), et les protéines hypothétiques dont la fonction n’a pas encore été établie (360 protéines). Pour le premier groupe, il est fort probable que la majorité de ces protéines soient co-purifiées via une protéine partenaire capable de lier l’ATP. Toutefois, étant donné le manque d’annotations des protéines dans les bases de données, nous étudions actuellement toutes ces 51

protéines au cas par cas afin de déterminer si elles sont capables ou non de lier l’ATP. De plus, les ATP-Agaroses ont la caractéristique d’exposer la molécule d’ATP de différentes façons (Figure 21A), de sorte qu’il est fort probable que certaines protéines aient pu se fixer à l’un d’eux via le groupement phosphate, le ribose ou l’adénine. En étudiant plus précisément la liste de ces protéines, j’ai rapidement identifié 144 protéines (3 phosphotransferases, 11 protéines de liaison au NAD/NADH, 4 protéines de liaison au FAD/FADH, 17 phosphatases, 2 protéines de liaison à l’adénine, 13 protéines de liaison au GDP/GTP, 8 protéines de liaison a l’ADP et 86 protéines de liaison à l’ADN/ARN) qui pourraient avoir été capturées via ces groupements. Toutefois, il ne s’agit là que d’une partie de ces protéines qui ont pu être analysées, et pour confirmer cette hypothèse il est indispensable de réaliser des expériences supplémentaires.

A propos des protéines hypothétiques, je remarque tout d’abord qu’elles représentent près de 30% des protéines de l’ATPome. Etant donné que chez Leishmania, environ 60% des protéines n’ont pas de fonction clairement établie, il est curieux de ne pas retrouver le même pourcentage dans l’ATPome (Ivens et al., 2005). Il se pourrait donc que ces protéines aient été spécifiquement capturées via un domaine de liaison à l’ATP connu, mais qui n’a pas encore été référencé dans les bases de données, ou alors, via un domaine de liaison à l’ATP spécifique au parasite encore inconnu. Afin de déterminer si ces protéines possèdent un domaine connu, j’ai analysé avec le logiciel Protein BLAST, les 160 protéines hypothétiques ayant était identifiées avec le plus grand nombre de peptides dans l’ATPome. Cette analyse a identifié 59 protéines avec un domaine de liaison à l’ATP ou une fonction ATPase (dont 19 protéines avec un domaine kinase), 2 protéines avec un domaine GTPase, 1 HSP, 73 protéines sans domaine de liaison à l’ATP connu et 25 protéines totalement spécifiques du parasite sans aucun domaine identifié (Annexe 4).

Ensuite, pour les 25 protéines hypothétiques totalement spécifiques du parasite, j’ai analysé leurs séquences protéiques avec le logiciel Phyre2 afin de déterminer si ces protéines possédaient des structures qui pourraient correspondre à des protéines connues (Matériel & Méthode I.4). Cette analyse m’a permis d’identifier 20 protéines avec au moins une structure correspondant à une protéine

capable de lier l’ATP ou avec une fonction ATPase (Annexe 5). Parmi ces protéines, 9 se distinguent des autres car elles possèdent au moins une structure prédite avec une confiance supérieure à 90% (indiquant que ces structures ont une homologie élevée avec le modèle), et/ou un pourcentage d’identité de séquence avec le modèle supérieur à 40%. Bien que Phyre2 ne mesure que la probabilité d'homologie, une confiance et/ou une identité de séquence élevée indique que la protéine a de forte chance de correspondre aux fonctions biologiques des protéines modèles. De plus, si la couverture d'alignement de la structure est élevée, cela augmente encore la probabilité de correspondance de la protéine au modèle. Au final, je n’ai pu valider que la protéine LinJ.31.2340 comme étant une HSPbp1 étant donné qu’elle possède une structure avec 99,1% de confiance qui correspond à 83% de la séquence de cette protéine. Pour les 8 autres protéines validées, il est toutefois fort probable qu’elles soient capables de lier l’ATP, bien que les structures identifiées ne soient pas parfaitement identiques. En effet, il se pourrait que ces protéines possèdent un domaine de liaison à l’ATP dégénéré qui soit spécifique du parasite. Cela pourrait également être le cas des 11 autres protéines identifiées puisqu’au moins huit d’entre elles possèdent une structure avec une confiance >80% et/ou une identité de séquence >30%.

La dernière analyse bio-informatique que j’ai réalisé a pour but de déterminer s’il existe ou non un domaine de liaison à l’ATP inconnu ou dégénéré chez Leishmania. Pour cela, j’ai collaboré avec le HUB bio-informatique et bio-statistique de l’Institut Pasteur, afin de rechercher d’éventuels motifs conservés dans les séquences de l’ensemble des protéines identifiées dans l’ATPome. Cette recherche a été réalisée avec le logiciel MEME (Matériel & Méthode I.4) en recherchant des motifs d’une taille comprise entre 6 et 50 acides aminés existants dans au moins 10 protéines. Cette analyse a permis d’identifier 89 motifs correspondant aux critères de recherche avec parfois plus d’une centaine de protéines identifiées par motif. Ces données très récentes, d’une taille plutôt conséquente, sont toujours en cours d’analyse.

3.5. Conclusion

L’ensemble des résultats obtenus a permis dans un premier temps d’établir le répertoire le plus complet 52

de protéines exprimées chez Leishmania par

protéomique avec près de 60% du génome de L. infantum. Ce protéome me donne également une

base solide pour identifier, analyser et comparer les protéines présentes dans mon ATPome. Dans un deuxième temps, les résultats obtenus, lors des tests d’activité kinase in vitro, ont montré une absence d’activité phosphotransférase dans les surnageants des trois réplicats biologiques de chaque stade du parasite, indiquant que la grande majorité des protéines responsables de ces activités dans les extraits totaux ont été capturées dans l’ATPome. De plus, l’analyse MS a permis d’identifier 19 protéines capables de lier l’ATP dans l’ATPome qui sont absentes du protéome. Ces résultats me permettent donc de valider cette approche utilisant la chromatographie d’affinité à l’ATP successive pour capturer l’ATPome.

L’analyse MS des ATPomes de promastigotes et d’amastigotes axéniques a révélé que 44,8% des protéines de liaison à l’ATP annotées, parmi lesquelles 60,7% des HSPs et 41,2% des kinases identifiées dans le protéome ont été capturées. Toutefois, le pourcentage de protéines de liaison à l’ATP n’est pas définitif étant donné que les bases de données sont extrêmement mal annotées. Pour pallier à ce problème d’annotation, je suis

actuellement en train de déterminer quelles sont les protéines qui fixent ou non l’ATP parmi les protéines

non annotées pour cette fonction. Pour les

578 protéines non hypothétiques, j’effectue une analyse manuelle afin de déterminer si elles se lient ou non à l’ATP. Pour les 360 protéines hypothétiques des analyses bio-informatiques plus poussées sont nécessaires. A ce jour, les analyses bio-informatiques de 160 protéines hypothétiques m’ont permis d’identifier 59 protéines capables de lier l’ATP et 20 autres qui en sont très probablement capables. Toutefois, afin de valider ces résultats, il est indispensable de valider expérimentalement leur capacité de lier l’ATP. Dans ce but, je suis actuellement en train de cloner 20 protéines hypothétiques afin de produire les protéines recombinantes qui seront ensuite validées ou non par chromatographie d’affinité à l’ATP.

Pour conclure, cette méthode a permis de générer le premier ATPome jamais réalisé chez les Trypanosomatidae, et bien que la discrimination des protéines qui ont été spécifiquement capturées de celles qui ont été co-purifiées ne soit pas terminée, cette approche nous fournit un outil solide et reproductible pour réaliser la déconvolution de cibles de composés leishmanicides.

Détermination de la spécificité des composés issus des criblages