• Aucun résultat trouvé

2.3 Analyse du réseau d’interactions chez Synechocystis

2.3.6 Comparaison avec STRING

La base de données STRING met à disposition des prédictions de rela- tions fonctionnelles entre protéines [von Mering et al., 2003], [von Mering et al., 2005], [von Mering et al., 2007], [Jensen et al., 2008]. Ces relations ne sont pas nécessairement des interactions physiques. En effet, elles proviennent de différentes méthodes de pré- diction comme la co-expression, la co-localisation, la co-citation dans la littérature et l’identification expérimentale. De plus, toutes les relations fonctionnelles prédites sont également transférées, selon le principe des interologues, d’une espèce vers une autre. Ainsi, le transfert des relations identifiées expérimentalement correspond au principe de prédiction que nous avons utilisé.

Cette base de données met à disposition une interface web interactive qui permet d’explorer les interactions prédites pour certaines protéines. Néanmoins, il est difficile d’obtenir des résultats complets à l’échelle d’une espèce comme l’outil InteroPorc le permet. Certes, la base de données peut être obtenue dans le cas d’une utilisation aca- démique dans une version antérieure à celle présentée sur l’interface web, mais il s’agit d’une utilisation plus complexe que l’outil InteroPorc en ligne de commande.

De plus, il est important de noter que la qualité des interactions protéine-protéine prédites dépend largement de la qualité des interactions sources. En effet, une interac- tion peut être détectée expérimentalement alors qu’elle ne se produit pas dans la réalité (faux positif). Si les deux protéines en interaction ont des orthologues dans l’espèce cible, cette interactions pourra être transférée. Ainsi, il est primordial de choisir précisément les interactions sources sur lesquelles va se baser le transfert. L’outil InteroPorc possède à ce sujet l’intérêt majeur d’implémenter la méthode indépendamment des données d’in- teractions sources. Il est donc possible de réaliser des transferts pour différents jeux de données sources. Ceci n’est pas possible avec la base de données STRING.

En définitive, la base de données STRING et l’outil de prédiction InteroPorc sont faits pour des utilisations et des objectifs différents. L’outil InteroPorc est assurément plus restreint puisqu’il ne prédit que des interactions physiques par la méthodes des interologues, mais il présente une utilisation beaucoup plus flexible et plus aisée pour cet objectif spécifique. En particulier, les prédictions sont possible avec InteroPorc pour toutes les espèces contenues dans la base de données Integr8 [Kersey et al., 2005], soit plus de 750 en octobre 2008.

2.3. ANALYSE DU RÉSEAU D’INTERACTIONS CHEZ SYNECHOCYSTIS

Fig. 2.9 – Interactions confirmées expérimentalement. Ce réseau représente les 35 interactions (entre 52 protéines) qui ont été mises en évidence expérimentalement. Ce graphe a été généré grâce au logiciel Cytoscape [Shannon et al., 2003].

'

&

$

% Parmi les 8 783 interactions protéine-protéine prédites chez Synechocystis et

constituant le réseau InteroFull, nous avons extrait 3 496 interactions soutenues par différents types d’information comme les interactions domaine-domaine, les annotations fonctionnelles, la conservation des interologues à travers les espèces, la multiplicité des méthodes expérimentales ayant permis d’identifier les inter- actions sources, ou encore l’identification expérimentale des interactions. Au cours de ce travail de prédiction in-silico d’interactions protéine-protéine, un outil a été développé et rendu disponible par une interface web.

2.4

Développement d’un outil de prédiction automa-

tique d’interactions protéine-protéine

Un outil automatique de prédiction d’interactions protéine-protéine a été conçu, im- plémenté en langage java, puis mis à la disposition de la communauté lors de ce travail de thèse notamment grâce à une interface web. Nous faisons ici sa présentation et montrons quelques exemples d’application.

2.4.1

Introduction

Nous avons déjà vu que les interactions protéine-protéine sont d’un grand intérêt pour l’étude des processus biologiques. Mais les études expérimentales à grande échelle restent très coûteuses, entre autres en temps et en argent. Ainsi, seuls quelques organismes modèles ont pour l’instant des collections de tailles significatives d’interactions protéine- protéine identifiées expérimentalement. Le concept d’interologue est alors très utile pour transférer ces interactions vers d’autres organismes. Comme il a été décrit précédemment (voir page 54), de tels transferts ont déjà été faits pour un petit nombre d’organismes, mais chaque mise en application de ce concept reste manuelle, et les résultats disponibles sont alors des bases de données d’interactions transférées pour certains organismes. Les inconvénients sont, d’une part, qu’un organisme donné n’est pas nécessairement présent dans telle ou telle étude, et, d’autre part, que les données utilisées pour ces transferts ne sont plus modifiables. Même si certains résultats sont disponibles, les transferts sont effectués puis figés.

Il serait alors intéressant d’avoir un outil général plutôt que des bases de données. En effet, une telle application serait d’une grande utilité pour construire les premières cartes d’interactions pour les espèces qui n’en possèdent pas, ou encore pour compléter toute collection d’interactions plus ou moins importante. De plus, une méthode commune pour un grand nombre d’organismes pourrait faciliter grandement les études comparatives qui visent à mieux comprendre l’évolution des réseaux d’interactions à travers les espèces. Enfin, la notion d’outil est de grande importance car on peut choisir les données sources que l’on veut considérer. En effet, les interactions prédites dépendent fortement des interactions sources qui sont utilisées et l’on sait qu’il est difficile de quantifier la qualité des interactions actuellement disponibles.

2.4. DÉVELOPPEMENT D’UN OUTIL DE PRÉDICTION DE PPIS