• Aucun résultat trouvé

2.4 Développement d’un outil de prédiction de PPIs

2.4.2 Présentation de l’outil automatique InteroPorc

L’outil InteroPorc est accessible grâce à une interface web où il peut être utilisé en ligne ou téléchargé pour une utilisation en ligne de commande. Cette interface web a été développée et est maintenue par Arnaud Martel, du Groupe Informatique pour les Scientifiques d’Ile de France (GIPSI) au CEA.

2.4.2.1 Accessibilité

Cet outil est un logiciel libre. Il est accessible de manière générale par l’intermédiaire d’une interface web6 sous une licence Apache. Il peut être utilisé de différentes manières :

– Directement en ligne grâce à l’interface web

– En ligne de commande grâce à une librairie java contenant toutes les dépendances nécessaires

– En l’intégrant dans un programme java avec la librairie minimale sans les dépen- dances

– En utilisant le code source

Ce programme ayant été développé en langage java, il est utilisable sur toutes les plate- formes.

2.4.2.2 Utilisation de l’interface web

L’utilisation la plus directe, la plus rapide, et sans doute la plus simple, est basée sur l’interface web. Les bases de données sources sont mises à jour régulièrement. Les versions utilisées sont précisées sur la page d’accueil (voir Figure 2.10). Certains résultats sont précalculés pour quelques espèces souvent utilisées comme S. cerevisiae, E. coli, H. sapiens, A. thaliana, C. elegans, D. melanogaster, M. musculus, R. norvegicus ou H. pylori. Les résultats sont alors consultables en ligne et téléchargeables.

Autrement, il suffit de donner l’identifiant de l’espèce souhaitée, et de lancer les prédictions en cliquant sur le bouton run. Cet identifiant est celui de la base de données NCBI Taxonomy [Wheeler et al., 2008]. Les espèces disponibles sont répertoriées sur le site d’Integr87où on pourra trouver cet identifiant (par exemple 1 148 pour Synechocystis

4 932 pour la levure ou 9 606 pour l’homme). Les prédictions sont faites en général en deux ou trois minutes.

Les résultats sont alors disponibles sur une page spécifique qui propose différents fichiers (voir Figure 2.11) consultables en ligne ou téléchargeables :

– Predicted interactions : il s’agit ici de la liste des interactions protéine-protéine prédites par InteroPorc pour l’espèce considérée. Ce fichier est disponible aux

6

InteroPorc http ://biodev.extra.cea.fr/interoporc

7

Fig.2.10 – Page principale de l’outil InteroPorc. Cette image est une copie d’écran de la page principale de l’interface web disponible pour utiliser l’outil InteroPorc à l’adresse suivante http ://biodev.extra.cea.fr/interoporc.

2.4. DÉVELOPPEMENT D’UN OUTIL DE PRÉDICTION DE PPIS

Fig. 2.11 – Page de résultats de l’outil InteroPorc. Cette image est une copie d’écran d’une page de résultats de l’interface web après utilisation de l’outil InteroPorc à l’adresse suivante http ://biodev.extra.cea.fr/interoporc. On trouve ici des fichiers contenant les interactions prédites et les interactions connues. Les interactions sont four- nies dans deux formats standards définis par PSI : un format tabulé MITAB25 et un format XML PSI25-XML. De plus, un fichier récapitule quelques informations sur les interactions source utilisées lors du transfert. Sur la partie droite, on trouve des liens notamment pour télécharger l’outil, afin de l’utiliser en ligne de commande, ou pour consulter ou télécharger le code source. Il est aussi possible de consulter la publication associée [Michaut et al., 2008d] et de contacter les auteurs par messagerie électronique.

formats standards MITAB8 et PSI25-XML9 définis par le consortium PSI 10

[Hermjakob et al., 2004a].

– Known & Predicted interactions : nous ajoutons dans ce fichier les interactions connues pour l’espèce considérée provenant du dataset d’interactions sources. Les deux formats MITAB et PSI25-XML sont aussi disponibles.

– Source interactions transferred : dans ce fichier sont disponibles les interactions sources utilisées lors de chaque transfert. Il s’agit d’un simple fichier texte-tabulé. 2.4.2.3 Utilisation de l’application en ligne de commande

Pour utiliser l’application de manière indépendante, il faut la télécharger en cliquant sur le lien Download binaries, dans la partie droite de l’interface web (voir Figure 2.10). On obtient alors un fichier compressé (interoporc.tar.gz ), qu’il faut donc décompresser et qui contient :

– interoporc.jar : la librairie java,

– readme.txt : un fichier d’informations (reproduit en Annexe F), – user.interoporc.log4j.properties : un fichier de configuration, – LICENSE : le fichier de license Apache.

Différentes options sont disponibles :

usage : Interoporc [OPTIONS] Options :

-o –output-directory <file> Directory where all files will be created -i –mitab-file <file> MITAB File, source interactions

-p –porc-file <file> PORC file, orthologous clusters -x –xml-files If output XML files are required

-m –max-nb-inter-xml <int> Max nb of interactions to generate a XML

-h –help print this message

-l –lof-file <file> use given file for log

-t –taxid <int> NCBI taxonomy identifier of the species

Pour faire des prédictions pour une espèce donnée, le plus simple est de suivre les étapes suivantes :

1. Créer un répertoire pour les prédictions (dir)

2. Déposer dans ce répertoire la librairie java (interoporc.jar)

3. Déposer dans ce répertoire un fichier au format MITAB avec toutes les interactions sources (sourceInteractions.mitab)

4. Déposer également dans ce répertoire le fichier de configuration pour les messages de sortie (user.interoporc.log4j.properties)

8

Le format MITAB est un format texte tabulé.

9

Le format PSI25-XML est un format XML.

10

2.4. DÉVELOPPEMENT D’UN OUTIL DE PRÉDICTION DE PPIS 5. Choisir l’identifiant de l’espèce voulue (taxid)

6. Exécuter dans ce répertoire la commande suivante (voir d’autres exemples dans l’annexe F)

java -ms500m -mx1200m -cp interoporc.jar

uk.ac.ebi.intact.interolog.prediction.RunForOneSpecies -t 1 148 -i sourceInteractions.mitab -l user.interoporc.log4j.properties

Notons que les clusters de protéines orthologues sont téléchargés automatiquement s’ils ne sont pas présent dans le répertoire courant. Le fichier peut également être téléchargé sur le ftp d’Integr811 et donné en argument avec l’option -p. Une fois que l’application

est ainsi lancée, des messages d’information s’affichent au fur et à mesure, et les fichiers de résultats sont créés dans ce répertoire.