• Aucun résultat trouvé

Transformation des faits en éléments du réseau

C- Données expérimentales

III- Visualisation des réseaux

2- Transformation des faits en éléments du réseau

La transformation des faits en réseau est réalisée en deux étapes. Tout d’abord, il faut représenter les nœuds du réseau (molécules), puis les liaisons entre les molécules grâce aux faits initiaux ou déduits.

Molécules : Elles sont, comme dit précédemment, les nœuds du réseau. La Figure 40 présente

la convention de représentation utilisée pour les molécules dans CellDesigner. La classification présentée plus tôt est retrouvée ici. Seules les molécules d’ADN correspondant à des régions régulatrices sont absentes mais dans CellDesigner, il est possible de les ajouter directement sur les gènes (Figure 41).

Pour les protéines, il est possible de visualiser des protéines dites « génériques », et il existe une symbolique particulière pour les récepteurs et les canaux ioniques.

Figure 40 : Convention de représentation utilisée pour la représentation des molécules dans CellDesigner

Figure 41 : Gène représenté avec une région régulatrice

Les molécules sont extraites de la table molecule de la base de données. La représentation graphique est déterminée par la classe de la molécule. Les molécules extraites correspondent aux classes Gène, ARN, Protéine, Petite molécule et Complexe. En revanche, sont exclues les protéines appartenant aux sous-classes Anticorps et Mutant. Sont aussi exclues toutes les perturbations (Inhibiteur, siRNA, Antagoniste) et les agonistes/analogues structuraux. Ces différents types moléculaires sont des ‘outils’ d’aide à la construction du réseau mais n’en font, en réalité, pas partie.

Lorsque les régions régulatrices seront utilisées, elles seront extraites de la même façon. Les protéines sont représentées par la notation correspondant aux récepteurs si le mot ‘receptor’ apparaît dans leur nom complet. Les canaux ioniques ne sont pas apparus dans nos premiers réseaux, mais il sera possible de les visualiser avec la représentation graphique appropriée en cherchant ‘channel’ dans leur nom complet. Pour les protéines modifiées une étape supplémentaire est nécessaire : on les fait apparaître comme des protéines (génériques, récepteurs, canaux ioniques), ensuite la (les) modification(s) ainsi que sa (leur) position sont récupérées dans la table molecule_modificationtype et ajoutées à la visualisation.

Relations : Les faits nouveaux obtenus par inférence sont des relations entre les molécules du

réseau. Cependant, certaines de ces relations ne sont pas incluses dans la représentation graphique car elles ne sont pas pertinentes pour l’étude biologique. En particulier, les relations dont l’effet est nul (noeffect) ne sont pas représentées, de même que les relations impliquant les agonistes, antagonistes et mutants car ces molécules ne font pas réellement partie des réseaux. En effet, les faits qui démontrent la présence de ces relations sont nécessaires au raisonnement, mais ne sont pas utiles à la compréhension du système. En ce qui concerne les prédicats convertibles en schémas CellDesigner, la Figure 42 illustre quelques exemples.

Figure 42 : Exemples de prédicats convertis en représentation graphique CellDesigner

ECO : Effet sur la complexation, TLE : Effet sur la traduction

Légende des représentations graphiques :

Un code couleur a été mis au point pour mettre en évidence les différents statuts et distances. Relations confirmées :

• Si la relation est indirecte, elle apparaît en pointillés noirs,

• Si la relation a une distance inconnue, elle apparaît en pointillés verts,

• Si la relation est admise (issue du savoir de l’expert mais pas inférée à partir de faits expérimentaux), elle apparaît en parme.

Relations hypothétiques :

• Si la relation est directe, elle apparaît en trait continu bleu,

• Si la relation est indirecte, elle apparaît en pointillés bleus,

• Si la relation a une distance inconnue, elle apparaît en pointillés rouge. Extraction des relations :

Toutes les relations sont extraites de la base de données à partir de la table fact. Dans les cas de modification, transcription et traduction, la relation est extraite à partir des tables

modifiedmolecule, gene_to_RNA et RNA_to_protein respectivement (partie A Figure 43).

Ensuite, l’action d’une molécule sur ces relations est ajoutée si un fait le précise (partie B Figure 43).

Figure 43 : Extraction des relations dans la base de données

Les relations de complexation sont extraites à partir de la table complexmolecule, cette table fait le lien entre les complexes et leurs composants. Ensuite, ces relations sont directement converties en représentation CellDesigner. Si un effet sur une complexation existe, cette régulation est ajoutée sur la complexation concernée. En ce qui concerne les relations de dissociation, la situation est différente car il est possible d’avoir un complexe formé à partir de molécules « isolées » et ce même complexe pourrait se dissocier en, par exemple, deux complexes plus petits. C’est pourquoi, un fait de dissociation est extrait à partir de la table fact et est directement converti en graphique.

Signalisation induite par l’hormone

folliculo-stimulante (FSH)

L’hormone FSH est au cœur du projet de recherche de l’équipe BIOS, c’est pourquoi nous avons choisi le réseau de signalisation intracellulaire déclenché par cette hormone comme modèle d’élaboration de notre méthode automatique d’inférence de réseaux. Afin de valider les capacités de notre méthode à exploiter au maximum les données expérimentales disponibles, mais également dans le but d’estimer ses limitations en termes de taille des réseaux inférés, nous avons cherché à reconstituer le réseau le plus large possible. Les données expérimentales qui ont permis la construction manuelle de ce réseau sont issues de la littérature et résultent de l’analyse de plus de 100 articles. Une partie du réseau ainsi construit a été publiée dans une revue incluse ci-après.

Dans les figures de l’article, les schémas des voies de signalisation (réalisés avec CellDesigner) montrent non seulement les relations du réseau, mais également pour chacune la ou les publications dans lesquelles apparaissent des expériences qui justifient son existence. L’objectif est non seulement de permettre à l’expert qui étudie le réseau de vérifier lui-même l’information, mais également d’évaluer le degré de confiance qui peut être accordé à l’existence de cette relation. Ceci sera particulièrement important dans les perspectives de la méthode automatique.