• Aucun résultat trouvé

1.2 Cadbiom : un formalisme discret pour mod´eliser la signalisation cellulaire . 90

3.1.3 Analyse compar´ee avec les donn´ees de co-expression issues de la base

Afin de confronter nos r´esultats `a des donn´ees exp´erimentales, nous avons choisi GEMMA

qui est `a la fois une base de donn´ees pour les donn´ees d’expression de g`enes haut d´ebits

(puce `a ADN) et un ensemble d’outils pour les m´eta-analyses de ces donn´ees [159].

Ac-tuellement GEMMA contient plus de 4000 jeux de donn´ees dont la moiti´e obtenue chez

l’Homme. Nous avons donc utilis´e l’outil de recherche de co-expression de GEMMA pour

caract´eriser les 787 g`enes de notre mod`ele. Les requˆetes ont ´et´e effectu´ees sur l’ensemble

des donn´ees de l’homme, soit 2234 exp´erimentations. L’outil GEMMA propose une donn´ee

statistique du degr´e de corr´elation (bas´e essentiellement sur le nombre d’exp´eriences). Les

r´esultats sont exprim´es sous forme de tableau de corr´elation o`u chaque g`ene est associ´e `a

la liste de g`enes avec lesquels il a ´et´e retrouv´e co-exprim´e. Nous n’avons conserv´e que les

couples de g`enes pr´esents dans notre mod`ele pour un total de 13210 couples. Chacun de

ces couples est associ´e `a un score GEMMA qui repr´esente le nombre d’exp´erimentations

dans lesquelles les deux g`enes ont ´et´e trouv´es co-exprim´es.

L’id´ee de d´epart est de voir si notre mod`ele est capable de v´erifier les donn´ees de

co-expression et si tel est le cas, pouvoir expliquer les donn´ees exp´erimentales. Dans un

premier temps nous avons s´electionn´e les couples de g`enes co-exprim´e dans Gemma et

re-trouv´es d´ependant d’un terme extracellulaire, c’est `a dire pr´esentant un terme contenant

”exCellRegion” dans leurs solutions. Nous avons recherch´e l’atteignabilit´e des 2 prot´eines

issues des g`enes co-exprim´es, c’est `a dire si il existe au moins une solution capable

d’at-teindreP

1

etP

2

.

Afin de comparer les r´esultats deCadbiomnous avons besoin d’une fonction de score

capable de s’apparenter au score de co-expression pour GEMMA. Pour chaque g`ene nous

disposons de l’ensemble des solutions et donc des trajectoires de propagation du signal. Il

n’existe pas de technique permettant d’exprimer la co-expression en fonction de ce type

de r´esultats. Nous avons par cons´equent d´evelopp´e un score qui bien que empirique, nous

semblait ˆetre le plus proche d’un score de co-expression. L’id´ee est de comparer deux g`enes,

en comparant leur ensemble de solutions qui illustrent les voies de signalisation impliqu´ees

dans la r´egulation de leur expression. Plus deux ensembles de solutions sont proches, plus

les deux g`enes qu’ils r´egulent ont de chance d’ˆetre co-exprim´es. Nous avons compar´e les

solutions 2 `a 2 et d´efini une valeur qui repr´esente leur ressemblance, c’est `a dire le nombre

de places (biomol´ecules) partag´ees par les 2 solutions. Ce score est ensuite pond´er´e par la

probabilit´e de choisir ces 2 solutions parmi les 2 ensembles de solutions. Nous consid´erons

une ´equiprobabilit´e entre toutes les solutions, la probabilit´e de choisir une solution dans

un ensemble densolutions est donc de

1n

. Cette pond´eration s’apparente `a la probabilit´e

que le signal passe par telle ou telle voie de signalisation. De cette mani`ere si deux g`enes

ont une solution tr`es proche dans un grand ensemble de solution, le score associ´e sera

faible. Le score final entre 2 g`enes est ainsi obtenu par la formule :

S

AB

=X

✓

a

i

∩b

j

M ax(a

i

, b

j

)

P

aibj

%

o`uS

AB

repr´esente le scoreCadbiomentre les prot´eines A et B,a

i

etb

j

sont respectivement

lai

eme`

solution de A et laj

`eme

solution de B etP

aibj

la probabilit´e de choisir lai

`eme

solution

de A et laj

`eme

solution de B. Un score nul entre deux prot´eines signifie que les ensembles

de solutions de ces prot´eines sont distincts, sinon elles partagent une ou plusieurs places

et donc potentiellement des voies de signalisation.

En plus du score obtenu comparant les ensembles de solutions de deux prot´eines P

1

et P

2

, nous recherchons l’atteignabilit´e de la propri´et´e (P

1

et P

2

). Deux prot´eines P

1

et

P

2

sont dit co-atteignables si il existe une solution permettant d’atteindre la propri´et´e

(P

1

et P

2

). C’est `a dire que les g`enes codant pour les prot´eines P

1

et P

2

peuvent ˆetre

activ´es au cour d’une mˆeme trajectoire dans notre mod`ele.

En utilisant `a la fois le score de ressemblance, et le test d’atteignabilit´e de la propri´et´e

(P

1

et P

2

), diff´erents cas peuvent ˆetre interpr´et´es et sont r´esum´e dans le Tableau 3.1 en

fonction de leur co-expression dans la base GEMMA.

Nous avons exp´eriment´e cette approche en analysant les couples de g`enes retrouv´es

co-exprim´es dans GEMMA et dont les solutions d´ependent d’un terme extracellulaire soit

649 couples de g`enes (Tableau 3.2). Les g`enes co-exprim´es dans GEMMA sont presque

tous co-atteignables. En effet, seul 1 couple de g`enes n’a aucune solution, et les deux

g`enes partagent des places dans leurs solutions (score non nul) lorsque l’on recherche leur

atteignabilit´e de fa¸con ind´ependante. Parmi ces couples de g`enes co-atteignables une forte

majorit´e (81%) partagent des places dans leurs solutions et par cons´equent des trajectoires

communes. Ces r´esultats sugg`erent que les g`enes co-exprim´es dans GEMMA d´ependent

majoritairement de voies de signalisation communes. Par exemple les g`enes DUSP1 et

FOS retrouv´es fortement co-exprim´es dans GEMMA, sont co-atteignables et les solutions

permettant l’atteignabilit´e des places repr´esentant leurs prot´eines respectives contiennent

des places li´ees `a la voie de signalisation de BMP.

A l’inverse nous avons recherch´e si des g`enes non co-exprim´es dans GEMMA avaient

un profil de signalisation particulier. Pour cela nous avons g´en´er´e une liste al´eatoire de

mˆeme taille que celle utilis´ee pour les couples co-exprim´es, soit 649 couples de g`enes parmi

les g`enes pr´esents dans notre mod`ele et non co-exprim´es dans GEMMA. L’analyse de ces

P

1

et P

2

co-exprim´es dans GEMMA

ScoreCadbiom (P

1

et P

2

) atteignable (P

1

etP

2

) non atteignable

Score = 0 P

1

et P

2

peuvent ˆetre

co-exprim´es dans le mod`ele

Cad-biom mais ne partagent pas

de places donc de voie

com-mune

P

1

etP

2

ne semblent pas

pou-voir ˆetre co-exprim´es dans le

mod`ele Cadbiom. Les

solu-tions de P

1

peuvent inhiber

celles de P

2

ou inversement.

Score6= 0 P

1

et P

2

peuvent ˆetre

co-exprim´e dans le mod`ele

Cad-biomet partagent

potentielle-ment une voie de r´egulation

P

1

et P

2

ne semblent pas

pouvoir ˆetre co-exprim´es

dans le mod`ele Cadbiom.

Les solutions de P

1

peuvent

inhiber celles de P

2

ou

in-versement. Il peut ´egalement

exister une comp´etition

entre les r´egulations

puis-qu’ils partagent des voies de

r´egulations.

P

1

et P

2

NON co-exprim´es dans GEMMA

ScoreCadbiom (P

1

et P

2

) atteignable (P

1

etP

2

) non atteignable

Score = 0 P

1

et P

2

peuvent ˆetre

co-exprim´es dans le mod`ele

Cad-biom. Cependant cette

co-expression n’a pas ´et´e

ob-serv´e obob-serv´ee dans la bases

de donn´ees GEMMA

P

1

et P

2

ne semblent pas non

plu pouvoir ˆetre co-exprim´es

dans le mod`eles Cadbiom.

Score6= 0 P

1

et P

2

peuvent ˆetre

co-exprim´es dans le mod`ele

Cadbiom et partagent

po-tentiellement une voie de

r´egulation. Cependant cette

co-expression n’a pas ´et´e

observ´e dans les donn´ees de

GEMMA.

P

1

et P

2

ne semblent pas

non plus pouvoir ˆetre

co-exprim´es dans le mod`ele

Cadbiom. Cependant il

peut exister une comp´etition

entre les r´egulations

puis-qu’ils partagent des voies de

r´egulations.

Tab.3.1: Interpr´etation des valeurs de score et d’atteignabilit´e dans le mod`eleCadbiom

Co-atteignable Non co-atteignable

Score = 0 123 0

Score6= 0 525 1

Tab. 3.2: Test des couples de g`enes co-exprim´es dans GEMMA et d´ependant d’un terme

extracellulaire

Co-atteignable Non co-atteignable

Score = 0 530 0

Score6= 0 119 0

Tab. 3.3: Test des couples de g`enes non co-exprim´es dans GEMMA

couples est pr´esent´e dans le Tableau 3.3. Les profils observ´es sont diff´erents de ceux issus

des g`enes co-exprim´es. En effet mˆeme si tous les couples sont co-atteignable, les g`enes ne

partagent pas de places dans leurs solutions. D’apr`es notre mod`ele, ces couples de g`enes

ne sont pas incompatibles mais d´ependent donc de voies de signalisation diff´erentes, ce qui

permet d’expliquer qu’ils ne sont pas retrouv´es dans les donn´ees de GEMMA.

En conclusion, cette analyse nous a permis de discriminer des profil de signalisation pour

les 787 g`enes du mod`ele issu de PID en accord avec les donn´ees de co-expression extraites

de GEMMA. La recherche des solutions permettant l’activation de ces g`enes a d´emontr´ee

que notre mod`ele permet de retrouver des solutions pour activer les g`enes co-exprim´es et

que les g`enes co-exprim´es partagent des voies de signalisation communes `a l’inverse des

g`enes non co-exprim´es qui sont r´egul´es par des voies distinctes.

3.2 Interpr´etation de la base de donn´ees Reactome en