• Aucun résultat trouvé

CHAPITRE III DETECTION DES STADES DE DEVELOPPEMENT

N/A
N/A
Protected

Academic year: 2021

Partager "CHAPITRE III DETECTION DES STADES DE DEVELOPPEMENT"

Copied!
12
0
0

Texte intégral

(1)

CHAPITRE III

DETECTION DES STADES DE DEVELOPPEMENT

1. INTRODUCTION

Le développement des organismes eucaryotes supérieurs est séparé en plusieurs phases de développement, du stade embryonnaire au stade adulte, lesquelles sont parfois, comme chez la drosophile, séparées par d’autres stades, tels que les stades de larve et de pupe. Dès lors, nous avons voulu savoir si le passage d’un stade de développement à un autre induisait un changement visible dans les profils d’expression et s’il était possible de détecter les limites des stades de développement sur la base uniquement des profils d’expression.

Par ailleurs, lorsqu’un organisme subit une perturbation externe, telle qu’un changement abrupt de température, un stress oxydant ou l’ajout de certaines molécules, celle- ci peut déclencher une réponse précise dans l’expression des gènes.

Dès lors, nous avons mis au point deux méthodes permettant de détecter automatiquement les instants auxquels surviennent des discontinuités dans le comportement des profils temporels d’expression des gènes et nous les avons appliquées à des organismes modèles pour lesquels de longues séries temporelles de données issues de puces à ADN étaient disponibles : la drosophile Drosophila melanogaster, la cione Ciona intestinalis, le ver à soie Bombyx mori, la souris Mus musculus, la bactérie Escherichia coli et la levure du boulanger Saccharomyces cerevisiae. Ces données sont décrites au chapitre II.

L’hypothèse évaluée dans ce chapitre est de voir si les instants d’une série temporelle qui correspondent soit à un changement de stade de développement pour les organismes eucaryotes supérieurs, soit à une perturbation externe, apparaissent de manière visible dans les profils temporels d’expression comme des périodes où les niveaux d’expression subissent des variations importantes. Pour les organismes eucaryotes supérieurs, l’idée est ici d’imaginer que, dans chaque stade de développement, le système tende à approcher un point fixe, un cycle limite ou tout autre attracteur (Furusawa & Kaneko, 2009) et qu’ensuite, une perturbation, interne ou externe, vienne affecter le réseau de régulation de l’expression des gènes et ainsi modifier la trajectoire du système en définissant un nouvel attracteur. Bien sûr, un tel système ne peut être parfaitement robuste et il existe toujours certaines perturbations qui peuvent conduire le système vers des attracteurs indésirables et associés à certaines maladies telle que le cancer (Kitano 2004, Kitano 2007).

(2)

2. MÉTHODES

2.1. Données étudiées

Les séries temporelles publiques étudiées dans le présent chapitre sont de trois types : (1) le développement d’organismes eucaryotes supérieurs, du stade embryonnaire au stade adulte ; (2) la réponse d’un organisme eucaryote unicellulaire à une perturbation externe et (3) le cycle cellulaire d’un organisme procaryote. Elles sont décrites au chapitre II.

2.2. Méthode des polynômes

L’approche de cette première méthode de détection de phases dans une série temporelle de données issues de puces à ADN consiste à identifier le découpage de la série pour lequel la représentation des profils d’expression par une série de polynômes successifs de degré fixé, définis entre ces instants, est optimale.

On fixe tout d’abord un nombre S d’intervalles en lesquels on divise la série temporelle. On suit alors une procédure en trois étapes. (1) Un ensemble κ, composé des S-1 points temporels κI (I=1,…S-1) définissant les limites des S intervalles [ 1,

i i

[

, avec κ0=1 et κS=l+1, est désigné. (2) Le profil temporel d’expression YgI( )k de chaque gène g dans chaque stade I, i.e. le profil Ygκ) entre les instants 1 et

I I

 de la série, est alors modélisé par un polynôme du dème degré ( )

0 I d d g

j I j

P a tgj

. Le calcul des coefficients agjI des polynômes est effectué en interpolant les profils YgI( )k avec une fréquence d’échantillonnage d’un point de mesure toutes les 30 minutes et en utilisant la routine polyfit de la suite logicielle Matlab (2007a, The MathWorks, Inc., Natick, MA, USA) sur ces profils interpolés. Cette étape d’interpolation permet d’apporter des améliorations numériques à la routine polyfit, qui traite mal les données manquantes ou à fréquence d’échantillonnage variable. (3) On évalue pour, chaque gène g et en moyenne sur tout les gènes, l’écart quadratique entre les S polynômes successifs et les profils expérimentaux Ygκ), respectivement notés Pg etP:

 

1

1 2

P

1 1

1 1

( , , ) ( ) ( )

( )

I

I

S I d I

g g

I I I j

S u P Y

S

 

 

 

κ ( ) j gj (III.1)

P P

1

( , , ) 1 h g( , , )

g

S d S d

h

κ κ (III.2)

On répète alors cette procédure en considérant, de manière exhaustive, toutes les manières κ de délimiter les S intervalles dans la série et on identifie celle pour laquelle l’écart quadratique global σP est minimum. Notons que chaque intervalle doit contenir au moins d+1 points pour le calcul des polynômes. On considère ainsi que les intervalles optimaux obtenus correspondent à des périodes pendant lesquelles les profils temporels d’expression des gènes

(3)

peuvent être globalement approchés par un ensemble de polynômes de degré d (un pour chaque gène) et qu’aux instants délimitant ces intervalles, les profils d’expression varient de manière trop importante pour que les polynômes puissent les suivre globalement. Un nouvel ensemble de polynômes permet alors une meilleure reproduction des profils d’expression.

Cette méthode est appliquée aux données du développement de la drosophile et de la cione (voir section 2.1) pour un nombre de stades S=1,…,5 et un degré de polynômes d=1,…,5 et les instants optimaux obtenus sont comparés aux instants expérimentaux κexp des changements de stade de développement.

2.3. Méthodes des distances

L’approche de cette seconde méthode consiste à comparer les profils d’expression des gènes étudiés sur une succession de quelques instants de la série temporelle et d’identifier les périodes au cours desquelles les profils présentent en moyenne une faible similarité.

Pout détecter les changements de niveaux d’expression, il convient de définir une distance D entre deux segments Ygij1 et Ygij2 des profils d’expression

1( )

gk

Y et

2( )

gk

Y des

gènes g et g, contenue entre les instants τi et τj (i<j). Cette distance est choisie symétrique, i.e.

1 2 2 1

( gij, gij) ( gij, ij) D Y YDY Y

1 2

ij

g

) )

, et indépendante à la fois de la valeur moyenne des profils et

des facteurs d’échelle, i.e. et ,

1 2

ij

g g

Y Y 1 2 1 2

( ij, ) (Y Ygij, gij g gij

D D

1 ij2)

g g

DD

1, 2.

ij ij ij

g g

Y Y 1 2

(Y Yij, ( g g

g g

1 2

et g gij sont des paramètres respectivement d’échelle et de translation, identifiés de manière à minimiser la distance D. Cette contrainte d’indépendance aux facteurs d’échelle se justifie par le fait que les niveaux d’expression des gènes sont généralement définis par rapport à une valeur de référence

1 ref( k)

g

Y différente pour chaque gène. La contrainte d’indépendance de la translation des profils permet de mettre sur un même pied les profils d’expression aux formes similaires mais décalées verticalement. La distance D satisfaisant à ces conditions est définie comme suit :

   

1 2 1 2 1

( , ) ( ), ( ) ( ), ( )

ij ij j

g g ij g k g k ij g k g k

k i

D d YYd YY2

Y Y

(III.3) où les profils Ygij1

Yg1( ), (i Yg1i1), , Yg1( )j sont considérés aux l=j-i+1 instants successifs et :

 

 

1 2 2 1 2 1 1 2

2 1 2

1 2 1

1 2

( ), ( ) ( ) ( ) ( ( ) ) et ( ), ( ) ( )

ij ij

ij g k g k g k g g g k g g

ij

g k g g

ij g k g k g k ij

g g

d Y Y Y Y

d Y Y Y Y

     

 

  

(III.4)

Les valeurs des paramètres

1 2

ij

g g et

1 2

ij

g g sont obtenues en minimisant la distance par rapport à eux, comme décrit à l’équation (III.5).

1 2

( gij, gij D Y Y )

(4)

1 2 1 2

1 2 1 2

( , ) ( , )

0 et 0

ij ij ij ij

g g g g

ij ij

g g g g

D D

 

Y Y Y Y

(III.5) On a donc :

2

2

1 2

1 1

2 2

2

1 1

( ) ( )

1 1

( ) ( )

j j

g k g k

k i k i

ij

g g j j

g k g k

k i k i

Y Y

l l

Y Y

l l





 

 

(III.6)

2

2

1 2 2 1

1 1

2 2

2

1 ( ) 1 ( )

1 1

et ( ) ( )

1 ( ) 1 ( )

j j

g k g k

j j

k i k i

ij

g g k i g k k i g k j j

g k g k

k i k i

Y Y

l l

Y Y

l l

Y Y

l l





 

 

 

(III.7)

avec l  j i 1

Pour détecter si des changements importants surviennent dans les profils d’expression de h gènes, la distance entre deux gènes gμ et gν est évaluée, pour chaque paire de gènes {μ,ν}

possible, entre les instants τi et τj, pour une valeur prédéfinie de l. En notant h le nombre total de gènes considérés, on calcule alors la distance moyenne pour toutes les paires de gènes :

1

1 1

2 ( ,

( 1)

h h

l i )

k g

D D

h h   

 

 

 

Y Yj gij avec l  j i 1 et k i2j (III.8)

Cette méthode est appliquée à toutes les données décrites au chapitre II, en considérant des segments des profils d’expression comprenant 3 à 6 instants, i.e. de longueur de segment l=3,…6. Les instants τk obtenus, où Dkl présente le maximum local le plus significatif, indiquent l’instant de perturbation identifié par la présente méthode.

3. RESULTATS

3.1. Méthode des polynômes

Deux organismes sont étudiés avec cette méthode : la drosophile (Drosophila melanogaster) et la cione (Ciona intestinalis). Le Tableau III.1 reprend les instants réels κexp de changement de stade, les instants κ obtenus pour un nombre de stades S=1,…,5 et un degré de polynômes d=1,…,5 et les valeurs de P. Notons qu’un minimum de (d+1) instants est nécessaire dans chaque intervalle pour pouvoir définir un polynôme de degré d. C’est pourquoi la série temporelle de la cione ne peut être considérée pour les valeurs de d et S telles que S.(d+1) > l=18 points de mesure.

(5)

(a) Drosophila melanogaster (b) Ciona intestinalis 67 points de mesure 18 points de mesure

4 stades 3 stades

κexp = {1,32,42,60} κexp = {1,14,15}

d S κ1 κ 2 κ 3 κ 4 σP 1 1 - - - - 1.27 1 2 15 - - - 0.86 1 3 10 15 - - 0.58 1 4 10 15 17 - 0.38 1 5 10 13 15 17 0.24 2 1 - - - - 1.22 2 2 15 - - - 0.63 2 3 12 16 - - 0.32 2 4 10 13 16 - 0.14 2 5 7 10 13 16 0.06 3 1 - - - - 1.15 3 2 15 - - - 0.44 3 3 11 15 - - 0.15 3 4 7 11 15 - 0.05 4 1 - - - - 1.00 4 2 14 - - - 0.29 4 3 9 14 - - 0.07 5 1 - - - - 0.66 5 2 13 - - - 0.20 d S κ1 κ 2 κ 3 κ 4 σP

1 1 - - - - 0.64 1 2 32 - - - 0.48 1 3 27 56 - - 0.39 1 4 10 32 56 - 0.33 1 5 10 47 41 61 0.28 2 1 - - - - 0.58 2 2 32 - - - 0.41 2 3 27 49 - - 0.32 2 4 10 32 56 0.27 2 5 10 28 46 59 0.22 3 1 - - - - 0.56 3 2 32 - - - 0.36 3 3 27 56 - - 0.26 3 4 10 28 56 - 0.22 3 5 10 28 45 58 0.17 4 1 - - - - 0.53 4 2 33 - - - 0.32 4 3 27 56 - - 0.23 4 4 14 33 58 - 0.19 4 5 13 29 45 58 0.15 5 1 - - - - 0.51 5 2 33 - - - 0.29 5 3 28 49 - - 0.21 5 4 15 33 49 - 0.17 5 5 12 33 49 58 0.14

Tableau III.1. Instants détectés par la méthode des polynômes pour un degré d=1,…,5 des polynômes et un nombre S=1,…,5 de stades. (a) Développement de la drosophile ; les instants expérimentaux définissant le début de chaque stade sont κexp={1,32,41,60} (b) Développement de la cione ; les instants expérimentaux définissant le début de chaque stade sont κexp={1,14,15}. Les instants détectés qui correspondent à la fin ou au début d’un stade de développement sont indiqués en gras dans le tableau.

On constate que, pour la drosophile, peu d’instants détectés par la méthode correspondent à la fin ou au début d’un stade de développement. Pour la cione, en revanche, le point de mesure correspondant au stade larvaire est généralement bien détecté comme limite de stade de développement. Dans les deux cas, la méthode a tendance à détecter des changements dans le

(6)

stade embryonnaire. Ce résultat se justifie par le fait que le stade embryonnaire est celui qui présente le plus de variabilité dans l’expression des gènes, il est d’ailleurs généralement subdivisé en sous-stades. Toutefois, une étude de la chronologie de ces sous-stades a montré que pratiquement chaque point de mesure des deux séries étudiées dans le stade embryonnaire correspond à un sous-stade différent. Il n’est donc pas possible de les exploiter avec les séries temporelles étudiées. Enfin, pour chaque valeur de d, on observe que l’écart P augmente avec le nombre S de stades de façon monotone, sans jamais se stabiliser à une valeur constante. Dès lors, il ne semble pas qu’un nombre de stade inférieur à 5 apparaisse a priori comme suffisant pour reproduire les profils.

3.2. Méthode des distances

L’application de la méthode de détection des stades de développement et des perturbations sur les données décrites au chapitre II mène à des résultats particulièrement intéressants. Pour rappel, la distance

D

kl , définie en III.8, est appliquée directement sur les profils d’expression Yg( )k et ce, sans normalisation de notre part. Il en résulte que l’échelle des valeurs prises par

D

kl dépend directement de celle des données d’expression sur lesquelles la méthode a été appliquée, laquelle peut être fort variable en fonction de la nature des données (niveaux d’expression, concentrations en miARN, etc.).

3.2.1. Développement d’organismes eucaryotes supérieurs

Les résultats sur le développement de la drosophile sont représentés à la Figure III.1, pour les 4028 gènes (Figure III.1a) et pour le sous-ensemble de 20 gènes impliqués dans le développement musculaire (Figure III.1b).

a b

l=3 l=4 l=5 l=6

l=3 l=4 l=5 l=6

l

D D

kkl

D

kl

Figure III.1. Distance Dkl en fonction des points de mesure τk, pour le développement de la drosophile. Les valeurs des longueurs l des segments de profils sont indiquées sur les figures, de même que les instant de changement de stades de développement. (a) développement de la drosophile ; (b) développement musculaire de la drosophile.

Points de mesure τk Points de mesure τk

(7)

Les résultats sont très clairs : des pics de Dkl apparaissent entre les stades d’embryon, de larve, de pupe et adulte et ce, pour toutes les longueurs l des segments de 3 à 6. Les deux derniers pics sont les plus significatifs. Comme dans la méthode précédente, des variations d’expression sont également détectées à l’intérieur du stade embryonnaire, lequel passe par plusieurs sous-stades. Le pic le plus haut dans ce stade survient près des instants 17 et 18, ce qui correspond à environs 12h après la fertilisation, à la fin de la fermeture dorsale et au début de l’involution de la tête (Campos-Ortega & Hartenstein 1985). Ce pic est encore plus important pour les profils d’expression des gènes impliqués dans le développement du muscle ce qui peut se justifier par le fait que cette 12e heure de développement correspond à la fin du développement des fibres musculaires, lesquels présentent déjà les caractéristiques des muscles larvaires (Broadie & Bate 1993).

Pour la cione (Figure III.2), un pic de la distance Dkl est visible à partir de l’instant du stade larvaire et atteint son maximum au début du stade adulte. On constate qu’ici aussi, la distance choisie permet de détecter les stades de développement de la série temporelle.

Notons que si plusieurs points de mesure étaient disponibles dans le stade larvaire, ce stade serait probablement détecté indépendamment du stade adulte.

l=3 l=4 l=5 l=6 l

D

k

Figure III.2. Distance Dkl en fonction des points de mesure τk, pour le développement de la cione. Les valeurs des longueurs l des segments de profils sont indiquées sur les figures, de même que les instant de changement de stades de développement.

Points de mesure τk

Dans le cas du développement de la glande mammaire de la souris (Figure III.3a), on observe un grand pic de Dkl entre les stades d’allaitement et d’involution. Dans le dernier stade, on sait que la glande mammaire subit des modifications d’apoptose et de remodelage tissulaire, c’est donc probablement ce phénomène important et soudain qui est ici détecté. Un pic plus petit est également visible pour la longueur de segment de profil l=3. Il est toutefois moins significatif. On constate donc trois phénomènes distincts: les niveaux d’expression des gènes dans la glande mammaire de la souris (1) ne varient quasiment pas lorsque la souris

(8)

devient gravide, (2) varient un peu lorsqu’elle entre en phase d’allaitement (3) varient de manière très significative quand elle passe dans le stade d’involution.

En observant les résultats obtenus pour le développement du poumon de la souris (Figure III.3b), on constate un énorme pic de Dkl à la fin du stade embryonnaire, juste avant le stade postnatal. Ensuite, après le passage par une valeur minimum, un second pic commence à apparaître à la fin du stade postnatal mais reste incomplet car seul un point de mesure est disponible dans le stade adulte. Les changements de stade sont donc également bien détectés pour le développement du poumon de la souris.

a b

l=3 l=3 l=4

l

D

k l

D

k

Points de mesure τk

Points de mesure τk

Figure III.3. Distance Dkl en fonction des points de mesure τk, pour le développement de la souris. Les valeurs des longueurs l des segments de profils sont indiquées sur les figures, de même que les instant de changement de stades de développement. (a) Développement de la glande mammaire de la souris; (b) Développement du poumon de la souris.

La dernière série temporelle du développement d’un organisme eucaryote supérieur concerne le ver à soie (Figure III.4). Le premier pic de Dkl est observé entre les stades embryonnaire et larvaire et le second, entre les stades de larve et de (pré)pupe. Comme pour la série précédente, trop peu de points de mesure sont ici disponibles pour évaluer la distance

D

kl au début de ce stade. Notons que les pics entre les stades de (pré)pupe et adulte apparaissent ici plus tôt pour les femelles que pour les mâles. D’autres expériences sont nécessaires pour déterminer si ce phénomène est général.

(9)

l=5 l=6

l=5 l=6 l

D

k

Points de mesure τk

Figure III.4. Distance Dkl en fonction des points de mesure τk, pour le développement du ver à soie. Les valeurs des longueurs l des segments de profils sont indiquées sur les figures, de même que les instant de changement de stades de développement. La ligne verticale discontinue indique l’instant à partir duquel les mâles et les femelles sont distingués.

3.2.2. Perturbations externes d’un organisme procaryote

Les résultats obtenus pour la diauxie glucose-lactose chez E. coli sont représentés à la Figure III.5. Deux pics apparaissent clairement sur cette figure : un après l’épuisement du glucose et un après l’épuisement du lactose. On constate que, sur la base de la distance Dkl, l’évolution d’un réseau de régulation génique due à un changement de substrat est très similaire à celle observée lors d’un changement de stade de développement.

l=2 l=3

l

D

k

Points de mesure τk

Figure III.5. Distance Dkl en fonction des points de mesure τk, pour la diauxie glucose- lactose de la bactérie. Les valeurs des longueurs l des segments de profils sont indiquées sur les figures, de même que les instant de changement de stades de développement.

(10)

On observe un comportement similaire lorsque la bactérie est soumise à une perturbation brutale. Dans le cas d’un stress oxydant (Figure III.6a), un premier pic de Dkl apparaît juste après la perturbation, un second est observé juste avant la reprise de la croissance cellulaire et un troisième au début de la phase stationnaire.

a b

l=3

l=4 l=3

l=3 l=3 l

D

k l

D

k

Points de mesure τk Points de mesure τk

Figure III.6. Distance Dkl en fonction des points de mesure τk pour le stress oxydant et les perturbations thermiques de la bactérie. Les valeurs des longueurs l des segments de profils sont indiquées sur les figures, de même que les instant de changement de stades de développement. (a) E. coli soumise à un stress oxydant; (b) E. coli soumise à un choc thermique et non perturbée (contrôle).

Les résultats pour la bactérie soumise à un choc thermique sont représentés à la Figure III.6b. Lorsque le choc thermique correspond à une augmentation brutale de température, on observe un grand pic de Dkl juste après la perturbation. La distance augmente à nouveau à la fin de la série temporelle, lorsque la croissance cellulaire reprend. Lorsque le choc thermique correspond à une diminution brutale de température, le pic est beaucoup moins prononcé, ce qui indique que les profils d’expression sont moins modifiés par cette perturbation. Ainsi, pour E. coli, le passage de 37°C à 45°C semble requérir une réagencement plus important des connexions du réseau de régulation que celui de 37°C à 16°C. Notons enfin que lorsque la bactérie n’est pas perturbée, la distance Dkn reste effectivement pratiquement constante (Figure III.6b).

3.2.3. Cycle cellulaire d’un organisme eucaryote unicellulaire

Enfin, afin de savoir si un changement soudain dans l’expression des gènes apparaît pendant ou à la fin du cycle cellulaire, la méthode de détection des variations d’expression de gènes est appliquée à une série temporelle couvrant trois cycles cellulaires de la levure Saccharomyces cerevisiae. On n’observe, à la Figure III.7, aucun changement brusque de la distance Dkl. La distance reste constante pendant le premier cycle et commence à fluctuer très légèrement pendant le deuxième et le troisième cycle, lorsque les cellules commencent à se désynchroniser. Ainsi, on n’observe aucun réagencement des connexions du réseau de régulation après chaque cycle cellulaire, mais plutôt une évolution continue, comme cela a déjà été mis en évidence (Spellman et al. 1998).

(11)

l=3 l=3 l=3

l

D

k

Points de mesure τk

Figure III.7. Distance Dkl en fonction des points de mesure τk, pour trois cycles cellulaires de la levure. Les valeurs des longueurs l des segments de profils sont indiquées sur les figures, de même que les instant de changement de stades de développement. Les trois courbes correspondent aux trois techniques de synchronisation cellulaire utilisées.

4. CONCLUSIONS

La méthode des polynômes s’est avérée peu efficace sur les données du développement de la drosophile et de la cione. Les résultats obtenus pour la drosophile montrent que certains changements de stades de développement peuvent être détectés de cette manière mais pas de manière précise et pas pour tous les stades. Les instants obtenus pour la cione correspondant généralement au changement principal de stade, i.e. le passage par le stade larvaire. Il convient toutefois de nuancer ce résultat par le fait que le plus faible nombre de points de cette série limite les possibilités de découpage de la série en polynômes successifs.

L’analyse des résultats relatifs à la méthode des distances, en revanche, montre que la distance choisie, symétrique et indépendante des paramètres de mise à l’échelle et de translation, est une mesure pertinente pour détecter les perturbations et les changements de stades de développement à partir des profils d’expression. Elle permet d’identifier les instants de la série temporelle auxquels ont lieu des processus importants, tels que les changements de stades de développement ou des perturbations externes, qui provoquent un réagencement des connexions du réseau de régulation génique. Notons que ces résultats concernent tant les données relatives d’une grande partie du génome de l’organisme étudié ou d’un sous- ensemble spécifique de gènes, de gènes relatifs à un organe spécifique ou de moyennes sur tous les organes et d’ARNm ou de miARN (voir chapitre I). Il convient toutefois de signaler que l’efficacité de cette méthode requiert un nombre suffisant de points de mesure dans la série temporelle étudiée.

(12)

Un résultat intéressant est que sans l’information concernant l’instant réel du changement de stade ou de la perturbation, il n’est pas possible de distinguer, à partir des données d’expression issues de puces à ADN, la réponse à une perturbation externe d’une succession de stades de développement. La seule différence observée est que les pics de distances suivent les perturbations alors qu’ils surviennent généralement aux mêmes instants que, ou légèrement avant, les changements de stades. Ce résultat corrobore l’idée que certaines perturbations (connues ou inconnues), externes ou internes, affectent le réseau de régulation génique à la fin de chaque stade de développement et provoquent le changement de stade. Il a été suggéré qu’un système cellulaire pouvait approcher un point fixe, un cycle limite ou un autre type d’attracteur à certains moments précis de sa vie (Kauffman, 1993;

Furusawa & Kaneko, 2009). Cette hypothèse s’avère particulièrement plausible dans le stade adulte, où les profils d’expression sont quasiment stationnaires en l’absence de stimuli extérieurs. On peut dès lors imaginer que ce soit le cas à la fin de chaque stade développement. Bien que la validation de cette dernière hypothèse requière des données plus précises, celle-ci offre une explication simple à la grande robustesse des systèmes cellulaires face aux bruits et perturbations de toutes sortes. En effet, le système n’évoluerait vers un nouvel attracteur que s’il est perturbé d’une manière spécifique.Une fois le système perturbé d’une certaine manière, il évoluerait vers un nouvel attracteur. Il va de soi qu’un tel système n’est jamais totalement robuste et que certaines perturbations spécifiques pourraient mener le système vers des attracteurs indésirables pouvant notamment provoquer l’apparition de maladies cancéreuses.

On propose dès lors d’appliquer le raisonnement inverse en exploitant l’information des instants réels des changements de stade de développement dans une méthode de classification de gènes. La démarche suivie par cette méthode est de regrouper les gènes qui présentent des profils temporels d’expression aux comportements similaires non seulement au cours de la série temporelle complète, mais également dans chacun des stades de développement. Cette approche, développée au chapitre suivant, définit les distances entre profils d’expression en se basant sur les deux méthodes de détections de stades du présent chapitre, i.e. la distance, indépendante des paramètres de translation, entre polynômes successifs et la distance symétrique, indépendante des paramètres de mise à l’échelle et de translation, entre profils d’expression.

Notons finalement que si les instants des changements de stades de développement ne sont pas tous connus, ils peuvent être détectés au préalable par notre méthode de détection de stades de développement. Ainsi, on peut utiliser conjointement les deux méthodes pour obtenir une procédure autonome de classification de profils temporels d’expression de gènes au cours du développement d’un organisme eucaryote supérieur.

Références

Documents relatifs

[r]

COMPETENCES : l’élève doit être capable d’identifier et classifier suivant les différents types de périphériques d’un ordinateur ; d’identifier les causes de

Exercice N° 3 : Intervention pour résoudre le problème :(4points). La

 La lumière se propage dans un milieu transparent et homogène selon des lignes droites.  Un ………lumineux est constitué d’un ensemble des rayons lumineux, et le

Les réels !, $ et % sont appelés coefficients coefficients coefficients de la fonction polynôme. On l’appelle aussi trinôme du second degré. Seul le coefficient a doit être

[r]

[r]

• Choisir une forme adaptée (développée réduite, canonique, factorisée) d’une fonction polynôme du second degré dans le cadre de la résolution d’un problème