• Aucun résultat trouvé

CHAPITRE II CAS D’ETUDE

N/A
N/A
Protected

Academic year: 2021

Partager "CHAPITRE II CAS D’ETUDE"

Copied!
6
0
0

Texte intégral

(1)

CHAPITRE II CAS D’ETUDE

1. CAS DÉTUDE PRINCIPAL

En 2002, Arbeitman et al. ont réalisé une expérience au cours de laquelle les niveaux d’expression de 4028 gènes de la drosophile (Drosophila melanogaster) ont été mesurés à l’aide de puces à ADN tout au long de son développement. Cette série temporelle débute à la fertilisation de l’œuf et s’étend sur les 40 premiers jours du développement de l’organisme, en passant par le stade embryonnaire (31 points de mesure sur 24 heures), le stade larvaire (10 points de mesure sur 81 heures), le stade de métamorphose ou de pupe (18 points de mesure sur 111 heures) et finalement le stade adulte (8 points de mesure sur 30 jours) pour lequel les organismes mâles et femelles sont séparés manuellement. Notons que les résultats exposés dans ce travail sont relatifs aux données des drosophiles mâles. L’étude des organismes femelles a également été réalisée mais comme elle n’offre que des résultats similaires à celle des organismes mâles, elle ne sera pas abordée dans ce travail. La Figure II.1 représente les étapes du développement de la drosophile.

Figure II.1 : Développement de la drosophile (Drosophila melanogaster) (http://flymove.uni-muenster.de)

(2)

Les mesures de l’expression des gènes ont donc été réalisées sur 67 points temporels.

L’échantillon de référence utilisé dans cette expérience consiste en un mélange standardisé des ARNm d’échantillons tous stades de développement confondus. Les puces à ADN construites sont utilisées pour mesurer les concentrations en ARNm de chaque gène g dans cet échantillon de référence et dans chaque échantillon de la série temporelle (voir Chapitre I, section 3.1). En notant h le nombre de gènes g étudiés dans cette expérience (g=1,…,h), l le nombre de points de mesure τk de la série temporelle (k=1,…,l),  g( )k

f

l’amplitude du signal obtenu par fluorescence pour le gène g à l’instant τk et gre l’amplitude du signal sur l’échantillon de référence, on définit le taux d’expression relatif Ygk) du gène g à l’instant τk

tel qu’à l’équation (I.7) :

ref ref

[ARNm ]( ) ( )

( ) [ARNm ]

g k g k

g k

g

Y   

 (g=1,…,h et k=1,…,l) (II.1)

Pour rappel (voir chapitre I), cette égalité suppose la linéarité de la relation entre φgk) et la concentration [ARNmg] en ARNm du gène g et ce, à chaque instant τk de la série (k=1,…,l). Pour des raisons pratiques, décrite au chapitre précédent, on utilise parfois le logarithme (en base 2) ygk) du taux d’expression relatif Ygk), défini en (I.8).

Par ailleurs, les échantillons ont été ici pris à partir d’organismes entiers (les drosophiles sont écrasées puis mises en solution avant analyse) et constituent par conséquent une moyenne des niveaux d’expression des gènes à travers tous les tissus de l’organisme. Il en résulte que les données d’expression mesurées reflètent, d’une part, les interactions de régulation entre les gènes et les produits de gènes à l’intérieur de chaque cellule (ce que nous cherchons à modéliser dans ce travail), mais également l’influence des types cellulaires. En effet, les gènes ne sont pas exprimés de la même manière dans les différents tissus. Dès lors, si, dans les données moyennes étudiées, les profils d’expression de deux gènes semblent corrélés, il est important de garder à l’esprit que la déduction d’une interaction de régulation entre ces gènes est tributaire du type cellulaire dans lequel ces gènes sont exprimés.

Néanmoins, étant donné la nature des données étudiées et le grand nombre de types cellulaires présent dans l’organisme étudié, cette considération ne sera pas prise en compte dans la démarche de modélisation mathématique de ce travail.

Notons enfin qu’après examen des données des 4028 gènes, 23 gènes ont été exclus car de nombreuses mesures étaient manquantes, rendant impossible toute étude dynamique de leur expression. Ce travail étudie l’évolution de l’expression des 4005 autres gènes.

Le choix de cet ensemble de données pour ce travail se justifie pour plusieurs raisons.

Tout d’abord, on choisit, dans ce travail, de s’intéresser tout particulièrement au développement des organismes du point de vue de l’expression des gènes. C’est pourquoi il est nécessaire de travailler sur les données d’expression d’organismes eucaryotes supérieurs et non sur celles d’un procaryote ou d’un eucaryote inférieur. Dans cette optique, la drosophile

(3)

s’avère un bon point de départ car cet organisme multicellulaire relativement simple est énormément étudié dans la littérature scientifique. En effet, plusieurs bases de données sont entièrement consacrées à l’étude de la drosophile. Celles utilisées dans ce travail sont la FlyBase (Drysdale et al. 2005) et la Drosophila Interactions Database (Yu et al. 2008).

La FlyBase (www.flybase.org) est la base de données centrale pour l’étude génomique de la drosophile ; elle rassemble à la fois des connaissances biologiques sur l’organisme, permet de suivre son développement complet en images et elle reprend, pour chaque gène, toutes les informations connues et constitue une référence pour plusieurs bases de données plus spécifiques. Cette base de données est utilisée au chapitre IV de ce travail lors de la validation des méthodes de classification.

La Drosophila Interactions Database (www.droidb.org) recense toutes les interactions protéine-protéine, protéine-ADN, miARN-ADN et les interactions dites « génétiques », i.e.

dont on ne connaît pas le mécanisme moléculaire ou qui sont la conséquence d’une cascade d’interactions moléculaires, validées expérimentalement ou prédites à partir de résultats obtenus pour d’autres espèces. Elle sera utilisée au chapitre V de ce travail lors de la validation des modèles développés.

Citons également d’autres bases de données sur la drosophile : FlyMine (www.flymine.org)

base de données générale sur les drosophiles et anophèles REDfly (http://redfly.ccr.buffalo.edu)

base de données sur la régulation de l’expression des gènes des drosophiles FlyTF (www.flytf.org)

base de données sur les facteurs de transcription des drosophiles FlyAtlas (www.flyatlas.org)

base de données sur l’expression des gènes des drosophiles adultes The Interactive Fly (http://www.sdbonline.org/fly/aimain/1aahome.htm)

base de données interactive sur le développement des drosophiles Berkeley Drosophila Genome Project (BDGP) (www.fruitfly.org)

base de données sur le génome de la drosophile Flynet (http://www.jhubiomed.org/perl/flynet.pl)

base de données sur les interactions protéines-protéines

Drosophila PIMRider (http://pim.hybrigenics.com/pimriderext/droso/index.html) base de données sur les interactions protéines-protéines

Par ailleurs, dans le cas de la modélisation du réseau de régulation génique, l’étude du développement d’un organisme, et non pas un organisme dans un état pathologique ou la réponse de celui-ci à une perturbation externe, offre l’avantage de pouvoir considérer que ce système est autonome, c’est-à-dire qu’il se trouve dans des conditions normales qu’aucune

(4)

sollicitation extérieure n’est a priori à intégrer dans le modèle, ce qui simplifie la formulation mathématique de la structure de modèle. Comme on le verra au chapitre V, certaines structures de modèles peuvent contenir des paramètres qui représentent les interactions entre les gènes et produits de gènes avec de petits métabolites cellulaires, tels que des ions.

Toutefois, d’un point de vue macroscopique, ces interactions sont considérées comme internes au système et non pas comme provenant d’une sollicitation de l’organisme étudié. Par conséquent, le système est ici considéré comme autonome dans le cas du développement d’un eucaryote supérieur.

Ensuite, cet ensemble de données parcourant tout le développement de la drosophile, il nous permet de focaliser notre étude tantôt sur la série temporelle dans son ensemble, tantôt sur l’évolution temporelle de l’expression des gènes à travers chacun de ses stades de développement et, finalement, individuellement à l’intérieur de ceux-ci.

Enfin, la série temporelle de cette expérience est celle qui, au début de ce travail, présentait la plus grande densité d’échantillonnage avec 67 points temporels alors que la plupart des séries temporelles issues de puces à ADN contiennent généralement une dizaine de points (exception faite des séries constituées de l’agglomération de nombreuses expériences de différents laboratoires telles que celle présentée sur Caenorhabditis elegans par Kim et al. en 2001). Par conséquent, elle est celle qui apporte le plus d’information sur le caractère dynamique de la régulation de l’expression des gènes.

Cette série temporelle sera ici étudiée, d’une part, en considérant tous les gènes analysés et, d’autre part, en nous focalisant sur un sous-ensemble de 20 gènes identifiés, selon Arbeitman et al. 2002 et Zhao et al. 2006, comme étant impliqués dans le développement musculaire de l’organisme (voir chapitre V, section 3.1).

2. CAS DÉTUDE SECONDAIRES

Les séries temporelles publiques étudiées dans chapitre III sont (1) le développement d’organismes eucaryotes supérieurs, du stade embryonnaire au stade adulte ; (2) la réponse d’un organisme eucaryote unicellulaire à une perturbation externe et (3) le cycle cellulaire d’un organisme procaryote.

1.1. Développement d’organismes eucaryotes supérieurs

Outre la drosophile, citée au point précédent, les organismes étudiés, pour lesquels une longue série temporelle issue de puces à ADN est disponible publiquement, sont la cione Ciona intestinalis, le ver à soie Bombyx mori et la souris Mus musculus.

La série temporelle d’Azumi et al. (2007) suit l’évolution de l’expression de 21,938 gènes de la cione, un animal marin hermaphrodite qui vit fixé sur un support, sur 18 points temporels de cette série distribués sur les 3 stades de développement de l’organisme comme

(5)

suit : 13 dans le stade embryonnaire (17 heures), 1 dans le stade larvaire, et 4 dans le stade adulte (4 mois). Notons que les 18 échantillons de cette série ont été hybridés avec différents échantillons de référence, i.e. la fertilisation de l’œuf pour les échantillons du stade embryonnaire et larvaire et le stade ou sous-stade précédent pour les quatre échantillons du stade adulte, ce qui rendait les profils d’expression incomparables entre eux. Aussi, nous avons recalculé les niveaux d’expression des quatre derniers points de mesure, sur la base de l’hypothèse de linéarité en (II.1), de manière à ce que tous les profils soient exprimés relativement au même échantillon de référence : la fertilisation de l’œuf.

Deux séries temporelles concernent la souris. La première (Stein et al., 2004) concerne le développement de la glande mammaire de la souris et couvre l’expression de 12488 gènes sur 18 points de mesure à travers les stades où la souris est vierge (3 points), gravide (7 points), en période d’allaitement (3 points) et enfin en période d’involution (5 points) au cours de laquelle la glande mammaire subit des processus complexes d’apoptose et de remodelage des tissus. Signalons que les données considérées sont une moyenne sur trois réplicas. La seconde (Mariani et al. 2002) suit l’évolution de l’expression de 6 579 gènes à travers les stades du développement du poumon de l’organisme. Elle comprend 11 points de mesure, 4 dans le stade embryonnaire, 6 dans le stade postnatal et 1 dans le stade adulte.

Le développement du ver à soie comprend les quatre mêmes stades principaux que la drosophile : embryon, larve, pupe et adulte. La série temporelle de Liu et al. (2009) suit l’évolution de l’expression de 106 microARNs sur 41-42 points de mesure au cours de ces quatre stades : 8 dans le stade embryonnaire, 20 dans le stade larvaire, 1 dans le stade de pré- pupe, 10 dans le stade de pupe et 2 ou 3 dans le stade adulte. Les profils correspondent à la moyenne obtenue avec deux réplicas.

1.2. Perturbations d’un organisme procaryote unicellulaire

L’expression des gènes de la bactérie Escherichia coli a été étudiée suite à diverses perturbations externes. D’une part, en exposant la bactérie à deux types de substrats potentiels, on observe le phénomène de diauxie, durant lequel l’organisme épuise d’abord un substrat avant d’utiliser le second. La série temporelle de Chang et al. 2002 suit l’évolution de l’expression de 4 289 gènes sur 17 points de mesure pendant la diauxie glucose-lactose : 3 lors de la croissance avec le glucose, 10 avec le lactose et 4 lorsque le lactose est épuisé.

D’autre part, Jozefczuk, et al. (2010) ont étudié l’évolution de l’expression de 4 400 gènes après perturbation de l’environnement de la bactérie, en particulier suite à une augmentation ou une diminution brutale de la température (8 points) et suite à un stress oxydant, i.e. l’ajout d’espèces réactives oxygénées (Reactive Oxygen Species ou ROS), en l’occurrence le peroxyde d'hydrogène H2O2. Pour chacune de ces perturbations, 3 réplicas ont été utilisés. Leur moyenne est considérée dans ce travail.

(6)

1.3. Cycle cellulaire d’un organisme eucaryote

Trois séries temporelles issues de puces à ADN suivent l’évolution de l’expression de plus de 6000 gènes de la levure Saccharomyces cerevisiae au cours du cycle cellulaire (Spellman et al. 1998). Dans chaque série, les cellules ont été synchronisées d’une manière différente : par ajout du facteur α, ou facteur de nécrose tumorale, une cytokine qui induit l’arrêt du cycle cellulaire, par élutriation (tri des cellules selon leur taille), et par mutation du gène cdc15 qui rend le cycle cellulaire contrôlable par la température. Ces trois séries suivent deux à trois cycles cellulaires (16 points pour l’élutriation, 18 points pour le facteur α, et 25 points pour le gène cdc15).

Références

Documents relatifs

Le contrôle du

Donner les coordonnées de trois points de

a) En déduire que le triangle ACB est isocèle. d) montrer que le triangle OAB est équilatéral. 3) déterminer l'affixe du centre de gravité du triangle ABO. 4) déterminer l'affixe

Calculer la probabilité qu'il n'y ait aucun stylo avec un défaut dans ce prélèvement de huit stylos.. Quel commentaire

 Annexe 7 : Bilans fonctionnels en grandes masses de la société SOCHIMA pour les exercices 2017 et 2018 (à rendre avec la copie)..  Annexe 8 : Tableau de calcul des

Jonathan : La lampe proche de la borne (+) du générateur éclaire plus : elle reçoit du courant d’intensité plus grande. Sophie : L’intensité du courant ne

Ces résultats montrent qu’il n’est pas nécessaire de réaliser le testage des béliers dans une classe particulière bien que l’échelle de classement des

Une variable apparaît dans un langage de programmation sous un nom de variable a peu prés quelconque (voir ci-après), mais pour l'ordinateur il s'agit d'une