• Aucun résultat trouvé

Chapitre 1: Introduction générale

2. Etat des lieux des puces à ADN et de leurs méthodes d’analyse

2.6. La partie technique et biologique

2.6.2. Le choix du plan d’expérience

Le plan d’expérience est une des étapes les plus importantes (Churchill , 2002) (Yang and Speed, 2002) (Simon et al., 2002) (Kerr and Chutchill, 2001) (Barrett and Kawasaki, 2003) (Leung and Cavalieri, 2003) dans la mise en place de la mesure du transcriptome et ce, d’autant plus que les puces génèrent de grandes quantités de données qu’il faut ensuite analyser. Malheureusement, cette étape est fréquemment négligée (Kerr and Chutchill, 2001) lors des expériences et se résume souvent au choix d’un protocole expérimental.

Le choix du plan expérimental dépend des questions posées lors de l’expérience et des hypothèses qui en résultent (Kerr and Chutchill, 2001) (Hess et al., 2001). Il comprend : - la détermination des conditions expérimentales étudiées et donc des facteurs pris en compte dans l’étude

- leur agencement.

a) Première étape : définir précisément le but de l’expérience et le(s) facteur(s) d’intérêt

La première question à se poser lors de la mise en place d’une expérience de transcriptome est de définir précisément son but, ce que l’on recherche. Si cette interrogation semble simple en théorie, elle n’est pas si évidente en pratique. Définir précisément quel est le facteur d’intérêt n’est pas une chose aisée. Parfois la question posée correspond à une combinaison de facteurs. Par ailleurs, si le but est de comprendre un mécanisme physiologique particulier, le choix des conditions étudiées influencera grandement les résultats. Ainsi, si des conditions relativement éloignées sont choisies (exemple un type de cancer versus en bonne santé), les niveaux d’expression de nombreux gènes seront affectés : les gènes directement impliqués dans le mécanisme à étudier (gènes impliqués dans le type de cancer) mais aussi l’ensemble des gènes dont les niveaux d’expression ont été affectés par ces fortes différences de conditions physiologiques. Bref, il sera relativement difficile d’identifier les gènes responsables ou impliqués dans un mécanisme précis.

Par ailleurs, quand il y a beaucoup de variations non contrôlées au cours de l’expérimentation, il devient difficile de distinguer des fluctuations aléatoires d’un effet spécifique (Hess et al. 2001). Si l’on cherche à identifier un nombre réduit de gènes responsables d’un mécanisme précis, il est avantageux d’obtenir des profils d’expression relativement proches pour la plupart des gènes. Il faut donc choisir des conditions qui ne font varier que très peu de facteurs et n’impliquent qu’un nombre réduit de gènes.

Dans leur étude sur le mécanisme d’entrée et de métabolisme de deux sources de soufre, Sekowska et al. ont choisi d’étudier le transcriptome dans des conditions très proches, à

savoir la croissance des bactéries dans un milieu contrôlé en présence de méthionine ou de methylthioribose comme source de soufre (au plus une dizaine de gènes impliqués théoriquement). Malgré les conditions contrôlées, de nombreux gènes étaient détectés car le changement de conditions déclenchait leur voie métabolique. Ici la voie de la synthèse de l’arginine a été activée indirectement lors du changement de source de soufre. Les gènes de synthèse de l’arginine ne sont cependant pas impliqués directement dans l’assimilation du soufre. Par ailleurs, l’expérience a révélé le déclenchement involontaire de transitions dans les conditions environnementales avec les cascades de régulations qu’elles provoquent. Ces différences d’expression seraient dues à des différences de températures de la pièce pour la période comprise entre la phase préculture et la phase de croissance. Ainsi, même en choisissant des conditions proches, on retrouve d’autres mécanismes qui se mettent en place indépendamment du phénomène étudié.

De petites différences dans des conditions expérimentales non contrôlées peuvent mener à des différences d’expression de gènes visibles et cohérentes, concernant par exemple les gènes de compétence ou de sporulation. Si l’on avait choisi des conditions lointaines, il aurait été encore plus difficile de distinguer les gènes réellement impliqués dans le mécanisme d’intérêt des gènes annexes.

b) Deuxième étape : choix des autres facteurs pris en compte

Généralement, les facteurs autres que le facteur d’intérêt ne sont pas identifiés en tant que tels. On parle souvent de répétitions ou de réplications. Les réplications ou répétitions des conditions expérimentales sont nécessaires afin de distinguer les variations d’expression présentes par hasard de celles reproductibles et réellement liées au facteur d’intérêt. Sans réplication ou répétition il est impossible d’estimer l’erreur ou le bruit, paramètre nécessaire pour les méthodes d’analyse ultérieures ( Kerr and Churchill, 2001).

Il est possible de distinguer deux niveaux de réplications :

- les répétitions techniques qui correspondent, par exemple, à deux spots du même gène sur la puce ou le même ARNm hybridé sur plusieurs puces ou encore différents protocoles d’extraction ou de marquage. Ces répétitions permettent d’évaluer la variabilité liée au protocole expérimental.

- la réplication vraie ou biologique comme l’ARNm de plusieurs individus, échantillons, spécimens. Cette réplication permet de prendre en compte la variabilité biologique. Les conclusions de l’analyse portent plus sur la population étudiée que sur l’échantillon en particulier. Elle comprend également des réplications de l’expérience à deux jours/ temps

différents afin d’étudier la reproductibilité de l’expérience dans le temps. Les résultats obtenus sont donc plus fiables et reproductibles que si aucune réplication biologique n’avait été réalisée ( Allison et al., 2006). Par rapport aux réplications et aux répétitions, on peut trouver deux types de comportements erronés dans la mise en place des puces. Le premier est de craindre que les différences génétiques n’interfèrent dans les effets du facteur d’intérêt. Ainsi, certains expérimentateurs cherchent à homogénéiser les individus ou échantillons utilisés ou encore à sélectionner une lignée consanguine la plus adaptée au problème étudié. Or l’article de Turk et al. montre que les variations d’expression entre deux lignées consanguines de souris sont relativement faibles. Ceci est rendu particulièrement évident par la comparaison du nombre de gènes différentiellement exprimés entre deux lignées ou entre un tissu atteint d’une maladie et un tissu sain. Ils en concluent que le profil génétique ne devrait interférer que marginalement dans l’analyse du transcriptome. Au contraire, Whitehead et Crawford constatent que dans l’étude d’un groupe de gènes essentiels dans le métabolisme cellulaire (192 gènes), seuls 31% des gènes différentiellement exprimés entre deux tissus sont conservés entre des populations de poissons différentes. Ils en concluent que lorsque l’on fait les mesures sur une seule population, l’observation de différences très significatives d’expression dans certains tissus ne correspond pas nécessairement à des gènes représentatifs des différences fonctionnelles ou morphologiques entre ces tissus. Les grandes variations d’expression entre individus ( Whitehead and Crawford, 2005) montrent qu’il est important d’inclure des replicats biologiques à l’intérieur des groupes de traitement afin d’attribuer des différences d’expression au traitement plutôt qu’à des variations entre individus ou populations. Les gènes détectés indépendamment de l’individu ou de la population expliqueront de manière plus probable les différences fonctionnelles et morphologiques étudiées.

Le deuxième comportement erroné est d’accorder beaucoup plus d’importance aux répétitions techniques qu’aux réplications biologiques. Souvent, on observe des plans d’expérience où il y a de nombreuses répétitions techniques mais peu de réplications biologiques. S’il est naturel d’avoir des résultats différents entre deux individus, on peut trouver plus inquiétant de ne pas avoir le même résultat pour un même échantillon selon le marquage ou la position sur la puce. La question se pose alors de la fiabilité et de la précision des mesures. Actuellement les mesures de puces sont globalement fiables dans la mesure où elles sont reproductibles au sein d’un même laboratoire. Il faut garder à l’esprit que tout comme la biologie, l’instrumentation subit l’influence de facteurs environnementaux et les variations techniques ne sont pas plus étonnantes que les variations biologiques. Si l’accent est mis sur les répétitions techniques au dépend des répétitions biologiques, les résultats obtenus sont alors précis et indépendants de

la technique employée mais ne sont pas forcement généralisables à tout échantillon biologique similaire.

Pour conclure, lors de l’élaboration du plan expérimental, il est donc important de définir les différentes questions posées et de les hiérarchiser entre elles mais aussi de prendre en compte les contraintes matérielles comme le nombre d’hybridations possibles ainsi que les sources de variabilités techniques et biologiques (Churchill, 2002). On classe les facteurs de variations d’expression en trois catégories (Churchill, 2002) :

- la variabilité biologique qui est intrinsèque à tous les organismes et dépend des facteurs génétiques et environnementaux. Elle est évaluée grâce aux différents réplicats

- la deuxième est technique (puce/extraction/ marquage/hybridation). Elle est évaluée grâce aux répétitions techniques

- la dernière est l’erreur de mesure.

Dans une expérience sur l’étude du métabolisme du soufre chez B. subtilis, les sources de variations les plus fortes sont la quantité d’ARNm utilisée pour synthétiser de l’ADNc qui influence plus certains gènes que d’autres (variabilité technique) et la difficulté de reproduire exactement les conditions expérimentales d’une expérience à une autre (jour de l’expérience, variation biologique). Les variations d’expression selon le facteur d’intérêt étaient faibles : cela était souhaité car les différences de conditions ne devaient faire intervenir qu’une dizaine de gènes.

2.6.3. L’agencement des différents facteurs : le plan d’expérience proprement