3 La transcriptomique La transcriptomique est une discipline qui a pour objet l’étude de l’ensemble des transcrits d’un organisme (organe tissu, cellule) à un temps précis et dans une condition donnée. Les techniques les plus communément utilisées pour réaliser de telles analyses sont les puces à oligonucléotides de type Affymetrix et NimbleGen ou les méthodes de séquençage de nouvelle génération telles que les technologies 454 de Roche ou CRT d’Illumina (Cyclic Reversible Termination). Dans cette partie nous nous focaliserons sur les puces à oligonucléotides NimbleGen et le pyroséquençage 454 qui ont été les techniques utilisées au cours de ce travail de thèse. Les puces à oligonucléotides sont des supports solides sur lesquels sont fixés par synthèse in situ des oligonucléotides qui sont spécifiques de chaque gène prédit au sein du génome de l’organisme considéré. Deux types de puces, développés par les sociétés Affimetrix et NimbleGen, sont actuellement largement utilisés par la communauté scientifique. Les puces ADN développées par NimbleGen comportent l’ensemble des gènes prédits pour un organisme et chacun de ces gènes est représenté par 1 à 5 oligonucléotides différents et indépendants dessinés à partir de la séquence codante de chacun des gènes présents chez l’organisme. La synthèse de ces oligonucléotides (60 paires de bases), s’effectue grâce à un système de miroirs microscopiques capables de focaliser la lumière sur les sites de synthèse des oligonucléotides. Afin d’étudier le niveau d’expression de l’ensemble des transcrits d’un organisme dans une condition donnée par rapport à une condition de référence, les ARN totaux sont tout d’abord extraits pour chacune de ces conditions. Les ADNc sont ensuite synthétisés à partir de ces ARN totaux, marqués avec un fluorochrome puis hybridés avec la puce. Plus un ADNc sera en proportion importante au sein de la population, plus il va s’hybrider aux oligonucléotides qui lui sont spécifiques et plus l’intensité du signal détecté sera importante. Les intensités mesurées pour chaque gène et dans chaque condition sont ensuite normalisées afin de révéler des différences d’intensités qui reflètent les variations du niveau d’expression des gènes entre la condition testée et la condition de référence. L’inconvénient de cette technique repose sur le fait que ces puces à oligonucléotides ne comportent que les gènes prédits automatiquement et/ou annotés de l’organisme. Les gènes non détectés lors des étapes d’annotation ne seront donc pas représentés sur la puce. Figure 23: Principe du pyroséquençage 454 (Roche). Des adaptateurs sont liés aux extrémités 5’ et 3’ des molécules d’ADN. L’adaptateur A va permettre l’accrochage aux billes qui sont en large excès et qui ne capteront ainsi qu’un seul fragment d’ADN simple brin. Les billes sont ensuite placées dans une émulsion contenant le mélange réactionnel nécessaire à l’amplification des fragments. A la fin de l’amplification, chaque bille contient des milliers de séquences d’ADN simple brin identiques amplifiées à partir d’une seule séquence. Les billes sont ensuite placées dans des microplaques contenant des micropuits ne pouvant accueillir qu’une seule bille. Les fragments amplifiés sur chaque bille sont ainsi séquencés séparément des autres fragments par fixation d’une amorce complémentaire de l’adaptateur B puis par ajout successif d’une base dans un ordre précis (détail Figure 24). Pour chaque base complémentant l’ADN cible, un signal luminescent est émis et enregistré par une caméra CCD. Figure 24: Réaction de pyroséquençage (Adapté de Lamoril et al. 2008; Armougom et Raoult 2009). Le principe de base de cette réaction de séquençage consiste à hybrider une amorce (en rouge) complémentaire de l’adaptateur de l’ADN cible puis à ajouter le mélange réactionnel contenant les enzymes et les substrats nécessaires à la réaction. Les nucléotides sont ensuite ajoutés l’un après l’autre (bases A puis bases C puis bases G puis bases T …) dans le milieu réactionnel et chaque base complémentant la séquence cible aboutit à la libération d’un pyrophosphate (PPi). L’ATP sulfurylase transforme ensuite ce PPi en ATP qui est directement utilisé par une luciférase afin de transformer la luciférine en oxyluciférine. Cette réaction libère de la lumière qui est captée par une caméra CDD (Charge‐Coupled Device) reproduisant l’intensité émise sous forme d’un pic sur le pictogramme. L’apyrase dégrade ensuite les nucléotides non incorporés permettant ainsi le séquençage de nouvelles bases (Lamoril et al 2008). Contrairement aux puces à ADN, le séquençage à très haut débit permet d’avoir accès à l’ensemble des gènes exprimés chez un organisme dans une condition donnée. Seules la profondeur de séquençage et la qualité de l’assemblage peuvent ici limiter l’identification de transcrits d’interêt. Ce type de séquençage présente également un intérêt budgétaire considérable par rapport au séquençage Sanger de première génération. Par exemple, pour une même couverture de génome humain, le coût d’un séquençage Sanger est estimé à plus de 70 fois le coût d’un séquençage nouvelle génération réalisé avec les automates 454 ou Illumina (Metzer 2010). Pour ces raisons, les nouvelles techniques de séquençage sont en plein essor et sont actuellement en train de supplanter l’utilisation des puces à ADN et le séquençage Sanger. Parmi ces techniques de séquençage nouvelle génération, le principe du pyroséquençage a été décrit pour la première fois en 1985 (Ahmadian et al. 2006). Il permet l’analyse d’une large variété d’échantillons tels que l’ADN génomique, les produits PCR, ou encore les ADN complémentaires. Il s’agit d’une méthode permettant d’analyser la synthèse d’ADN cible en temps réel; on parle ainsi de séquençage par synthèse d’ADN (Ronaghi et al. 1998). Certaines sociétés commercialisent des automates de pyroséquençage permettant le séquençage de fragments d’ADN de plus en plus longs. C’est notamment le cas de l’automate 454 développé par la société Roche qui permettait au départ le séquençage de courts fragments d’ADN d’environ 100 puis 250 paires de bases (technologie GS‐FLX) et qui aujourd’hui permet le séquençage de fragments d’ADN de 350‐400 paires de bases (Technologie GS‐FLX‐Titanium). Le pyroséquencage réalisé avec l’automate 454 est illustré dans la figure 23 et la réaction de séquençage est présentée dans la figure 24. Figure 25: « Feuille de route » pour l’identification d’effecteurs et de leurs cibles (Adapté de Alfano 2009). L’organigramme montre les différentes approches utilisables pour identifier des effecteurs (blanc), leurs cibles (vert clair) et la fonction de leurs cibles (vert foncé). Les étapes (initiale, intermédiaire et finale) sont indiquées en rouge sur l’organigramme. Les rectangles jaunes représentent les comparaisons qui peuvent être réalisées après avoir dressé le catalogue des effecteurs potentiels ou après avoir identifié la cible de l’effecteur. Les lignes reliant les différents rectangles indiquent qu’une combinaison de plusieurs approches peut être utilisée afin d’identifier les effecteurs et leurs cibles. Le rectangle ‘Screen de détection des effecteurs’ correspond à la fusion d’un effecteur candidat avec le signal de sécretion de type III d’un effecteur bactérien permettant ainsi l’injection de l’effecteur dans la cellule hôte via la bactérie et son système de sécrétion de type III (Sohn et al. 2007). Les approches utilisées au cours de cette thèse sont repérées par un cadre orange. Dans le document Contribution à l'étude des déterminants génétiques impliqués dans le processus infectieux de Melampsora larici-populina, l'agent de la rouille foliaire du peuplier (Page 77-81)