• Aucun résultat trouvé

A. Acq uisition d u m atériel b iologique

1. Protocole utilisé

Le FAIRE est un protocole perm etta nt l’extractio n des régions chromatinie nnes accessibles du génom e. D ans le cadre du protocole utilisé au cours de ma thèse, les tissus co ngelés s ont tout d’abord pulvérisés da ns de l’azote liquide , p uis subisse nt une lyse cellulaire et un broyag e fin des tissus. Ces étapes sont s uivies d’une fixation au formald éhyde créant d es liaisons covalentes entre AD N et protéines par la formation de ponts méthylène. Cette fixation est ensuite s topp ée par ajout de glycine, et la chromatine ainsi fixée est fragme ntée par sonication. Une partie de cette chrom atine soniq uée est utilisée pour l’extraction d’AD N FAIRE. D ans ce cas, la chromatine soniq uée est directe me nt extraite à l’aide de p hénol-chloroform e , permetta nt d e sépare r l’AD N libre dépourvu de nucléosom es (p hase aqueus e) d e l’AD N ferm é, constitué d’AD N et d e protéines (p hase orga nique). L’AD N libre ains i obtenu co rres pond à l’AD N FAIRE. L’autre partie de l’AD N soniqué est utilisée pour l’extractio n de l’AD N C ontrôle, celui-ci corres pondant à l’ens e mble de l’AD N génom ique (ferm é et ouvert). C et AD N Contrôle est obtenu par une annulation de la fixation au form aldéhyde, notam m ent par une dég radatio n des protéines à l’aide d e protéinase K , puis par une extraction a u phénol-chloroform e où l’ens em ble d e l’AD N géno m ique est extrait (Fig ure 23).

IV. Matériel et M éthode s B. Form ald ehyd e Assiste d Isolation of Regulatory Elem ents suivi d ’un séquenç age haut-déb it (FAIRE-seq )

IV. Matériel et M éthode s B. Form ald ehyd e Assiste d Isolation of Regulatory Elem ents suivi d ’un séquenç age haut-déb it (FAIRE-seq )

Les extractions FAIRE ont été réalisées dans les deux volets de cette thèse s elon le protocole décrit pour des tissus congelés par [Simon et al., 2012] a vec certains para mètres optimisés a u sein du laboratoire pour notre mo dèle. Les tiss us ont d'a bord été broyés à l'aid e d 'un Biospec Bio-pulve rize r et ont e nsuite été fixés pa r addition de 3% d e formald éhyd e (T hermo Scie ntific Pierce) pe nda nt 8 m in. La fixation est arrêtée par a ddition de g lycine à 125 m M. Suite au rinç a ge et à la suspension d es culots, les tissus sont broyés avec un T issue Lyser Q iag en e n utilisant d es billes m étalliq ues Q iage n, p endant cinq cycles de 5 minutes , chacun étant inte rrom p u pe ndant 2 min. Les étapes de sonication sont effectuées en utilisa nt u n Bioruptor Plus D iagenode penda nt 12 cycles de 30 se co ndes, chac un éta nt interrom pu p endant 30 se condes. Les étapes d 'extra ction au phénol chloroforme sont effectuées en utilisant d u p hénol-chloroform e Sigma . Suite à son extraction, l'AD N de FAIRE e st purifié e n utilisa nt un kit C hIP D NA Clea n & C oncentrator (Zym o). E nfin, l’AD N FAIRE et C ontrôle sont q uantifiés en utilisant un Q ua ntus de Prom ega avec le kit Q uantifluor dsD NA. La reproductibilité des réplicats a été évaluée avant le séque nç a ge en calculant le ra pport FAIRE / Control [Simon et al., 2012] selon la formule suivante :

Ratio FAIRE =

ï   ï   ô

2. M éthodes d ’analyse bioinform atique de données FAIRE-seq

a. Construction d es ban ques et dispositif de séq ue nç age

Un protocole de séque nç age et de construction d es banques similaire a été utilisé pour les exp érim e ntations d es de ux chapitres d e ce tte p rés ente thèse (comp ensation de d ose et polyphénis me de repro duction), en utilis ant un kit de préparatio n des ba nq ues T ruSeq C hIP Illum ina, ainsi q u’une sélection de la taille des fragm ents par le kit AMPure X P Beads Beckma n Coulter. Conce rna nt la com pe nsation de dose, les banq ues FAIRE-s eq d ’individ us m âles ou fe melles asexuées ont été séquencées en paire d-e nd avec des lectures de 100 nucléotides chacu ne. L’ens em ble d es banq ues FAIRE et Contrôles, c’est-à-dire 3 banques FAIRE mâles, 3 banques FAIRE femelle s asexuées, 1 banque Contrôle m âles et une ba nque Contrôle fem elles ase xuées , ont été séq ue ncées sur une m êm e piste d’une cellule à flux a u s ein d’un a ppareil H i-seq 2500 (Figure 24). Chaq ue piste d’une telle ce llule à flux prod uis ant en théorie e nviron 360 m illions de lectures, ce protocole aurait perm is la prod uction d’e nviron 45 millions de le ctures pour chacune des 8 banques. Concerna nt le FAIRE-seq de la partie polyphénis me de re prod uction, 28 banques ont été constituées com prena nt pour chacu ne des 7 conditions (e mb ryons sexués et as exués d e stade 18, 19, 20 et e mbryo ns indiférenciés de stad e 17) 3 réplicats biologiq ues FAIRE par stade embryonnaire e t 1 pool équimolaire d’AD N C ontrôle par s tade em bryonnaire correspond ant aux 3 réplicats biologiques FAIRE. En plus de l’expérim e ntation FAI RE-seq, un séq ue nç age d ’ARN m a été effectué, avec une banque générée po ur chac une des 7 conditions. L’e nsem ble des ba nques FAIRE-seq ont été répartie s s ur 4 pistes de séq ue nç age, tandis q ue les banques RN A-seq ont été réparties sur une piste d e séque nç ag e afin de réaliser un séq ue nç age paire d-end 2x100 nucléotides à l’aid e d’un a ppa reil H i-seq 2500 (Figure 24). C haque piste pro duisa nt

IV. Matériel et M éthode s B. Form ald ehyd e Assiste d Isolation of Regulatory Elem ents suivi d ’un séquenç age haut-déb it (FAIRE-seq )

en m oye nne 360 m illions d e lectures , ce protocole de séqu enç ag e présente une profondeur théoriq ue de 51.4 m illions de reads p ar échantillo n.

b. Contrôle q ualité d es banques et du séq ue nç age

Suite a u s équenç ag e ha ut-débit d es AD N FAIRE et Contrôle, un contrôle q ualité du séq uenç age est effectué avec Fas tQ C (https://ww w.bioinform atics.ba b raha m.ac.u k/p rojects/fas tqc/). Le mapping des banques FAIRE sur le g éno me d u p ucero n d u pois es t réalisé avec bowtie2 [La ngm ea d et Salzb erg , 2012], un prog ram m e d’alignem e nt de frag me nts d’A D N courts single-e nd o u p aired -end , do nna nt égale me nt le nom bre d e fragm e nts alignés sur le génome. SAMtools [Li et al., 2009] est ensuite utilisé afin de ga rd er uniquem ent les fragm ents d ’AD N ne s’alignant qu’une fois dans le g énom e, ainsi q ue les fragm ents d ’AD N avec une qualité d’alignem ent (M APQ , un score déte rminé par bowtie 2) sup érieur à 30. T oujours grâce à SAMtools, les frag me nts alignés sont ens uite triés p ar ordre d e position génom iq ue (tri alp hab étiq ue sur le nom des scaffolds et num ériq ue sur la position de départ d u fragm ent aligné), puis stockés da ns un format BA M co mpressé. L es frag m ents ainsi archivés sont ensuite utilis és par MACS2 [Zhang et al., 2008b] q ui p ermettra de réalise r l’ap pel des régions com portant une accum ulation de fra gm ents d ’AD N FAIRE com parative m e nt aux frag m ents d ’AD N Contrôle.

c. App el des pics

Cette étap e d ’ap pel d e pics est réalisée sur différents types de réplicas : i) les réplicas biologiques originaux, ii) les pseudo-réplicas originaux, iii) les réplicas originaux « poolés », iv ) les pse udo -réplicas originaux « poolés ». Les pseudo -réplicas sont obtenus par un écha ntillo nna ge aléatoire des fragm ents d ’AD N FAIRE séparés e n de ux parts égale s. Les réplicats « poolés » s ont obte nus p ar une addition de l’ens em ble d es fragm ents d ’AD N FAIRE contenus dans chacu n d es rép licas originaux. Une fois les appels de pics appliqués sur l’ense mble de ces réplicas, ID R [K undaje , 201 2] est utilisé afin de classer les pics du plus répétable au m oins répéta ble selon de ux scores , dont l’un est calculé en com para nt l’ap pel de pics des réplicas originaux deux à de ux, et l’autre éta nt calculé e n compara nt l’ap pel de pics des pse udo -réplicas « poolés » et des pseudo-réplicas originaux. C ette étape p erm et ensuite de ne conserve r qu’un ce rtain nom bre de pics répétables au s ein d es réplicas originaux « poolés », selon ces com paraisons. Les régions acces sibles au sein de chacune des conditions étud iées sont ainsi déterminées.

IV. Matériel et M éthode s B. Form ald ehyd e Assiste d Isolation of Regulatory Elem ents suivi d ’un séquenç age haut-déb it (FAIRE-seq )

Fig ure 24 | D ispositifs de séq ue nç age ayant pe rm is de génére r les données analysées dans ma thèse. Le séquenç a ge « Compens ation » correspond à la distributio n au sein de la cellule à flux des AD N FAIRE et Contrôle (C o nt.) o btenus à pa rtir d ’individ us m âles (en ble u) et fem elles as exuées (Fe m . e n rouge). Le séq ue nç age « Polyphénis m e » correspond à la distribution au sein de la cellule à flux des échantillo ns FAIRE, C ontrôle (Cont.) et des ARNm obtenus à partir d’e m bryo ns de stades 17 (T 0, gris), stade 18 (T 1), stade 19 (T 2) et stade 20 (T 3) à re prod uction sexuée (Se x e n rose ) ou asexuée (Asx en orange).

IV. Matériel et M éthode s B. Form ald ehyd e Assiste d Isolation of Regulatory Elem ents suivi d ’un séquenç age haut-déb it (FAIRE-seq )

d. Calcul du signal FAIRE

Un s ignal FAIRE normalisé par la profonde ur de séq uenç ag e et par l’AD N contrôle est enfin calculé à l’aide de de epT ools [Ram írez et al., 2014, 201 6] sur des fenêtres de 10 n ucléo tides, e n utilisant les données de réplicas originaux « poolés ». La no rm alisation par la p rofond eur de séquenç ag e est réalisée entre les AD N FAIRE et Contrôle e n ram ena nt l’écha ntillon aya nt la plus grand e profonde ur d e séquenç ag e au nivea u de l’échantillo n ayant la plus fa ible p rofond eur de s éq uenç age des de ux. Ceci est effectué par le calcul d ’un coefficient m ultiplicatif inférieur à 1 ; ce coefficient est défini pa r le ratio du nom b re total de frag m e nts d’AD N FAIRE et du no m bre total de fra gm ents d ’AD N Contrôle. Les AD N FAIRE étant poolés, leur profonde ur de séqu enç ag e e st systématique me nt plus importa nte q ue ce lle des AD N Contrôles, étant alors de m anière systém atique le numérate ur da ns le calcul de ratio précédem me nt d écrit, p erm etta nt ainsi la com parais on d u signal FAIRE entre plusieurs conditio ns. La norm alisatio n pa r l’AD N C ontrôle est effectuée e n ca lculant tout d’a bord la valeur m oyenne o u maximale de la couverture FAIRE et Contrôle a u se in de ch acune d es fenêtre s de 10 nucléotid es disséminées le long du génome, p uis par la division de la couverture FAIRE par la co uverture Contrôle dans chacu ne de ces fenêtres. C ette étap e es t réalisée après la normalisatio n p ar la profonde ur d e séquenç ag e. Ce s ignal FAIRE perm et ens uite d e définir avec précision et de m anière non-biais ée le niveau d ’accessibilité d e la chromatine le long du génome, p uis autour de points d’intérêts, tels q ue le som met d es pics précéd e m m ent id entifiés ou au niveau des sites d’initiatio n de la transcriptio n. Ce signal FAIRE pe rm et par exem ple d e corréler ouve rture et expression e n re prés e ntant le sig nal FAIRE sus-d écrit au niveau des T SS d es gènes, class és d u plus exprimé a u moins exp rim é. Il s’avère généralem ent que plus un gène est exprimé, plus s on T SS sera accessible, reflétant l’acces sibilité accrue du s ite d’initiation d e la transcription d’un gène exp rim é pour la fixation de la RN AP II au sein de l’ens em ble des cellules dont l’AD N FAIRE a été extraite. D ’autres analyses plus spécifiques pe uve nt être réalisées et seront décrites au sein des articles correspondants , et notam me nt l’obtention, le map ping et l’analyse différe ntielle des données RNA-seq.

V. Chap itre I : Com p ensation d e d ose e t acce ssibilité sexe-sp écifique du ch romosom e X chez Acyrthosip hon p isum

A. Introd uction

V. Chapitre I : C om pensation d e d ose et accessibilité