• Aucun résultat trouvé

Challenge bioinform atiq ue : des donnée s de qualité m oyenne

Proteic domains

A. pisum and D. melanogaster domain identity

2. Challenge bioinform atiq ue : des donnée s de qualité m oyenne

Les échantillo ns FAIRE m âles et femelles asexués séquencés com portent do nc des ratio FAIRE rep rod uctibles et en accord avec les recomm a ndations trouvées dans la littérature (en moye nne inférieur à 3%) [Simon et al., 201 2]. Ap rès les étap es p erm ettant la co nstruction e t le séq uenç age des banques FAIRE-seq réalisée s à partir de ces échantillo ns, il s’est avéré que l’e nse mble de ces banques contenaient une p roportio n anorm ale d e séquences répétées (T ableau III).

T ab lea u III. Résultats d’a nalyse FastQ C concernant les séq ue nces surrep rése ntées au sein des 8 b anques FAIRE et Contrôle issues de fe melles parthénogénétiques et de m âles entie rs .

. anque A5 b [ e cture s totale s [ e cture s su r-re prése ntée s t roportion de la b anque S ource putative / ouve rture maximale du génome (e n X) Ce me lle t . w1 23 182 414 6 462 747 27.88 TruS e q Adapte r, Lnde x 9 (100% ove r 50b p) 4.28 Ce me lle t . w2 17 442 317 1 347 542 7.73 TruS e q Adapte r, Lnde x 10 (100% ove r 50b p) 3.22 Ce me lle t . w3 20 224 593 3 370 672 16.67 TruS e q Adapte r, Lnde x 11 (100% ove r 50b p) 3.73 Ce me lle t . / ontrôle 13 440 649 1 029 346 7.66 TruS e q Adapte r, Lnde x 12 (100% ove r 50b p) 2.48 a âle w1 20 365 125 2 180 070 10.70 TruS e q Adapte r, Lnde x 8 (97% ove r 36b p) 3.76 a âle w2 9 662 014 2 041 998 21.13 TruS e q Adapte r, Lnde x 8 (97% ove r 37b p) 1.78 a âle w3 25 807 676 1 577 559 6.11 TruS e q Adapte r, Lnde x 1 (97% ove r 35b p) 4.76 a âle / ontrôle 29 596 698 6 392 742 21.60 TruS e q Adapte r, Lnde x 7 (97% ove r 36b p) 5.46

V. Chap itre I : Com p ensation d e d ose e t acce ssibilité sexe-sp écifique du ch romosom e X chez Acyrthosip hon p isum

C. D iscussion

L’analyse FAST Q C a révélé que ces s équences corres p onde nt à des ada ptate urs de séq ue nç age issus des kits T ruSe q Illumina. Ces derniers corresponde nt à des séque nces co urtes d’AD N ligués de part et d’a utres de l’ens em ble des fragm ents d ’AD N FAIRE ou Contrôle lo rs de la construction d es ba nq ues, permettant ens uite le ur séq uenç age s ur d es appareils Illumina de type Hi-s eq. Les adaptateurs doivent représe nter en te mps normal une pro portio n inférie ure à 1% de la to talité des séq ue nces AD N constituant une banq ue de séquenç ag e. O r ici, les adaptateurs de s éque nç a ge représe nte nt au minim um 6.11% et au maxim um 27.8 8% d e la totalité d’une banq ue (Mâle FAIRE 3 et Femelle FAIRE 1, resp ective me nt, T ableau III). C es valeurs correspond e nt à une pe rte éq uivale nte de profonde ur de séquenç ag e pour chacune des banques. Le design e xpérim ental ayant été réalisé afin d’obtenir en moyen ne 45 millio ns de reads par échantillon séqu encé, et e n pe rda nt e n m oyenne 22.4% de la profondeur d e séq ue nç age au sein de cha que ba nque, il e n rés ulte une profondeur d e séq ue nç age réd uite po ur certaines analyses com me l’ap pel d e pics. C eci est de plus accentué par la perte de lectures au cours de leur l’a lignem ent sur le géno me d u pucero n du pois, puisq ue ce sont en moyenne moins d e 10 millions de le ctures q ui ont été rete nue s dans chacu ne des ba nq ues, à l’e xce ption d es banques m âle Contrôle et m âle FAIRE 3 (17.2 et 13.9 millions resp ectivem ent, Figure 26). L’e nse mble des analyses portant su r le signal FAIRE au sein de cet article reposent sur 20.5 millio ns et 23.6 millions de lectures FAIRE chez les fem elles et les m âle s, respective m e nt.

Fig ure 26 | Nom b re d e lectures s ’alig na nt de ma nière unique dans le génom e d ’A. pisum pour l’e ns e mble des ba nq ues FAIRE et Contrôles mâles et fe m elles asexuées. Les pools mâles et femelles corresponde nt à une fusion des FAIRE corrélées, c’est-à-dire les 3 ba nq ues F AIRE fem elles et les banques FAIRE 1 et 3 chez les mâles.

8 738 932 17 230 110 20 539 624 23 601 119

0

5 000 000

10 000 000

15 000 000

20 000 000

25 000 000

U nique ly a appe d re ads

V. Chap itre I : Com p ensation d e d ose e t acce ssibilité se xe-sp écifique du ch romosom e X chez Acyrthosip hon p isum

C. D iscussion

La proportion a norm ale d’a daptate urs est sans d oute révélatrice d’une quantité im portante de dim ères d’ada ptate urs, co rresponda nt à une ligatio n de de ux ada ptate urs sans fragm e nts d’AD N FAIRE ou Contrôle entre ces derniers. Ce type d’a nomalie est s ouvent e xpliqué par une ma uvaise sélection d e la taille d es fragm e nts à séq ue ncer, soit en p re nant des frag m ents d’AD N trop courts forteme nt enrichis en dim ères d’ada ptateurs, soit en utilisant des protocoles de sélection de tailles de fragm ents d’AD N utilisant d es billes et ne com portant pas d’étap es supplém entaires pour l’éliminatio n de dimères d’a daptateurs [Bronner et al., 2009 ; Head et al., 2014].

Ces dim ères faisant g énéralem ent plus d e 100p b, ils peuve nt e n effet être confondus avec d es fragm ents d’AD N FAIRE ou C ontrôle de taille similaire sur des profils quantifiant la concentration de fragm ents d ’AD N en fo nction de leur taille. La s élection de taille ayant été ici e ffectuées à l’aide de billes, un protocole de s élection de taille des fragm e nts d’AD N par gel en ne gard ant que des fragm ents de plus de 200 nucléotides aurait sans do ute pe rmis d’éviter cette concentration élevée en dim ères d ’ada ptate urs, res pons able de la faible couverture d e certaines banq ues. C epe nd ant, ceci n’e xpliq ue pas la très faible couverture de la ba nq ue FAIRE m âle 2 (9.6 millions de lectures), q ui a d’aille urs été d éterm inée comm e non re prod uctible v is-à-vis des d eux autres banq ues FAIRE par ID R (cf IV.B.Fig. 3).

Malgré la faible profondeur de séque nç a ge , nous avons pu étudie r l’accessibilité de la chromatine entre m âles et fe m elles au niveau des a utosomes et d u chro mosome X. Avec d es banques n’ayant p as autant de dim ères d’a daptateurs, une m eille ure profonde ur d e séquenç ag e au rait été obtenue et aurait p ermis d ’id entifie r avec plus d e p récision des régions différe ntielle me nt ac cessibles entre m âles et femelles. En revanche, cela n’a urait pas altéré les p rofils globaux d ’ouverture et ainsi la robustess e de nos conclusions.

3. Identification de longs ARN non-codants m âle s-biaisés

Les lncRNA sont connus pour être im pliqués da ns des mécanis mes de com p ensation de dose, com m e le X ist chez les mam mifère s qui englobe l’ens em ble d e la chromatine d’un chro mosome X afin de le désactiver transcriptionnelleme nt [Penny et al., 1996], et les lncARN roX1 et roX2 chez D . mela nogaster qui p ermette nt l’ass e mbla ge d u co mplexe M SL sur le chromosom e X des m âle s afin d’augm enter la transcriptio n des gènes portés par ce chromosome [Co nrad et Akhta r, 2012].

Les lncARN peuv ent être identifiés à partir de do nnées RNA-s eq classiques grâce à des algorithm es tels que FEEL nc [W ucher et al., 2017]. Ainsi d es analyses co mplém e ntaires s ur les données d’e xpression m âles et fe melles asexuées ont été m e nées afin d’identifier d e potentiels lncARN différe ntiels e ntre ces d eux sexes. 518 lncARN ont été identifiés à l’aide d e FEELnc au sein d es ban ques d’ARNm mâles et fem elles asexuées fusionnées. Parm i ces lncARN, 7 sont différe ntielle m ent ex primés entre m orp hes et ces 7 lncARN sont forteme nt exprimés chez les mâles comparativem ent aux femelles (Fig ure 27). T rois d’e ntre e ux sont exprimés au nivea u de loci as sociés aux a utosomes et les quatre lncARN différe ntiels restant s ont exprim és au niveau du chromosome X des mâles.

V. Chap itre I : Com p ensation d e d ose e t acce ssibilité sexe-sp écifique du ch romosom e X chez Acyrthosip hon p isum

C. D iscussion

Le profil d’expression mâle -biaisé de ces lncARN soulève l’interro gation de leur implication pote ntielle dans la com pe nsation de d ose d’A. pisu m. E n effet, on sait que les chez D . m ela nogaster l’e xp ression des lncARN roX1 et roX2 est mâle -s pécifique [M eller, 2003]. L es 4 lncARN ici identifiés sur le chrom osom e X des mâles sem ble nt prés ente r un p rofil d’expression s imilaire à ro X1 et roX2. Ainsi, il y a deux hypothès es possible quant aux profils d’expre ss ion de ces 4 lncARN mâle-sp écifiques : so it ils sont im pliqués dans la comp ensation de dose des m âles, soit ils participent à d’autres fonctions et rég ulations transcriptionnelles.

Concerna nt la pre mière hypothèse , certains de ces 4 lncARN pourraient pa r exem ple p ermettre l’as sem blage d ’un com ple xe protéique impliqué d ans le dépôt de marque s histones activant globale me nt la tra nscriptio n des gènes as sociés au X par une a ugm e ntation de l’accessibilité d e la chrom atine, au mêm e titre que les lncARN roX1 et roX2 et le com plexe MSL chez la D rosophile. En effet, l’e nse mble des protéines constituant ce com plexe prése nte nt des ho m olog ues chez le p ucero n du pois, à différe nts degrés de conservation, com me sugg éré pa r les données supplém entaires 6 et 7 de l’article p rése nté da ns ce chapitre. Ceci constitue donc une hypothès e à tester concerna nt l’im plication de ces lncARN dans des régulations épigénétiq ues en relation avec la com pensation de dose chez les puce rons mâles.

Concerna nt la seconde hypothèse , il a été identifé d ’une part une transcriptio n du chro m osome X globale me nt plus élevée chez les mâles q ue chez de s femelles [Richard et al., 2 017a], et d’a utre part un enrichiss em e nt de gènes mâle-biaisés au co urs de l’évolutio n sur le chrom osome X d’A. pisum [Jaquiéry et al., 2013]. Il est donc poss ible que l’identification de ces lncARN m âle-spécifiques ass ociés au chromosom e X ne soit que le reflet du profil d’exp res sion si particulier de ce chrom osom e chez le puce ron du pois, et qu’ils ne soient donc pas directe me nt impliqués dans la comp ensation d e dose des mâles et puiss e nt avoir d’autres fonctions de régulations qui ne sont p as ass ociées à des mécanis m es épigénétiques .

V. Chap itre I : Com p ensation d e d ose e t acce ssibilité sexe-sp écifique du ch romosom e X chez Acyrthosip hon p isum

C. D iscussion

Fig ure 27 | lncARN e xp rim és différe ntielle m e nt e ntre mâles et fem elles pa rthénog énétiques sur le chrom osom e X et les autosomes . D ans chaque grap hique sont rep rése ntés les e xons à partir d esquels les lncARN sont transcrits, et leur couleur correspo nd à leur niveau d’express ion.

VI. Chap itre II : Régulations chrom atiennes im p liquées d ans le p olyp hénisme d e rep rod uction d u p uceron d u pois

A. Introd uction

VI. Chapitre II : Régulations chrom atiennes