• Aucun résultat trouvé

Taille des microsatellites associés aux séquences Alu

3.3 Discussion

4.2.5 Taille des microsatellites associés aux séquences Alu

La distribution des tailles des polyA en 3' de Alu (gure 4.4) montre que la majorité des élé- ments Alu intégrés récemment (52% des AluY+) possède une queue polyA comprise entre 15 et 30 nucléotides, avec le maximum vers 22-26 nt. En comparaison, les (A)n non associés aux régions 3'

des éléments Alu sont en très grande majorité de taille courte (10 nt, et des pointes à 14 et 17 nt). Lorsque l'on s'intéresse à la distribution pour les autres familles Alu, on distingue une dynamique d'évolution des polyA en deux phases. La première est la réduction brusque de la taille. En eet, la majorité des AluY conservent leur queue polyA (67% des éléments la possède encore ; voir tableau 4.7), mais ces dernières font en majorité entre 12 et 19 nt. La taille pour les polyA associés aux AluS

Tab. 4.7  Proportion d'éléments Alu possédant un microsatellite dans la région 3', linker, ou 5', en fonction du type de microsatellite, et de la famille de l'élément Alu. La détermination des familles et leurs fourchettes d'âge sont données dans le tableau 4.4.

et AluJ reste ensuite assez constante, avec un maximum vers 12-14 nt, tandis que la proportion d'association se réduit.

Fig. 4.4 Proportion d'éléments Alu associés à des (A)ndans leur région 3', en fonction de la taille de ces derniers, et de la famille Alu. La densité des locus (A) non liés aux régions 3' de Alu est donnée sur l'échelle de droite.

Les distributions en taille des microsatellites riches en A (autres que polyA) présents en 3' de Alu nous montrent une évolution un peu diérente (Figure 4.5). Les microsatellites associés aux AluY+, AluY et AluS ont une distribution en taille à peu près équivalente, pour les trois familles. Leur taille est plutôt longue (entre 15 et 25-30 nt) par rapport à celle des microsatellites de même type présents hors des régions 3' de Alu (qui font en majorité 10 nt, ou 12 pour les hexanucléotides). Ces observa- tions sont valables pour tous les types de motifs riches en A (tri à hexanucléotides). La proportion d'éléments Alu associés à ces microsatellites augmente par contre avec leur âge, comme cela avait été remarqué à la section précédente. Les microsatellites associés aux AluJ sont quant à eux plus courts que ceux associés aux autres familles, pour tous les types de microsatellites, et tendent vers la distribution donnée pour des locus hors Alu. Cette réduction de taille est donc synchronisée avec la réduction d'association observée dans le tableau 4.7 pour cette famille Alu.

Nous n'avons pas étudié la distribution en taille des dinucléotides associés aux AluY et AluY+, car ils étaient trop peu nombreux. Les distributions pour les AluS et AluJ sont relativement proches de celles des dinucléotides externes aux régions 3' de Alu (4.6), quel que soit le motif. Le pic à 10 nt, qui représente la majeure partie des locus hors Alu, est toutefois absent de ces distributions.

Une analyse complémentaire a été eectuée sur les polyC/G présents en région 3' de Alu. En eet, le tableau 4.6 donnait une sur-représentation de ces microsatellites à cette position, alors que le polyA ne devrait a priori pas être vecteur de ce genre de motifs. La gure 4.6 indique que les locus sont en majorité très courts (entre 10 et 17 nt), et sont moins présents dans les AluJ. On peut observer, dans la distribution des polyC/G non associés aux 3' de Alu, que plus de 25% de ces derniers ont une taille de 22 nt, alors que les plus courts sont en proportion moins importante. Il est peu envisageable que les polyC/G apparaissent spontanément à cette taille, ces locus pourraient donc être associés à un autre type d'éléments répétés du génome. Si l'on retire ces microsatellites de 22 nt de la distribution, les tailles des polyC/G associés aux 3' de Alu deviennent similaires à celles des polyC/G hors des éléments Alu.

Taille des microsatellites associés aux autres régions de séquences Alu

Nous avons ensuite analysé la distribution des tailles des microsatellites présents dans le linker des séquences Alu pour les diérentes familles. Les résultats pour les (A)n montrent là encore une

évolution en deux étapes (gure 4.7). Pour les familles récentes (i.e. AluY et AluY+), les polyA font en moyenne 17 nt, et sont présents pour 8 à 10% des Alu. Le taux de présence se réduit alors à 5,4%

Fig. 4.5 Proportion d'éléments Alu associés à des tri, tétra, penta et hexanucléotides riches en A dans leur région 3', en fonction de la taille de ces derniers, et de la famille Alu. La densité des locus non liés aux régions 3' de Alu, pour chacun des motifs, est donnée sur l'échelle de droite. Les pics observés dans chacune des distributions correspondent à la période des motifs concernés.

Fig. 4.6 Proportion d'éléments Alu associés à des dinucléotides ou à des polyC/G dans leur région 3', en fonction de la taille de ces derniers, et de la famille Alu. La densité des locus non liés aux régions 3' de Alu, pour chacun des motifs, est donnée sur l'échelle de droite.

des AluS, sans que la taille ne soit aectée. Enn, ils sont de nouveau plus présents dans le linker des AluJ (17% des éléments), mais avec une taille réduite (entre 10 et 14 nt pour la plupart). La distribution des di et trinucléotides est par contre similaire à celle des locus non associés au linker, quelle que soit la famille Alu (gure 4.7). Les distributions des autres microsatellites riches en A associés au linker sont elles aussi conformes à la distribution hors du linker, avec toutefois un pic à 16 nt pour les microsatellites associés aux AluY+ et surtout aux AluY, qui pourrait correspondre à une taille d'apparition privilégiée.

Les distributions des tailles pour les microsatellites présents en région 5' de Alu sont présentées dans la gure 4.8. Il apparaît que quels que soient le motif ((A)n, (AAT)n, ou autre riche en A) et

la famille Alu, les tailles sont similaires à celles des microsatellites non associés aux 5' des éléments Alu. Les proportions de Alu associés au 5' sont similaires pour toutes les familles, sauf pour les AluJ qui possèdent moins de (A)n. Ces distributions reètent les proportions d'associations données dans

le tableau 4.7.

Enn, nous avons analysé les tailles des microsatellites trouvés aux positions internes des éléments Alu. Les résultats présentés en gure 4.9 indiquent que la taille des locus ne varie pas en fonction de l'âge des Alu auxquels ils sont associés, presque tous ayant gardé la taille à laquelle ils sont apparus (entre 10 et 12 nt). Les GAGGCT et les CACTG possèdent une seconde taille caractéristique à 16 et 14 nt respectivement, pour toutes les familles Alu, mais elles ne sont pas compatibles avec des événements de glissement. En revanche, la proportion d'éléments Alu possédant ces microsatellites internes varie fortement en fonction de la famille de Alu. La proportion de AluY+ possédant un microsatellite est systématiquement plus faible que celle des AluY et AluS, tandis que celle des AluJ est de nouveau plus réduite par rapport à ces deux familles, pour tous les motifs. Les distributions de taille pour les microsatellites présents dans le génome en général montrent que ces motifs, même s'ils sont en très grande majorité de taille très réduite (10 à 12 nt), sont capables de se développer, puisque l'on observe des locus de taille plus importante.

4.3 Discussion

4.3.1 Ré-évaluation de l'association entre microsatellites et séquences Alu