• Aucun résultat trouvé

3.3 Discussion

4.3.4 Apparition en interne

L'une des observations les plus intéressantes des analyses présentées est l'association très forte de certains motifs avec des positions particulières des séquences Alu. Les microsatellites (AGGC)n,

(GTG)n, (GAGGCT)n, (GAGGTG)n et (CACTG)n sont associés aux positions 50, 142, 178, 207

et 242 dans la séquence consensus du AluS, respectivement. Ces positions sont légèrement variables selon la famille Alu. En général, près de 50% de ces motifs sont associés aux éléments Alu, propor- tion atteignant 90% pour les GAGGTG. Ces microsatellites sont en général très courts (10 à 13 nt) et apparaissent par mutation ponctuelle à partir d'un quasi-microsatellite présent dans la séquence Alu. On peut d'ailleurs remarquer un eet majoritaire des mutations aux sites CpG (environ 10 fois plus de locus créés par ce biais qu'à partir d'autres sites ; voir gure 4.3).

Ces microsatellites sont signicativement associés à l'ensemble des familles Alu, mais l'étude détaillée des sous-familles des éléments Alu les plus récents montre une répartition hétérogène des motifs. En eet, les sous-familles Alu connues pour être encore actives de nos jours (Ya5 et Yb8/b9) ne sont associées à aucun des microsatellites internes (sauf les AGGC), alors que les autres sous-

Fig. 4.11  Modèle du cycle de vie des polyA associés aux régions 3' de séquences Alu. L'échelle temporelle est indiquée en millions d'années, en bas de la gure. Chaque diagramme correspond à la distribution de taille des microsatellites associés aux régions 3' des éléments Alu. l'abscisse est la taille en nucléotides, et l'ordonnée est la proportion d'éléments Alu associés. L'intégration provoque deux distributions, suivant les hypothèses 2 et 3 du modèle présenté gure 4.10. Une majorité des polyA intégrés sont de grande taille, et parfait. Une plus petite quantité est intégrée à la même taille, mais sont imparfaits. Ces derniers se transforment en microsatellites riches en A, tandis que les parfaits accumulent des mutations puis se contractent. Certains peuvent ensuite se transformer en microsatellites riches en A. La proportion de polyA associés aux éléments Alu se réduit au cours du temps, à cause des disparitions par mutation ponctuelle, et des transformations. La proportion de microsatellites riches en A augmente grâce à l'apport des polyA. Enn, les polyA deviennent trop peu nombreux et trop dégradés pour produire de nouveaux microsatellites riches en A, la proportion de ces derniers se réduit donc, jusqu'à leur disparition. Et les derniers polyA nissent par disparaître. La taille d'intégration et les proportions de départ sont inconnues, ainsi que le temps de dégradation nal. Les autres valeurs sont estimées à partir des résulats présentés dans le texte.

familles en possèdent déjà la plupart. Une explication possible est que la mutation ait eu lieu dans le gène maître de certaines des sous-familles, et que le microsatellite ait été intégré de fait avec toutes les nouvelles copies. Toutefois, cela supposerait que les gènes maîtres des cinq sous-familles fortement associées aient tous subi au moins trois des cinq mutations nécessaires à l'apparition de ces motifs, sans que les AluYa5/b8/b9 n'en subissent aucune, malgré leurs âges assez similaires. En revanche, le fait que les AluYa5/b8/b9 soient toujours en activité signie que de nombreuses copies ont été intégrées très récemment dans le génome. Ces copies n'ont par conséquent pas encore pu accumuler de mutations par rapport au gène maître, et font donc baisser le taux d'association de leur sous-famille. L'association entre ces microsatellites et les éléments Alu est donc plus probablement

causée par une apparition rapide suite à l'intégration.

Quel que soit l'âge d'intégration de l'élément Alu dans lequel ils sont apparus, ces microsatel- lites internes ne semblent pas être capables d'expansion. En eet, même pour les éléments Alu les plus anciens, les locus de plus de 12 nt sont quasiment inexistants. Les (GAGGCT)n et (CACTG)n

présentent bien des pics à des tailles de 16 et 14 nt respectivement, c'est-à-dire à 4 et 2 nt de plus que leur taille à la création. Etant donné la période de ces motifs, ces accroissements ne peuvent être dus à des événements de glissement, et sont probablement causés par de nouvelles mutations ponctuelles. Dès lors, il serait plus juste de qualier ces détections de proto-microsatellites, confor- mément à notre modèle du cycle de vie présenté en section 2.4.2. Pourquoi ces proto-microsatellites sont-ils incapables d'entamer un cycle de vie normal alors que leur apparition est largement favo- risée à ces sites ? Quatre des cinq motifs sont des penta et hexanucléotides, pour lesquels 10 à 12 nt ne représentent que deux répétitions. Il est donc possible que cela soit insusant pour autoriser le glissement, et ces proto-séquences seraient amenées à disparaître sans avoir la possibilité de se développer. D'autre part, ces motifs sont très riches en G/C, et il est possible que leur composition soit un frein à leur expansion.

Des cas d'apparition de microsatellites à l'intérieur d'éléments transposables ont déjà été docu- mentés pour le blé [Ramsay et al., 1999], la souris [Desmarais et al., 2006], et la drosophile [Wilder and Hollocher, 2001]. Le cas des éléments mobiles mini-me de la drosophile est particulièrement intéressant. Deux types de microsatellites sont associés à cet élément : des (TA)n et des (GTCY)n

(avec Y égal à C ou T). Les premiers sont constitués de quatre répétitions dans le consensus de l'élément mobile, et les cas d'expansion/contraction semblent assez courants. Le deuxième type de microsatellites apparaît via des mutations ponctuelles à un site quasi-microsatellite, comme c'est le cas pour nous. Malgré les diverses mutations possibles, les auteurs observent eux-aussi préférentiel- lement des transitions C vers T. Mais contrairement à ce que nous avons trouvé, les microsatellites produits sont capables d'expansion, puisque la taille moyenne est de 5,1 répétitions pour les 23 locus qu'ils ont observés (le plus long possédant 37 répétitions). Le motif (GTCY) est relativement riche en G/C, et la période est de quatre nucléotides.

Une diérence majeure avec la plupart de nos apparitions est que les mutations ponctuelles dans les mini-me produisent directement des (GTCT)3et des (GTCC)2,75. On pourrait donc penser

que la taille des proto-microsatellites est déterminante pour pouvoir initier le glissement. Pourtant, les (GTG)n que nous observons apparaissent directement avec 3,3 répétitions, certains CACTG

et GAGGCT atteignent aussi une taille de 2,8 et 2,7 répétitions grâce à des mutations ponctuelles

supplémentaires, mais aucun ne semble avoir pu se développer. D'autres contraintes sont donc certai- nement à l'÷uvre. On peut par exemple supposer que le développement de ce type de microsatellites est plus aisé chez la drosophile que chez l'homme. De plus, il ne faut pas oublier que ces microsatel- lites courts sont apparus dans des séquences particulières, qui, même si elles ne sont probablement pas actives, possèdent peut-être des propriétés structurelles défavorisant des variations de taille.