• Aucun résultat trouvé

Conception des oligonucléotides

Chapitre II Transcription des séquences satellites du génome humain

II.1 Introduction

1. Conception des oligonucléotides

Les séquences centromériques et péricentromériques appartiennent à des régions chromosomiques dont la structure n'a pas été entièrement caractérisée. Ces régions ont échappé aux grands programmes de séquençage du génome humain, et seuls quelques clones génomiques ont été séquencés et cartographiés par des approches in situ. Jusqu'à très récemment, les EST (Expressed Sequence Tag) correspondant aux séquences centromériques et péricentromériques étaient considérés comme le résultat d’une contamination par de l'ADN génomique et étaient donc généralement retirés des banques de données. Cependant, certaines de ces séquences sont malgré tout présentes dans ces bases de données ce qui pourrait révéler une transcription des séquences centromériques et péricentromériques, au moins dans certaines cellules et certains tissus.

Dans ce contexte général, la conception d'oligonucléotides représentant les séquences centromériques (alpha satellites) et péricentromériques (satellites 2 et 3) présentes dans le génome humain a été réalisée à l'aide de séquences consensus connues (KCS) ou nouvellement conçues (ND) ainsi que de séquences spécifiques de certains chromosomes obtenues par alignements de plusieurs séquences présentes dans les bases de données. D’autre part, certains de ces oligonucléotides ont été obtenus par des analyses de blasts dans des banques de données EST avec des séquences qui avaient déjà été caractérisées in situ, par FISH ADN (F/EST). Enfin, certaines séquences spécifiques du CT correspondant à des sites préférentiels d'intégration génomique du VIH latent ont également été ajoutées, afin de déterminer si l'intégration virale au sein de ces séquences et/ou la réactivation du virus,

pourraient être favorisées, dans certaines conditions, par la transcription de ces séquences. TGTCTGGGCGAGGTAAAGGTGGCAAGGGGCTGGGTAAGG Histone H4 NM_175054 CACAGAGCCTCGCCTTTGCCGATCCGCCGCCCGTCCACACCCGCCGCCAG Actine B NM_001101 CTTGACTATCTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGA 18S NR_003286 GACAGGTTAGTTTTACCCTACTGATGATGTGTTGTTGCCATGGTAATC 28S NR_003287 GCGGATCCAGTGTTCCGTTTCCAGCCCCCAATCTCAGAGCCGAGCCGACA hsp70-1 NM_005345.4 GATCACCATCACCAACGACAAGGGCCGCCTGAGCAAGGAGGAGATCGAGCGCAT hsp70-2 NM_005523,3 TTTTATAATTCCATGTATAGTTGGTGTACACTCAAAACCTGTCCCCG hsp40 NM_006145.1

ACTCACAGAGTTGAACCTTTCTTTTGATAGAGCAGTTTTGAAACACTC KCS CTcons1 Vissel and Choo 1987

TGGATATTTGGAGCTGCTTTGAGGCCTATGGTGGAAAAGGAAATATCTTC KCS CTcons2 Vissel and Choo 1988

TTGTAGAATCTGCAAGTGGATATTTGGACCGCTTTGAGGCCTTCGTTGGA KCS CTcons3 Vissel and Choo 1989

TTGAGGCCCTTCGTTGGAAACGGGAATATC KCS CTcons4 Matera and Ward 1992

CTGTGATTTGAATGCACACATCACAAAGAAGTTTCTCAGAATGCTTCT HIV CT7' Jordan et al 2003

TGATGTGTGCGTTCAACTCACAGAGTTTAACCTTTCTTTTCGTAGAGCAG HIV CT10' Jordan et al 2003

TTCGTAGGAGAACTAGACAGAATGATTCTCAGAAACTACTTTGTGATG HIV CT16' Jordan et al 2003

GTGAGTTCAGGTTGAAACGCTCCTTTCGTGGCATCTGCAAGTGAAGATTT ND CT1

TTGCATTCAAGTCACAGAGTTGAACATTCCCTTTCATAGAGCAGGTTTGA ND CT2 Matera and Ward 1992

TTGAAGTCTTCGTTGGAAATGGGATTTCTTCATATAATGCTAGACAGAAG ND CT3

GTTTGAAACACTCTTTCGGCACTACCTGGAAGTGGATATTTCGAGCTCTT ND CT4 Hulsebos et al 1988

ACCGTTCTGTTCATAGAGCAGTTAGGAAACACTCTGTTTGTAAAGTCTGC ND CT5 Hulsebos et al 1988

TGAGCAGTTTTACACCTACTGTGAAAGAGAAAATATCTTCACATTAAAAC ND CT7

CTTCCGTTTCATAGAGCAGGTTGGAAACACTCTTATTGTAGTATCTGGAA ND CT8

GAGCAGTTTGAACACTCTTTTGTGGAATCTGAAAGTGGATATTTGGATAG ND CT9 Rocchi M et al, 1991

GAGGCTAATCTTTGAAATGGAAATATCTTCGTGTAACAACTACACAGAAT ND CT10

AACATTCCTTTAGATGGCGCAGTTTCCAAACACACTTTCTGTAGAATCTG ND CT11

AGATAACCTTTCTTTTGATGAAGGAGTTTGGAGACACTGTGTTTGTAAAG ND CT12 Matera and Ward 1992

ACAGACCTTTTGTAAAATCAACAAAGTAATACTTCTGAGCCCATTGAGGC ND CT13 TTCTGTAGTTCCTGCAATTGCATATTTGGTAGCTTTAAGAGTTCGTAGAA ND CT14 TTTCATTCAACTCATAGCTTTCAACATTCCCTATCTTAGAGCAGGATTGA ND CT15 TGCAAGTGGAGATTTCAAGCGCTTCGATGCCAATGGTAGAAAAGGAAATA ND CT16 GCATTCAACTCACAGTGCTGAACCTTTCTTTGATAGTGCAGCTTTGAAAC ND CT17 TTTGTGATGATTGCATTCAAGTCACAGAATTGAACATTCCCTTTCACAGA ND CT18 TTGCATTCAAGTCACAGAGTTGAACATTCCCTTTCATAGAGCAGGTTTGA ND CT20 Bladini et al 1992 CTTGGAGGATTTCGTTGGAAGCGGGAATTCAAATAAAAGGTAGACAGCAG ND CT21

GAATGTTACAAGTGGATATTTGGAGTTTATTGTGCCTATGGTGGAAAAGG ND CT22 Rocchi M et al, 1991

ATCATCGAATGGAATCGAATGGAATCATCATCGAATGGAATCGAATGGAA ND PCTcons1

TCCAYTCGGGTTGATTTCCAYTCGGGTTGATT KCS PCTcons2 Tagarro I et al 1994

GGAATGGAATGGAATGGAATGGAATGGAATGGAATGGAATGGAATGGAAT ND PCTcons3

GACTCGAATGGAATCGAATAGAATCATCGAATGAAATCGAATGGAATCAT ND PCTcons4

GACTCGAATGGAATAATCATTGAACGGAATCGAATGGAATCATCATCGGA F/EST PCT1 Cooke and Hindley 1979

ATCACCAAATGGAATCGAATGGAATCATCTAATGAACTTGAA F/EST PCT16a Moyzis RK et al 1987

CATCAT(CG/TA)AAT(G/T)GAATC(G/A)AATCATCAT(CG/TA)AAT(G/T)GAATC(G/A)AAT F/EST PCT16b Moyzis Rk et al 1987

AATCAACCCGAGTGCAATCGAATGGAATCGAATGAATGGAATGCAATGGA F/EST PCT9a Moyzis RK et al 1987 (1-50)

ATTGGAATGGAATGGAATGGAATCAACCCGAGTACAGGAATGGAATGGAA F/EST PCT9b Moyzis RK et al 1987 (108-158)

TCAACCCGAGTGTGTTTCATTGGAATGGAACGAAAGGAAGGGAATGGGGT F/EST PCT14 Choo,K.H. et al 1992

CAACCCGAATGGAATGGAATGTAATGGAGTGTAAGGGAATTGAATAGAAT F/EST PCTncsa Prosser J et al, 1985

CCCCGTGGAATGGAATGGATGGAATGCAATGGAATGG F/EST PCTncsb Prosser J et al, 1985

Table 9 : Séquences des oligonucléotides conçus pour la RepChip. Les différents oligonucléotides

centromériques et péricentromériques correspondent à i) des séquences consensus connues (KCS), ii) de nouvelles séquences consensus obtenues par des alignements multiples de séquences consensus présentes dans les banques de données (ND), iii) des séquences obtenues par analyses de banques EST avec des sondes dont la spécificité avait déjà été validée par FISH ARN (F/EST), et finalement iv) à des séquences correspondant aux sites d’intégration génomiques préférentiels du VIH latent (HIV). CTcons1 à 4 et PCTcons1 à 4 correspondent à des séquences consensus pour les séquences CT et PCT respectivement. Lorsqu’un nombre suit directement “CT” ou “PCT”, il indique le chromosome pour lequel la sonde originale était spécifique. L’apostrophe (‘) est uniquement utilisée pour différencier la classe de séquences “HIV” des autres séquences centromériques. Les séquences correspondant aux gènes contrôles et aux gènes hsp sont également indiquées dans cette table. Toutes les séquences sont présentées sous une forme sens (voir texte pour plus de détails). Pour les oligonucléotides dessinés à partir de sondes déjà publiées, la référence est spécifiée. CT: séquences centromériques; PCT: séquences péricentromériques; cons: séquence consensus; ncs: séquence non spécifique d’un chromosome particulier. Les lettres a/b sont utilisées pour distinguer deux oligonucléotides dont les séquences originales sont spécifiques d’un même chromosome.

Bien que certains oligonucléotides présents sur la RepChip aient été conçus à partir de séquences dont la spécificité chromosomique a été validée par FISH ADN, le recours à des séquences plus petites ainsi que les conditions d'hybridation utilisées ne garantissent pas le maintien de cette spécificité. Cependant, l’objectif général était de fournir un outil sensible, permettant une analyse globale de la capacité transcriptionnelle des CT et des PCT et ce sous différentes conditions. À cet égard, bien que l’utilisation de multiples séquences appartenant à une même catégorie de séquences répétées augmente la probabilité d'obtenir des données redondantes, elle permet de réduire le risque de passer à côté de certains ARN issus des CT et des PCT.

Les séquences centromériques (alpha satellites) et péricentromériques (satellites 2 et 3) sont présentées dans la Table 9, avec celles des gènes contrôles (actine B, histone H4, ARNr 18S et 28S) et des gènes hsp (hsp70-1, hsp70-2 et hsp40). La position et le score de chaque alignement de séquence centromérique avec la séquence alpha satellite consensus de 171 pb (Vissel and Choo 1987) est présenté dans le Table 10-A. Enfin, bien que les séquences péricentromériques satellites 2 et 3 contiennent toutes les deux le motif GGAAT, celui-ci est moins conservé pour les satellites 2. Le taux d'homologie des différents oligonucléotides spécifiques des PCT avec à la fois les clones génomiques pHuR98 et pHuR195, identifiés dans la littérature comme contenant exclusivement des satellites 3 et des satellites 2 respectivement est indiqué dans la Table 10-B (Grady, Ratliff et al. 1992).

Compte tenu de notre connaissance limitée de l'activité transcriptionnelle des CT et des PCT in vivo, les oligonucléotides représentant les CT et les PCT ont été conçus dans les deux orientations et les termes « sens » et « antisens » sont bien sûr arbitraires. Pour les ARN centromériques, le terme «sens» fait référence à la transcription dans la même orientation que la séquence consensus alpha satellites de 171pb (Vissel and Choo 1987). Pour les ARN péricentromériques, le terme «sens» fait référence aux ARN enrichis en motifs GGAAT.

A

B

Table 10 : A Localisation et homologie des différents oligonucléotides spécifiques des centromères,

par rapport à la sonde consensus de référence des alpha satellites (Vissel and Choo 1987). Les différentes homologies ont été calculées grâce au programme Lalign. Gris clair= faible homologie (>10-3); gris foncé = homologie moyenne (10-7<x <10-4); noir= forte homologie (< 10-10) B Homologies de séquences entre les différents oligonucléotides spécifiques des péricentromères et la sonde pHuR98 (enrichie en satellites 3) et la sonde pHuR95 (enrichie en satellites 2). Le nombre de motifs GGAAT est aussi indiqué en blanc. Gris clair= faible homologie (>10-3); gris foncé = homologie moyenne (10-7<x <10-4); noir= forte homologie (< 10-8).

2. La réponse au stress thermique: un modèle de validation pour la