• Aucun résultat trouvé

Chapitre 1 : Revue de la littérature

1.1 Description des papillomavirus

1.2.2 L’organisation génomique des papillomavirus

Les papillomavirus contiennent un ADN circulaire pouvant être divisé en trois régions majeures soit les régions précoces et tardives codant pour les protéines virales, et une séquence de régulation nommée LCR (long control region). Le génome viral code pour environ 8 à 10 cadres de lecture ouverts ou ORF (open reading frame) selon le type de papillomavirus et sont exprimés à partir d’ARNm polycistroniques transcrits d’un seul brin d’ADN. Ces ORF sont classés selon leur localisation par rapport au LCR comme précoces ou tardifs. La région précoce occupe environ 50% du génome viral et code pour des protéines nécessaires au cycle viral, dont six sont communes à tous les VP (E1, E2, E4, E5, E6 et E7) (Figure 1.6). L’expression de ces protéines non-structurales se produit tout au long de la différenciation des kératinocytes mais à des quantités variables selon l’état de différenciation cellulaire.

Les protéines E1 et E2 sont impliquées dans la réplication du génome viral. La protéine E2 régule également la transcription des gènes précoces. La protéine E4 est exprimée tout au long de l’infection et est associée à l’affaissement des filaments de cytokératines et à l’amplification de l’épisome (Peh et al., 2002). Les protéines E6 et E7 sont les oncogènes des papillomavirus ainsi que la protéine E5 du VPB, et leur expression induit l’immortalisation et la transformation cellulaire. Spécifiquement, les protéines E6 et E7 des VPH à risque élevé, vont inactiver respectivement p53 et pRb, deux suppresseurs de tumeur cellulaire. Deux autres ORF, E3 et E8, ont été assignés à la région précoce mais seul le cadre de lecture codant pour E8 chez le papillomavirus de lapin (CRPV) ou en fusion avec le C-terminal de E2 (E8^E2C) chez VPB1 et le VPH de type 31 produit une protéine. Chez CRPV, la protéine E8 a été caractérisée d’oncogène (Harry and Wettstein, 1996). La version E8^E2C retrouvée sert de régulateur négatif à la transcription virale et a été détectée chez VPB1, VPH11, -16, -31 et 33 (Lambert et al., 1987; Stubenrauch et al., 2000; Stubenrauch et al., 2001). Pour leur part, les protéines L1 et L2 de la région tardive

occupent 40% du génome viral. Elles sont les composantes structurales de la capside du virion et leur expression est observée dans les kératinocytes différenciés de l’épithélium où l’assemblage des virions s’effectue.

Figure 1.6. Représentation de la carte génomique des papillomavirus.

Les principaux cadres de lecture codant pour les protéines précoces (E) et tardives (L) ainsi que la région de contrôle (LCR) du virion sont localisés autour du génome circulaire. Le promoteur principal des gènes précoces ainsi que les sites de polyadénylation sont aussi représentés. Les nombres à l’intérieur du génome indiquent les positions en nucléotide sur l’ADN. Adaptée de Riemer et al., 2010 (Riemer et al., 2010).

La région régulatrice, le LCR, est d’une longueur approximative de 1 kb, ne contient aucun cadre de lecture mais renferme l’origine de réplication ainsi que les éléments de contrôle de la transcription virale et de la ségrégation de l’épisome (Figure 1.7).

Figure 1.7. Représentation de la région de contrôle (LCR) des papillomavirus.

D’une longueur d’environ 1 kb, le LCR possède l’origine de réplication où se lient les protéines virales E1 et E2, en plus de plusieurs sites de liaison pour des protéines cellulaires impliquées dans la régulation de la transcription. Ces protéines peuvent affecter la régulation de l’expression des gènes viraux précoces. L’origine de réplication des papillomavirus situé en 3’ du LCR comprend quatre sites de liaison à l’hélicase virale E1 (E1 BS #1 à #4, en bleu), une région riche en A/T ainsi que 3 sites de liaison au facteur de transcription du virus, la protéine E2 (E2 BS #1 à 3, en vert).

L’origine de réplication située près du promoteur précoce majeur, contient une région de liaison à l’hélicace E1 composée de paires de séquences répétées inversées permettant la formation d’un double hexamère de E1 sur l’ADN, une section riche en adénine et en thymine (AT) ainsi que trois sites de liaison pour la protéine E2 (Chen and Stenlund, 2001; Frattini and Laimins, 1994). Un quatrième site de liaison par E2 est aussi

E4 E6 E2 L1 E1 E5 L2 LCR E7 Ori L1 Sp1 E6 CDP YY1 AP 1 TEF1 oct N FI N FI N FI PEF N FI N FI E2 PrR 7150 97 E1 BS AP 1 AP 1 E2 BS E1 BS

E6

A/T E2 BS #1 #2 #3 #1 #2 #3 #4

retrouvé dans le LCR en aval du gène L1. La transcription des gènes précoces est régulée par la liaison de facteurs viraux et cellulaires à des séquences retrouvées dans le LCR, spécifiques aux kératinocytes (Sen et al., 2002). Une diversité de facteurs activateurs et répresseurs peuvent s’associer à des séquences du LCR chez les différents types de papillomavirus mais tous les génomes des VP, sans exception, contiennent des sites de liaison aux protéines Ap-1, Sp-1 et TFIID. Il est aussi à noter que différentes protéines régulatrices de la transcription vont lier le LCR selon le stade du cycle viral et de différenciation des kératinocytes, permettant un contrôle précis de la transcription des gènes précoces. L’expression des gènes précoces chez les VPH à haut risque se fait par l’intermédiaire de deux promoteurs majeurs et une série de promoteurs mineurs. Le promoteur précoce majeur, p97, p99 et p105 chez le VPH de type 31, 16 et 18 respectivement, est constitutivement actif dans les cellules basales non-différenciées de l’épithélium (Hummel et al., 1992; Rohlfs et al., 1991). Ce promoteur est responsable de la transcription des gènes viraux précoces E6, E7, E1, E2, E5 et E4 et est régulé par des éléments contenus dans le LCR. La plupart des transcrits précoces se terminent à une séquence de poly-adénylation (pA) précoce (pAE) située en aval du gène E5. En plus, des

séquences inhibitrices retrouvées dans les gènes L1 et L2, empêchent l’extension de ces transcrits dans les cellules non-différenciées. Cette inhibition est, toutefois, levée lors de la différenciation cellulaire (Collier et al., 2002; Oberg et al., 2003). Le deuxième promoteur viral est dit tardif et est activé suite à la différenciation des kératinocytes. Ce promoteur tardif, p742, p670, p814 pour les VPH de type 31, -16 et -18 respectivement, dirige deux ensembles de transcrits. L’un se terminant au site précoce de poly-adénylation et inclut les transcrits de E1^E4, E5 E1 et E2. Le deuxième continuant jusqu’au site de poly-adénylation tardif (pAL) situé en aval du gène L1 et regroupe les transcrits codant pour la capside du

virion soit L1 et L2. La régulation des transcrits tardifs, amorcée lors de la différenciation des kératinocytes, s’effectue à l’aide de facteurs de transcription de la cellule. Les protéines CDP (CCAAT displacement protein) et YY1 (Yin Yang 1 protein) s’associent à la région environnante du promoteur p670 du génome du VPH16 (nucléotides 531 à 780) et

suppriment la transcription basale obtenue à partir de ce promoteur (Ai et al., 2000; Ai et al., 1999; Sato et al., 2007). D’autres parts, des chercheurs ont analysé le rôle de certains facteurs de transcription impliqués dans la différenciation des kératinocytes et l’activation du promoteur tardif des VPH. Ainsi, des études ont démontré que le facteur de transcription de la famille POU, hSkn-1a, qui induit la différenciation des kératinocytes, active la transcription à partir du promoteur p670 en déplaçant le répresseur YY1 et en s’associant à ses sites en amont du promoteur tardif (Kukimoto and Kanda, 2001; Kukimoto et al., 2006). De même, le facteur de transcription C/EBPβ (CCAAT/enhancer binding protein) qui induit la différenciation terminale des kératinocytes, reconnaît et lie deux sites aussi situés en amont du promoteur tardif du VPH16, augmentant alors la transcription à partir de ce promoteur dans les cellules HeLa et HFK (primary human foreskin keratinocytes) (Kukimoto et al., 2006). Finalement, le changement de la configuration de la chromatine et aussi l’accroissement du nombre d’épisomes semblent être des facteurs d’importances dans l’augmentation de la quantité totale des transcrits tardifs (del Mar Pena and Laimins, 2001).

Les transcrits des papillomavirus, obtenus à partir des mêmes sites de départ et de polyadénylation, vont encodés plusieurs gènes viraux. De plus, certains transcrits vont subir de l’épissage alternatif permettant l’expression de certains gènes (Figure 1.8). Plus de 20 et de 10 ARNm différents ont été identifiés dans les cellules infectées par le VPB1 et VPH31 respectivement, et ces derniers, sont retrouvés en faibles quantité permettant de croire que d’autres espèces d’ARNm existent. La régulation de la transcription des papillomavirus par des mécanismes de contrôle tel que l’épissage alternatif ainsi que l’expression des gènes précoces et tardifs selon le stade de différenciation cellulaire, expliquent la petite taille du génome des papillomavirus tout en exprimant plusieurs protéines virales.

Figure 1.8. Exemple des transcrits précoces et tardifs ayant un potentiel codant.

Représentation du génome linéaire du VPH31 sur lequel les protéines virales, les promoteurs précoce (p97) et tardif (p742) ainsi que les sites précoce et tardif de polyadénylation sont illustrés. Les sites d’épissage sont caractérisés par des lignes joignant les cadres de lecture des différentes protéines (rectangles). Les protéines potentielles de chaque transcrit sont indiquées à la droite de la figure. Adaptés de Lee and Laimins, The Papillomavirus, Chapitre 4, (2007).