• Aucun résultat trouvé

Structure et fonctions des acides nucléiques 1. Acides nucléiques

Liste des annexes

1. Biologie moléculaire Historique [1]

1.3. Structure et fonctions des acides nucléiques 1. Acides nucléiques

1.3.1.1. Acide désoxyribonucléique [3]

L’acide désoxyribonucléique (ADN) a une structure en double hélice (aspect en «échelle tordue»), formée de deux brins antiparallèles et strictement complémentaires en ce qui concerne la séquence des «barreaux» ou bases (complémentarité adénine-thymine et guanine-cytosine) portées par les «montants» phosphodésoxyribosiques. L’ADN est le support de l’information génétique des procaryotes (cellules ne possédant pas de noyaux vrais, telles les bactéries) et des eucaryotes (cellules disposant de noyaux individualisés). Cette information est représentée par l’ordre de succession ou séquence des bases puriques (adénine et guanine) et pyrimidiques (cytosine et thymine) le long de la molécule, avec un code nucléotides-acides aminés bien connu et universel. L’ADN est surtout nucléaire chez les eucaryotes, organisé au sein des chromosomes, mais une faible partie est contenue dans les mitochondries. L’ADN nucléaire est intimement associé à diverses protéines qui interviennent dans la structure des chromosomes (histones essentiellement, formant des unités appelées nucléosomes) ou dans la régulation de l’activité génique. Sur le plan fonctionnel, l’ADN est réparti en régions codantes (2 % de l’ADN total) pour des protéines ou des acides ribonucléique régions contenues dans les gènes, et en régions non codantes, majoritaires quantitativement, qui comprennent notamment les régions régulatrices. Un gène peut être défini comme une unité fonctionnelle d’ADN (ensemble de séquences) contenant l’information nécessaire à la production d’un ARN particulier ou d’une protéine particulière. Dans le cas des gènes codant pour une protéine, les plus nombreux, ils sont constitués de séquences représentées dans l’ARN messager mature ou exons, en général (mais non obligatoirement) codantes, séparées par des séquences régulatrices sont situées en amont du premier exon, notamment la région dite promotrice. D’autres parts, seul un brin de la

molécule d’ADN est transcrit. Enfin, une grande partie de l’ADN n’a pas de fonction encore bien définie et est notamment constituée de séquences hautement répétées comme les microsatellites, très utilisés en recherche car «balisant» l’ADN au même titre que les sites de restriction, L’ADN peut être coupé in vitro par des enzymes particulières d’origine bactérienne, les enzymes de restriction, qui agissent sur des séquences d’ADN spécifiques appelées sites de restriction. La topographie et même la présence de ces sites de restriction sur l’ADN, situés dans ou en dehors des gènes, peut varier entre deux individus d’une même espèce, introduisant un certain polymorphisme dont on peut tirer partie en recherche et pour certaines applications diagnostiques. D’autres sites sont fixes, permettant d’établir une véritable cartographie de l’ADN. Les distances sur la molécule d’ADN sont actuellement mesurées en kilobases (103 bases = 1kb) ou en mégabases (106 bases = 1mb). Par exemple, l’ADN d’une cellule humaine mesure environ 3000 mb et on estime qu’il contient environ 100 000 gènes.

1.3.1.2. Acide ribonucléique [3]

Les acides ribonucléiques (ARN) ont une structure primaire très proche de celle de l’ADN, à ceci prés que la thymine est remplacée par l’uracile et qu’ils ne sont le plus souvent constitués que d’un seul brin. Ils sont surtout impliqués dans la synthèse des protéines et sont de trois types : ARN ribosomaux (ARNr) intervenant dans la traduction des ARN messagers (ARNm), ARN de transfert (ARNt) permettant le transfert des acides aminés intracellulaires sur la chaîne polypeptidique en cours d’élongation, et ARNm destinés à être traduits en protéines dans les complexes ribosomaux, en suivant le code génétique. Tous ces ARN sont synthétisés en regard du brin codant d’un gène, dans le noyau, par une machinerie très complexe utilisant des ARN polymérases diverses (type I à III selon le type d’ARN). Ils sont toujours associés à des protéines très diverses, encore incomplètement connues, sous forme de particules ribonucléoprotéiques ; ils sont toujours monocaténaires sauf chez certains virus et sont souvent repliés sur eux-mêmes par hybridation intramoléculaire (structures secondaires). Dans le cas des ARNm, les plus nombreux, l’ensemble du brin «actif» d’ADN, exons et introns, est d’abords copié ou transcrit, donnant naissance à un transcript primaire d’ARN. Les régions de ce transcript primaire correspondant aux introns sont ensuite excisés (épissage)

aboutissant à un ARNm «mature», prêt à être traduit, après diverses autres modifications de structure. A la différence de l’ADN, molécule remarquablement stable dont la quantité par cellule est fixe en dehors de la mitose, le contenu et la composition en ARN, notamment messagers, sont très variables selon l’activité des gènes cellulaires, d’autant plus qu’il s’agit souvent de molécules instables à demi-vie courte. Leur étude quantitative permet donc celle de l’activité récente des gènes du tissu étudié, nécessairement très variable selon le type de tissu étudié. Enfin, les ARNm matures sont «traduits», c’est-à-dire qu’ils permettent la synthèse d’une protéine particulière dans les complexes ribosomaux associés au réticulum endoplasmique «rugueux» ou granuleux.

1.3.2. Fonctionnement du génome eucaryote

Il est extrêmement complexe et encore fort loin d’être complètement compris, notamment en ce qui concerne sa régulation. Certains éléments fondamentaux sont toutefois bien connus.

1.3.1.1. Transcription génique [3]

Elle s’effectue à partir des brins codants d’ADN grâce à l’action d’un complexe moléculaire constitué autour de l’ARN polymérase III (complexe de transcription). Ce complexe se fixe sur une région plus ou moins étendue, située sur le brin codant, en amont du premier exon du gène à transcrire, région appelée promoteur. Celui-ci comporte des séquences universelles appelées «boîtes» (TATA box ; CAAT box) situées très prés du début de l’exon, mais aussi des séquences plus spécifiques parfois plus éloignées, variables en fonction du gène en cause, appelées séquences régulatrices. Ces séquences ou éléments en «cis», car situés sur le même brin d’ADN que le brin codant, sont en fait des sites de fixation de protéines spécifiques, régulatrices, appelées éléments en «trans». On peut subdiviser ces éléments régulateurs en séquences enhancer et silencer selon l’impact sur l’activité transcriptionnelle de la liaison protéine-séquence régulatrice, liaison qui interfère avec la fixation et l’activité du complexe de transcription. Un certain nombre de protéines régulatrices sont assez ubiquitaires, participant à la régulation d’un grand nombre de gènes. On les appelle facteurs de transcription ; ils servent par exemple de deuxième ou troisième messager, nucléaire, relayant un message reçu par la cellule, message qui doit finalement aboutir à une

régulation de l’activité génique. De nombreux proto-oncogènes et certains gènes suppresseurs de tumeurs codent pour de tels facteurs de transcription, notamment les produits des gènes c-myc, c-fos, c-jun, p53, NF/KB, etc.

1.3.1.2. Régulation post-transcriptionnelle [3]

Elle peut concerner les éléments affectant la stabilité des ARNm, la traduction elle-même, et les modifications protéiques post-traductionnelles qui modulent l’activité et la stabilité des protéines (phosphorylations, sulfurations, glycosylations, etc). Elle est parfois essentielle dans la régulation de la quantité et/ou de l’activité de la protéine finale.

2. Bactéries et infections bactériennes