• Aucun résultat trouvé

Chapitre 1. Introduction générale

1.4 Concepts de base en génétique

Cette section présente les concepts de base en génétiques afin de bien comprendre les notions relatives aux polymorphismes génétiques et aux interactions GxE. À moins qu’il y ait une autre référence indiquée, les notions présentées ont été tirées de Campbell (1995).

1.4.1 Le gène

Chaque individu possède un génome – l’ensemble des gènes – contenant l’information biologique qui le différencie des autres sur différents traits comme la couleur des yeux. Les gènes représentent l’unité de base de l’hérédité et sont transmis des parents à leurs enfants lors de l’union du spermatozoïde et de l’ovule.

1.4.1.1 Composition et structure de l’ADN. L’ADN est une macromolécule qui fait

partie, avec l’ARN, de la classe de composés appelés « acides nucléiques ». L’ADN de chaque individu comprend les instructions génétiques permettant la fabrication des protéines. L’unité de base de l’ADN est appelée un nucléotide et est formée d’un sucre (désoxyribose), d’un groupement phosphate et d’une base azotée. Il existe quatre types de bases azotées : cytosine (C), thymine (T) (la thymine est remplacée par l’uracile (U) dans l’ARN), adénine (A) et guanine (G). L’ADN est représenté par une double hélice similaire à une échelle torsadée dont les barreaux sont les paires de bases azotées, tandis que les deux brins parallèles sont constitués de désoxyriboses et de phosphates. Chacune des bases se projetant d’un brin se rattache à la base de l’autre brin grâce à des liaisons d’hydrogène. Chaque base possède un complément exclusif : l’adénine ne peut être rattachée qu’à la thymine, tandis que la cytosine ne peut être rattachée qu’à la guanine. Ainsi, à partir de la séquence d’un brin, il est facile de déterminer celle de l’autre brin grâce à la règle de l’appariement. Par exemple, pour la séquence de bases ATGGCT d’une partie d’un brin, la séquence correspondante de l’autre brin sera TACCGA.

1.4.1.2 Structure des gènes et génome. Le génome humain possède quelques dizaines

de milliers de gènes transmis par la mère et le père. Chacun des gènes est composé d’ADN et se retrouve sur un chromosome. Un gène peut prendre différentes formes, ou séquences d’ADN, dans une population. Le terme allèle (abréviation du terme allèlomorphe) réfère à ces différentes séquences. La localisation exacte d’un gène sur un chromosome se nomme un locus. Ainsi, un individu pourrait par exemple avoir un allèle sur le locus de la β-globine du chromosome 11. Lorsqu’un individu présente le même allèle sur les deux membres d’une paire de chromosomes, il est identifié comme étant homozygote. S’il présente des allèles différents, alors l’individu est hétérozygote. Le terme génotype fait quant à lui référence aux allèles présents sur un locus déterminé (Jorde, Carey, Bamshad, & White, 2004).

1.4.1.3 Des gènes aux protéines. Les gènes d’un individu regroupent toute

l’information qui lui donne ses caractères propres. Ce sont les protéines synthétisées à partir des séquences d’ADN qui tracent le pont entre le génotype d’un individu et son

phénotype (i.e. l’ensemble des caractères apparents). Plus spécifiquement, les gènes produisent des polypeptides qui composent les protéines. Une protéine peut être produite à partir d’un seul ou de plusieurs polypeptides. Un polypeptide est une série d’acides aminés. L’organisme compte au total 20 acides aminés différents (e.g. tryptophane, acide glutamique, phénylalanine).

Le passage de l’information de l’ADN aux protéines se fait en deux étapes principales : la transcription et la traduction. La transcription permet la création de l’ARNm à partir de la séquence de nucléotides de l’ADN. Lors de la traduction, la séquence de bases de l’ARNm est traduite, permettant d’obtenir une séquence d’acides aminés d’un polypeptide. Des unités de trois bases d’ARNm codent pour un acide aminé. Ces regroupements de trois bases d’ARNm sont dénommés codons. Par exemple, le codon UGG (uracile-guanine- guanine) donnera l’acide aminé tryptophane. Les acides aminés codés sont ensuite assemblés, ce qui forme les polypeptides. La chaine polypeptidique s’enroule puis se plie pour former une protéine.

1.4.2 Variations génétiques

1.4.2.1 Les mutations. La séquence de nucléotides qui forme un gène peut varier

d’une personne à l’autre (e.g. TCACG versus TTACG). Un changement permanent dans la séquence de nucléotides d’un individu est une mutation. Bien que la majorité des mutations aient peu d’impact sur le fonctionnement des gènes, d’autres mutations l’affectent et s’inscrivent dans l’étiologie des maladies génétiques et de certains cancers. Il arrive également que certaines mutations soient conservées dans la population sous la forme de variantes morphologiques. Les variations de séquence d’ADN présentant des fréquences inférieures à 1 % se réfèrent au concept de variant rare, alors que celles présentant des fréquences égales ou supérieures à 1 % sont des polymorphismes.

1.4.2.2 Polymorphismes génétiques. Il existe différentes classes de polymorphismes

dont les polymorphismes de nucléotide unique (SNP) et les polymorphismes de sites en nombre variable répétés en tandem (VNTRs). Un SNP est un polymorphisme qui résulte de

la variation d’un seul nucléotide. En d’autres mots, sur certaines régions précises de leur séquence d’ADN, certains individus ont un nucléotide (e.g. A), et d’autres, un nucléotide différent (e.g. G). Les SNPs sont responsables de 90 % des variations génétiques humaines. Ainsi, l’ensemble des gènes contiendrait approximativement dix millions de SNPs, certains ayant un impact sur l’activité de ces gènes, ce qui conduit à des variations qui donnent à chaque personne son individualité biologique.

Quant à eux, les VNTRs sont des polymorphismes qui résultent de variations du nombre de répétitions de microsatellites dans une région spécifique. Un microsatellite est un segment qui comprend des séquences répétées courtes de 2 à 5 nucléotides qui se retrouvent en tandem sur l’ADN. Ces séquences peuvent apparaitre en tandem plusieurs centaines de fois. Ces répétitions peuvent grandement varier entre les deux chromosomes homologues d’un individu (Jorde et al., 2004).

1.4.3 Génétique des populations

1.4.3.1 Fréquences alléliques et génotypiques. Le patrimoine génétique (parfois

dénommé « pool génétique ») d’une population représente l’ensemble des allèles se trouvant dans cette population en un moment donné. En d’autres mots, le patrimoine génétique comprend tous les allèles de tous les loci de tous les individus de cette population.

Les notions de fréquence génotypique et de fréquence allélique permettent de mesurer les variations des gènes au sein des populations. Chez l’humain, chaque gène est représenté en deux copies dans le génome. Ainsi, un individu peut être homozygote ou hétérozygote selon les allèles qu’il présente sur les deux membres d’une paire de chromosomes. De façon générale, dans une population, il existe deux allèles ou plus pour un gène. Par exemple, pour deux allèles principaux A et a, un individu pourra avoir un des trois génotypes possibles : homozygote pour l’allèle A (génotype AA), hétérozygote (Aa) ou homozygote pour a (aa). La fréquence génotypique est calculée en divisant l’effectif de chaque génotype par le nombre total de sujet. Ainsi, nous pourrions avoir la distribution de

génotypes suivante dans une population de 200 individus : AA, 64; Aa, 120; aa, 16. Ici, la fréquence génotypique de AA sera 64/200, soit 0,32. La somme des fréquences génotypiques doit être égale à 1.

À partir de la fréquence génotypique, nous pouvons calculer la fréquence allélique, qui représente la fréquence relative de chaque allèle dans le patrimoine génétique. Cette fréquence est donc le pourcentage d’un allèle particulier parmi l’ensemble des allèles à un locus exact dans une population donnée. Pour l’obtenir, il faut d’abord calculer le nombre d’allèles pour un gène, sachant que chaque homozygote AA a deux allèles A et que chaque hétérozygote ne possède qu’un allèle A. De la même façon, chaque homozygote aa portent deux allèle a, tandis que chaque hétérozygote n’en porte qu’un. Nous pouvons faire ce calcul :

(64 x 2) + 120 = 248 gènes A (16 x 2) + 120 = 152 gènes a.

Ainsi, il existe 400 allèles au total à ce locus précis. La fréquence de A peut être calculée en divisant le nombre d’allèles A par le nombre total d’allèles à ce locus : 248/400 = 0,62. De la même façon, la fréquence de a est égale à 152/400, ce qui donne 0,38. Ici encore, la somme des fréquences doit être égale à 1, soit 100 % des allèles de la population (Jorde et al., 2004).

1.4.3.2 Principe d’équilibre de Hardy-Weinberg (HWE). Selon la loi de Hardy-

Weinberg, les fréquences alléliques demeurent constantes d’une génération à une autre dans le patrimoine génétique d’une population idéale et ce, malgré les effets de recombinaison résultant de la méiose et de la fécondation. Ainsi, génération après génération, les fréquences des allèles et des génotypes resteraient les mêmes. Cet équilibre préservé dans le patrimoine génétique est appelé l’équilibre de Hardy-Weinberg (HWE pour l’expression anglaise Hardy-Weinberg Equilibrium). L’HWE décrit la génétique de populations théoriques. Toutefois, les populations réelles évoluent par différents mécanismes dont les mutations, la sélection et la migration qui peuvent causer des déviations dans l’HWE.

Dans les analyses avec marqueurs génétiques, le HWE peut être mesuré de deux façons différentes (Chi-Square Goodness-of-fit et le Permutation Version of Exact Test) qui permettent de tester l’hypothèse nulle qui stipule qu’il n’y a pas de déviation à l’HWE. Dans la pratique, ces tests sont recommandés afin de détecter les erreurs de génotypage qui pourraient augmenter les erreurs de type I ou de type II.

1.5 Interaction gène-environnement