• Aucun résultat trouvé

Variations normales et pathologiques du génome humain

1. La déficience intellectuelle

1.2. Génétique de la déficience intellectuelle

1.2.1. Variations normales et pathologiques du génome humain

Une des bases de la variabilité phénotypique normale et pathologique dans une espèce est la variabilité de séquence du génome, parmi les individus de cette espèce. Le génome humain est soumis à une dynamique mutationnelle dont il résulte un spectre complexe de variants de

59% 11% 7% 5% 5% 5% 3% 1% 1% 1% 1% 1% 0%

Titre du graphique

DI non classées anomalies chromosomiques de nombre CNV vus en ACPA syndromes microdélétionnels

mutations géniques marqueurs chromosomiques maladies mendéliennes syndromes connus

causes exogéniques anomalies subtélomériques anomalies chromosomiques équilibrées trisomies en mosaïques disomies uniparentales

séquence et de structure de l’ADN, qui vont des altérations nucléotidiques simples (mutations ponctuelles : substitutions nucléotidiques, petites insertions ou délétions) à des remaniements de grande taille concernant des segments de gènes voire de chromosomes et modifiant le nombre de copies des séquences soumises à remaniements, en passant par des expansions de répétitions en tandem. Les variations du génome humain sont, dans leur grande majorité, non pathogènes. L'objectif du diagnostic génétique est de distinguer ce qui est pathologique parmi ces variants et de le relier au phénotype des patients.

1.2.1.1 SNP

Les SNP (Single Nucleotide Polymorphisms) correspondent à des substitutions nucléotidiques d'une seule base. Jusqu'à présent, on a répertorié environ 53 millions de SNP, ce qui représente environ 90% des variations du génome humain (cf. base de données dbSNP 137). Sur le plan terminologique, on distinguait classiquement les SNP des SNV (Single Nucleotide

Variants) ; les SNV correspondaient à n'importe quelle substitution nucléotidique, alors que

les SNP se rapportaient uniquement aux variants non pathogènes. Actuellement, par abus de langage, et parce qu'il existe une incertitude quant à la signification clinique de beaucoup de ces variants, les deux expressions tendent à être employées indifféremment.

La méthode classique pour identifier les SNP est le séquençage de l'ADN. En moyenne, chaque individu a environ 3,2 millions de SNP dans son génome, c'est à dire de nucléotides différents de ceux de la séquence humaine de référence hg19 (Ball et al. 2012). Et parmi ces SNP, 8 000 sont des mutations non synonymes affectant des séquences codantes et donc modifiant la séquence protéique. Le taux de survenue de SNP à chaque génération est d'environ 12.10-9 (Lynch, 2010). En conséquence, chaque nouveau-né a dans son génome, en moyenne, 70 SNP survenus de novo. La très grande majorité de ces SNP n'est pas pathogène. Et la probabilité qu'un SNP ait une signification clinique est d'autant plus importante qu'il entraîne une modification protéique. Les critères utilisés pour évaluer la potentielle pathogénicité d'un SNP sont expliqués à la partie 3.5.3.3.

1.2.1.2. Variations de structure

Les variations de structure (SV pour Structural Variations) peuvent être divisées en 2 catégories : les remaniements équilibrés, sans perte ni gain de matériel chromosomique, et les remaniements déséquilibrés, avec perte ou gain de matériel chromosomique. Parmi les SV déséquilibrés, on distingue les CNV (pour Copy Number Variations) qui sont des SV de grande taille > 1 kb (Redon et al. 2006) ; et les indel, de petite taille < 1 kb (Mullaney et al. 2010).

CNV

Les CNV retrouvés dans la population générale représentent environ 12% du génome humain (Redon et al. 2006, Kidd et al. 2008). La technique classique pour détecter les CNV est le caryotype, mais sa résolution est limitée aux anomalies de taille supérieure à 5Mb, au mieux. Actuellement, c'est l'ACPA qui tend à remplacer le caryotype.

Le taux d'apparition des CNV est difficile à évaluer. Avec une résolution de 30 kb, un CNV de novo est retrouvé avec un taux de 1,2 / 100 génome à chaque génération. Même si la majorité des CNV n'est pas pathogène, ils représentent une cause majeure de maladie génétique, et en particulier de DI-S et DI-NS (cf. 1.2.2.2.). Les critères utilisés pour évaluer la pathogénicité des CNV sont expliqués à la partie 2.1.

indel

Chaque individu possède, en moyenne, 300 000 indel (dont 70% de délétions et 30% d'insertions), par comparaison au genome de référence hg19 (Ball et al. 2012), ce qui en fait la deuxième origine de variation du génome humain derrière les SNP. Le taux de survenue des indel est estimé à 0,6.10-9 pour les délétions et 0,2.10-9 pour les insertions.

Les petites indel, < 50 pb, sont généralement détectées par les méthodes de séquençage. L'identification des grandes indel est plus difficile et nécessite des techniques ciblées

(southern Blot, MLPA, etc.). Les critères utilisés pour évaluer la potentielle pathogénicité des indels sont comparables à ceux utilisés pour les SNP (cf. 3.5.3.3.).

1.2.1.3. Répétitions

On distingue 3 types de répétitions : les répétitions en tandem, les LCR (Low Copy Reapeats) et les éléments mobiles. L'étude des répétitions est généralement difficile, nécessitant la combinaison de plusieurs techniques (PCR long range, Southern Blot, TP-PCR, etc.).

Répétitions en tandem

On en distingue 3 différentes :

- les satellites qui sont des répétitions d'éléments > 60 pb, situés dans les centromères et l'hétérochromatine constitutive ;

- les minisatellites qui sont des répétitions d'éléments de 10 à 60 pb ; - les microsatellites qui sont des répétitions d'éléments de taille < 10 pb.

De nombreuses pathologies sont liées à un nombre anormal de répétitions de microsatellites ; par exemple l'X fragile, première cause monogénique de DI, est dû à un nombre de répétitions d'un triplet CGG > 200 dans la région 5'UTR du gène FMR1 ce qui entraîne une répression de son expression.

Les pathologies, liées aux autres types de répétitions en tandem que les microsatellites, sont beaucoup plus rares. On peut citer la dystrophie facio-scapulo-humérale, liée à un nombre de répétitions < 10 du satellite D4Z4 dans la région 4q35, entraînant une modification de conformation de la chromatine et une dérégulation de l'expression des gènes de cette région.

LCR

Les LCR, également appelés duplicons ou SD (Segmental Duplications) (Stankiewicz et al. 2002), sont des blocs d'ADN, de taille > 1 kb, situés en plusieurs localisations génomiques et présentant > 90% d'identité. Ces régions fortement homologues représentent environ 6% du génome humain et augmentent la fréquence des mésappariements à la fois en méiose et en mitose (cf. 1.2.2.2.1.).

Eléments mobiles

Les éléments mobiles, également appelés transposons, sont des séquences d'ADN d'origine virale, capables de se multiplier et de se déplacer de façon autonome. Les principaux sont les suivants :

- les séquences LINE, de 7 kb, représentent 17% du génome ; - les séquences Alu, de 280 pb, représentent 10% du génome.

La grande majorité de ces éléments mobiles n'a pas de signification clinique connue. Ils peuvent toutefois être responsables de réarrangements chromosomiques. Et on peut aussi citer le cas du gène FKTN, responsable de dystrophie musculaire congénitale avec anomalies cérébrales et oculaires, dont le variant délétère le plus fréquent correspond à l'insertion d'un élément mobile dans la région 3'UTR, entraînant une répression de l'expression du gène.